Sujeito oculto às claras

uma abordagem descritivo-computacional

Autores

  • Cláudia Freitas Pontifícia Universidade Católica do Rio de Janeiro
  • Elvis de Souza Pontifícia Universidade Católica do Rio de Janeiro

DOI:

https://doi.org/10.17851/2237-2083.29.2.1033-1058

Palavras-chave:

descrição linguística, sujeito oculto, omissão de sujeito, dependências sintáticas, linguística computacional, aprendizado de máquina, linguística de corpus

Resumo

Neste trabalho, apresentamos estudos descritivos e computacionais relacionados ao sujeito oculto. Em um primeiro momento, realizamos uma descrição de cunho quantitativo, tomando por base três corpora dos gêneros jornalístico, literário e enciclopédico. Especificamente, quantificamos o sujeito oculto em cada um dos corpora, e encontramos sujeitos omitidos em 24%, 41% e 46% das orações, respectivamente. Em um segundo momento, por meio de uma estratégia baseada em regras, reconstituímos esses sujeitos e os devolvemos aos corpora, com o objetivo de avaliar o quanto a omissão do sujeito é capaz de impactar o aprendizado automático de dependências sintáticas. Os resultados indicam que a reconstituição formal do sujeito pode melhorar a aprendizagem das dependências sintáticas em até 2% quando consideramos a métrica CLAS, evidenciando o papel relevante da modelagem linguística no aprendizado automático.

Downloads

Não há dados estatísticos.

Publicado

2024-10-06

Como Citar

FREITAS, C.; DE SOUZA, E. Sujeito oculto às claras: uma abordagem descritivo-computacional. Revista de Estudos da Linguagem, [S. l.], v. 29, n. 2, p. 1033–1058, 2024. DOI: 10.17851/2237-2083.29.2.1033-1058. Disponível em: https://periodicos.ufmg.br/index.php/relin/article/view/54371. Acesso em: 21 nov. 2024.

Edição

Seção

Thematic issue 29:2 (2021): Corpus Linguistics: Achievements and Challenges