Uma gramática computacional de um fragmento do nheengatu

Autores

  • Leonel Figueiredo de Alencar Universidade Federal do Ceará

DOI:

https://doi.org/10.17851/2237-2083.29.3.1717-1777

Palavras-chave:

língua geral amazônica (LGA), tupi moderno, predicação qualificativa, construção possessiva, tradução automática, linguística computacional, processamento de linguagem natural

Resumo

A disponibilidade de recursos para o processamento computacional constitui um dos fatores de sobrevivência de uma língua. O objetivo deste trabalho foi implementar um fragmento do nheengatu no formalismo Grammatical Framework, especialmente projetado para o desenvolvimento de aplicações multilíngues. Outrora mais falado que o português na Amazônia, o nheengatu está ameaçado de extinção, embora ainda conte com estimados 14000 falantes. O fragmento restringe-se a orações que expressam estados contingentes e não-contingentes, mas inclui fenômenos gramaticais estruturalmente complexos típicos da família tupi-guarani, os quais contrastam fortemente com as construções equivalentes em português e inglês. Constitui um dos módulos da GrammYEP, uma gramática computacional multilíngue que integra módulos análogos do inglês e do português. A implementação tomou como ponto de partida as descrições gramaticais não formalizadas de Navarro (2011) e Cruz (2011). A formalização revelou lacunas e inconsistências nessas abordagens, em parte sanados por meio de uma reanálise dos dados. A GrammYEP alcançou resultados bastantes satisfatórios na tradução do e para o nheengatu. Traduziu para o português e o inglês a totalidade de um conjunto-teste de 142 sentenças dessa língua. Inversamente, verteu para o nheengatu 98,18% e 84,11% dos conjuntos-teste correspondentes em português e inglês. Por outro lado, analisou apenas dois exemplos de um conjunto-teste negativo com 171 construções agramaticais em nheengatu. Desta avaliação resultou um treebank com 243 sentenças do nheengatu, emparelhadas com as sentenças equivalentes em português e inglês.

Publicado

2024-10-06

Edição

Seção

Número Atemático 29:3

Como Citar

Uma gramática computacional de um fragmento do nheengatu. Revista de Estudos da Linguagem, [S. l.], v. 29, n. 3, p. 1717–1777, 2024. DOI: 10.17851/2237-2083.29.3.1717-1777. Disponível em: https://periodicos.ufmg.br/index.php/relin/article/view/54441. Acesso em: 24 dez. 2025.