Compilação, reciclagem e padronização de um Corpus Colaborativo de Linguística
percursos metodológicos
DOI:
https://doi.org/10.17851/2237-2083.29.3.2041-2078Palavras-chave:
Linguística, Linguística de Corpus, Corpus colaborativo, Árvore de Domínio, TerminografiaResumo
O objetivo deste texto é relatar uma experiência de trabalho com um corpus colaborativo, desenvolvida nos últimos 10 anos (2010-2020) com alunos de diversas turmas de graduação, pós-graduação e alunos de Iniciação Científica na Universidade Federal de Uberlândia (já parcialmente descrita por Fromm, 2013, e Fromm e Yamamoto, 2013). O trabalho parte da metodologia de elaboração do corpus (incluindo seu histórico) como um passo para um tipo de pesquisa específica (terminográfica), passa por uma análise para indicar e solucionar problemas de compilação e termina na sua adequação e padronização para reuso. O resultado é um corpus robusto, bem balanceado, bilíngue (inglês/português) e que poderá ser usado em inúmeras outras pesquisas na área de Linguística.