Procedimentos para construção do Corpus da Computação da Língua Inglesa (CoCLI) e cálculo do esforço na construção manual de corpora

Autores

  • Fernando Paulino de Oliveira Universidade Federal de Uberlândia

Palavras-chave:

Linguística de Corpus, construção manual de corpus, étricas de medição de esforço, ToGatherUp

Resumo

O presente trabalho tem como objetivo descrever os procedimentos metodológicos da pesquisa intitulada “ToGatherUp: um protótipo de ferramenta para a construção de corpora” que verificou o efeito da incorporação da ferramenta ToGatherUp no tempo e no esforço necessários para a construção manual de um corpus que elaboramos: o Corpus da Computação da Língua Inglesa (CoCLI). Para tanto, discorremos sobre como os autores da pesquisa desenvolveram um conjunto de métricas de medição de esforço – Esforço da Atividade (EA), Esforço Total de Coleta do Texto (ETCT) e Esforço Total do Projeto (ETP) – que serviram de base para a realização de um experimento estatístico comparativo entre os projetos de elaboração manual de duas versões idênticas do CoCLI que se diferenciam por em um deles utilizar o ToGatherUp e o outro não. O resultado do experimento demonstrou uma redução média de 7,47% no ETP do projeto em que o ToGatherUp foi incorporado em relação ao ETP do projeto em que a ferramenta não foi utilizada, o que corroborou a hipótese de que ela reduz o tempo e o esforço despendidos pelo pesquisador em projetos de elaboração manual de corpora.

Downloads

Não há dados estatísticos.

Publicado

2024-10-06

Edição

Seção

Thematic issue 29:2 (2021): Corpus Linguistics: Achievements and Challenges