Uso de sintagmas nominais na classificação automática de documentos eletrônicos

Autores/as

  • Luiz Cláudio Gomes Maia
  • Renato Rocha Souza

Resumen

Esta pesquisa verificou se ocorre aprimoramento na classificação de documentos eletrônicos com o uso de técnicas e algoritmos de mineração de texto (análise de texto) utilizando além das palavras, sintagmas nominais como indexadores. Utilizaram-se duas ferramentas nos experimentos propostos desta pesquisa o OGMA e a WEKA. O OGMA foi desenvolvido pelo autor para automatizar a extração dos sintagmas nominas e o cálculo do peso de cada termo na indexação dos documentos para cada um dos seis métodos propostos. A WEKA foi utilizada analisar os resultados encontrados pelo OGMA utilizando aos algoritmos de agrupamento e classificação, simplekmeans e NaiveBayes, respectivamente, obtendo um valor percentual indicando quantos documentos foram classificados corretamente. Os métodos com melhores resultados foram o de termos sem stopwords e o de sintagmas nominais classificados e pontuados como descritores.

Descargas

Los datos de descargas todavía no están disponibles.

Publicado

2010-03-24

Cómo citar

Maia, L. C. G., & Souza, R. R. (2010). Uso de sintagmas nominais na classificação automática de documentos eletrônicos. Perspectivas Em Ciência Da Informação, 15(1), 154–172. Recuperado a partir de https://periodicos.ufmg.br/index.php/pci/article/view/22418

Número

Sección

Artículos