Modelagem de tópicos: Resumir e organizar corpus de dados por meio de algoritmos de aprendizagem de máquina

Marcos de Souza; Renato Rocha Souza

Modelagem de tópicos

Resumir e organizar corpus de dados por meio de algoritmos de aprendizagem de máquina

Autores/as

Marcos de Souza Universidade Federal de Minas Gerais
Renato Rocha Souza Universidade Federal de Minas Gerais

Palabras clave:

Modelagem de tópicos, Aprendizagem de máquina, Alocação de Dirichlet Latente, Indexação semântica latente

Resumen

A pesquisa compara os resultados e desempenho dos modelos Latent Semantic Indexing (LSI) e Latent Dirichlet Allocation (LDA) de Machine Learning quando aplicado Modelagem de Tópicos em documentos dos canais formais da comunicação científica, constituído por 2006 artigos científicos e resumos expandidos do XIII ao XVII Encontro Nacional de Pesquisa em Ciência da Informação (ENANCIB). Constituem as etapas da pesquisa empírica a coleta dos dados para constituição, limpeza, manipulação, combinação, normalização, tratamento e transformação dos dados do corpus para conectar aos modelos de aprendizagem de máquina. Os modelos resumiram e organizaram o corpus de dados em tópicos que são constituídos por termos e pesos. O modelo LSI apresentou uma maior variedade entre os termos e pesos contidos em cada tópico, diferente do modelo LDA que apresentou uma maior similaridade nos resultados, facilitando, assim, para o especialista de domínio, criar a suposição para os nomes dos tópicos.

Descargas

Los datos de descargas todavía no están disponibles.

Descargas

PDF (Português (Brasil))

Publicado

2020-01-31

Cómo citar

SOUZA , M. de; SOUZA , R. R. Modelagem de tópicos: Resumir e organizar corpus de dados por meio de algoritmos de aprendizagem de máquina. Múltiplos Olhares em Ciência da Informação - ISSN 2237-6658, Belo Horizonte, v. 9, n. 2, 2020. Disponível em: https://periodicos.ufmg.br/index.php/moci/article/view/19138. Acesso em: 21 nov. 2024.

Descargar cita

Número

Vol. 9 Núm. 2 (2019): PPGGOG - Discentes

Sección

Artigos

Licencia

Autores que publicam na Revista Múltiplos Olhares em Ciência da Informação mantêm os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista. Contratos adicionais poderão ser assumidos, separadamente, pelos autores, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (exemplo: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.

Modelagem de tópicos

Resumir e organizar corpus de dados por meio de algoritmos de aprendizagem de máquina

Autores/as

Palabras clave:

Resumen

Descargas

Descargas

Publicado

Cómo citar

Número

Sección

Licencia

Artículos más leídos del mismo autor/a

Idioma

Enviar un artículo

Información

Desarrollado por

indexadores

CONTATO

Palabras clave

Modelagem de tópicos

Resumir e organizar corpus de dados por meio de algoritmos de aprendizagem de máquina

Autores/as

Palabras clave:

Resumen

Descargas

Descargas

Publicado

Cómo citar

Número

Sección

Licencia

Artículos más leídos del mismo autor/a

Idioma

Enviar un artículo

Información

Desarrollado por

indexadores

REDE SOCIAL

CONTATO

Palabras clave