O fluxo temporal de termos relevantes
uma análise em teses da UFMG de 2007 a 2018 nas ciências humanas
DOI:
https://doi.org/10.35699/2237-6658.2021.37241Palabras clave:
Indexação Automática, Sintagmas Nominais, Recuperação da Informação TemporalResumen
O objetivo geral desta pesquisa foi analisar se há uma variação temporal característica da distribuição de valores de termos relevantes ao longo do tempo da produção de textos que possa contribuir como um critério para o processo de sua indexação automática. Foram analisadas as teses de doutorado dos programas de pós-graduação (PPGs) da área de Ciências Humanas da UFMG, considerando-se 7 PPGs distintos, sendo cada um deles um corpus, com um total de 929 teses defendidas período de 12 anos, de 2007 a 2018. Os termos considerados foram todos os sintagmas nominais contidos nos próprios textos das teses. Cada sintagma nominal recebeu um valor associado à sua relevância como descritor de acordo com os critérios de frequência do termo na própria tese (TF - Term Frequency) e com o inverso da frequência de ocorrência do termo no total de teses de cada PPG (IDF - Inverse Document Frequency). As teses foram divididas em 12 grupos em cada PPG para o cálculo da data média de defesa das teses e da média de pontuação consolidada dos termos relevantes nas teses. Como resultados, identificou-se o comportamento característico de cada PPG através de um gráfico de dispersão do nível médio de pontuação de relevância ao longo do tempo. Para cada gráfico de cada um dos 7 PPGs foi adicionada uma linha de tendência, considerando seu respectivo R², e feita sua análise específica. Todos os comportamentos de distribuição temporais foram caracterizados em equações e podem ser aplicados como critério para indexação automática.
Descargas
Citas
BAEZA-YATES, Ricardo; RIBEIRO-NETO, Berthier. Modern Information Retrieval: The concepts and technology behind search. 2nd ed. Harlow: Pearson Education Limited, 2011.
BORGES, Graciane Bruzinga; LIMA, Gercina Ângela. DESENVOLVIMENTO DE SOFTWARES DE INDEXAÇÃO AUTOMÁTICA: BREVE AVALIAÇÃO DOS PRINCIPAIS CRITÉRIOS. 2015. XVI Encontro Nacional de Pesquisa em Pós-Graduação em Ciência da Informação [...]. [S. l.: s. n.], 2015.
BORKO, Harold. Indexing concepts and methods. New York (etc.)London: New York etc.London : Academic Press, 1978, 1978.
BORKO, Harold. Toward a theory of indexing. Information Processing and Management, vol. 13, no. 6, p. 355–365, 1977. https://doi.org/10.1016/0306-4573(77)90055-3.
BUSH, Vannevar. As we may think. The atlantic monthly, vol. 176, no. 1, p. 101–108, 1945. .
CINTRA, Anna Maria Marques. Elementos de lingüística para estudos de indexação. Ciência da informação, vol. 12, no. 1, 1983.
CORRÊA, Renato Fernandes; DE MIRANDA, Darliane Goes; DE ALMEIDA LIMA, Camila Oliveira; DA SILVA, Tiago José. Indexação e recuperação de teses e dissertações por meio de sintagmas nominais. AtoZ: novas práticas em informação e conhecimento, vol. 1, no. 1, p. 11–22, 2011.
DUCHON, Andrew P; MCCORMACK, Robert; SALTER, William J; ALLOPENNA, Paul David; WEIL, Shawn; COLONNA-ROMANO, John; KRAMER, David. Method and system to predict the likelihood of topics. [S. l.]: Google Patents, 20 Oct. 2015.
KURAMOTO, Hélio. Proposition d’un système de recherche d’information assistée par ordinateur: avec application à la langue portugaise. 1999.
KURAMOTO, Hélio. Uma abordagem alternativa para o tratamento e a recuperação de informação textual: os sintagmas nominais. Ciência da Informação, vol. 25, no. 2, p. 182–192, 1996. Available at: http://ridi.ibict.br/handle/123456789/221.
LANCASTER, F W. Indexação e resumos: teoria e prática. Tradução de Antônio Agenor Briquet de Lemos. rev. atual. 2004.
LUHN, Hans Peter. A statistical approach to mechanized encoding and searching of literary information. IBM Journal of research and development, vol. 1, no. 4, p. 309–317, 1957.
LYONS, John. Linguagem e linguística: uma introdução. Rio de Janeiro: LTC - Livros Técnicos e Científicos, 1987.
MAIA, Luiz Claudio Gomes. Uso de sintagmas nominais na classificação automática de documentos eletrônicos. 2008. 158 f. Universidade Federal de Minas Gerais, 2008. Available at: http://hdl.handle.net/1843/ECID-7NXJKZ.
MATHEWS, Litty K; KANMANI, S Deepa. A survey on temporal information retrieval systems. International Journal of Computer Applications, vol. 58, no. 4, 2012.
MESQUITA, Luiz Antônio Lopes; SOUZA, Renato Rocha; PORTO, Renata Maria Abrantes Baracho. Caracterização de testes de oito áreas de conhecimento: uma análise para o desempenho de indexação automática através de sintagmas nominais. 2013. XIV ENANCIB [...]. Florianópolis: [s. n.], 2013. p. 20. Available at: http://repositorios.questoesemrede.uff.br/repositorios/handle/123456789/2295.
MESQUITA, Luiz Antônio Lopes; SOUZA, Renato Rocha Souza; PORTO, Renata Maria Abrantes Baracho. Noun Phrases in Automatic Indexing: a Structural Analysis of the Distribution of Relevant Terms in Doctoral Theses. 2014. 13th International ISKO Conference - Knowledge Organization in te 21s Century: Between Historical Patterns and Future Prospects. [...]. Cracow: [s. n.], 2014. p. 327–334.
MOOERS, Calvin N. Zatocoding applied to mechanical organization of knowledge. American documentation, vol. 2, no. 1, p. 20–32, 1951. https://doi.org/10.1002/ASI.5090020107.
MOULAHI, Bilel; TAMINE, Lynda; YAHIA, Sadok Ben. When time meets information retrieval: Past proposals, current plans and future trends. Journal of Information Science, vol. 42, no. 6, p. 725–747, 2016.
NAVES, MADALENA M LOPES; DIAS, E W. Análise de assunto: teoria e prática. [S. l.]: Thesaurus Editora, 2007. vol. 3.
ORTEGA, Cristina Dotta. Relações históricas entre biblioteconomia, documentação e ciência da informação. DataGramaZero, Rio de Janeiro, vol. 5, no. 5, p. A03-1001, 2009.
PERINI, Mário A; FRAIHA, Sigrid; FULGÊNCIO, Lúcia; NETO, Regina Bessa. O SN em português: A hipótese mórfica. Belo Horizonte: Revista de Estudos de Linguagem-UFMG, vol. JUlho/Deze, p. 43–56, 1996.
SARACEVIC, Tefko. Ciência da informação: origem, evolução e relações. Perspectivas em ciência da informação, vol. 1, no. 1, p. 41–62, 1996.
SOUZA, Renato Rocha. Uma proposta de metodologia para escolha automática de descritores utilizando sintagmas nominais. 2005. 215 f. UFMG, 2005.
SPARCK JONES, Karen. A STATISTICAL INTERPRETATION OF TERM SPECIFICITY AND ITS APPLICATION IN RETRIEVAL. Journal of Documentation, vol. 28, no. 1, p. 11–21, 1972. https://doi.org/10.1108/eb026526.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2021 Múltiplos Olhares em Ciência da Informação - ISSN 2237-6658
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Autores que publicam na Revista Múltiplos Olhares em Ciência da Informação mantêm os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista. Contratos adicionais poderão ser assumidos, separadamente, pelos autores, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (exemplo: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.