Sobre a construção de um léxico da afetividade para o processamento computacional do português
Palavras-chave:
Léxico de polaridades, léxico de sentimento, linguística com corpus, análise de sentimento, prosódia semântica, linguística computacional, análise de opiniãoResumo
O objetivo principal deste artigo é descrever o processo de elaboração de um léxico de elementos afetivos da língua portuguesa e polaridades associadas, construído principalmente para auxiliar a tarefa de análise de sentimento. Busca-se, além disso, mostrar como a exploração da dimensão afetiva da linguagem encontra espaço na descrição da língua e pode, ainda, contribuir para o ensino português como segunda língua. Assim, o léxico foi criado com um duplo objetivo: fornecer subsídios linguísticos para uma aplicação do processamento de linguagem natural (PLN) e contribuir para a caracterização do vocabulário afetivo da língua portuguesa, sobretudo em contextos informais.Downloads
Referências
AFONSO, S. et al Floresta sintá(c)tica: um treebank para o portuguęs. In: ENCONTRO DA ASSOCIAÇĂO PORTUGUESA DE LINGUÍSTICA, 17., out. 2001, Lisboa. Actas Disponível em: <http://www.linguateca.pt/Diana/download/AfonsoetalAPL2001.pdf>. Acesso em: 27 jul. 2013. Năo paginado.
ARROJO, R. A desconstruçăo do logocentrismo e a origem do significado. In: ______ (Org.). O signo desconstruído Campinas: Pontes, 1992. p. 41-46.
ATKINS, B. T. S. The Oxford Guide to Practical Lexicography Oxford (UK): Oxford University Press, 2008.
BIBER, D. et al Longman Grammar of Spoken and Written English New York: Pearson Education, 1999.
Bick, E. The Parsing System "Palavras": Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Aarhus: Aarhus University Press, 2000.
BIDERMAN, M. T. Teoria lingüística (teoria lexical e lingüística computacional) 2. ed. Săo Paulo: Martins Fontes, 2001.
CORPOS de português: Projecto AC/DC. Disponível em: . Acesso em: 27 jul. 2013.
CORPUS ReLi. Disponível em: <http://www.linguateca.pt/Repositorio/ReLi>. Acesso em: 27 jul. 2013.
COSTA, L.; SANTOS, D.; ROCHA, P. Estudando o portuguęs tal como é usado: o serviço AC/DC. In: Brazilian Symposium in Information and Human Language Technology (STIL 2009), 7., 8-11 set. 2009, Săo Carlos. Anais Disponível em: <http://www.lbd.dcc.ufmg.br/colecoes/stil/2009/020.pdf>. Acesso em: 27 jul. 2013. Năo paginado.
EKMAN, P. Basic Emotions. In: DALGLEISH, T.; POWER, T. (Ed.). The Handbook of Cognition and Emotion Sussex: John Wiley & Sons, 1999. p. 45-60.
ELLIS, J. M. Language, Thought and Logic Evanston: Northwestern University Press, 1993.
ESULI, A.; SEBASTIANI, F. SentiWordNet: A Publicly Available Lexical Resource for Opinion Mining. In: INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION (LREC), 5., May 2006, Genoa. Proceedings Disponível em: <http://www.lrec-conf.org/proceedings/lrec2006/pdf/384_pdf.pdf>. Acesso em: 27 jul. 2013. p. 417-422.
EXTRAORDINÁRIO. In: Dicionário Priberam da Língua Portuguesa Disponível em: <http://www.priberam.pt/dlpo/default.aspx?pal=extraordin% C3%A1rio>. Acesso em: 27 jul. 2013.
FELLBAUM, C. WordNet: An Electronic Lexical Database. Cambridge (MA): MIT Press, 1998.
FREITAS, C. et al Sparkle Vampire LoL! Annotating opinions in a book review corpus. In: ALUÍSIO, S.; TAGNIN, S. (Org.). 11th Corpus Linguistics Conference Cambridge (UK): Cambridge Scholars Publishing, 2013. No prelo.
FREITAS, C. et al Vampiro que brilha rá! Desafios na anotaçăo de opiniăo em um corpus de resenhas de livros. In: ENCONTRO DE LINGUÍSTICA DE CORPUS, 11., 2012, Săo Carlos. Anais Disponível em: . Acesso em: 27 jul. 2013. Năo paginado.
FREITAS, C.; SANTOS, D. Blogs, Amazônia e a Floresta Sintá(c)tica: um corpus de um novo gęnero? In: SARMENTO, S. et al (Org.). Pesquisas e perspectivas em linguística de corpus Campinas: Mercado de Letras, 2013.
GRIGOLETTO, M. A desconstruçăo do signo e a ilusăo da trama. In: ARROJO, R. (Org.). O signo desconstruído Campinas: Pontes, 1992. p. 31-34.
GUTHRIE, L. et al The Role of Lexicons in Natural Language Processing. Communications of the ACM, v. 39, n. 1, p. 63-72, Jan. 1996.
HOUAISS, A. Dicionário eletrônico Houaiss da língua portuguesa Versăo 3.0. Rio de Janeiro: Objetiva, 2009. 1 CD-ROM.
HUNSTON, S. Semantic Prosody Revisited. International Journal of Corpus Linguistics, v. 12, n. 2, p. 249-268, 2007. Disponível em: <http://www.researchgate.net/publication/228929277_Semantic_prosody_revisited>. Acesso em: 27 jul. 2013.
ILARI, R.; GERALDI, J. W. Semântica Săo Paulo: Ática, 1985.
INCRÍVEL. In: Dicionário Priberam da Língua Portuguesa Disponível em: <http://www.priberam.pt/dlpo/default.aspx?pal=incr%C3%ADvel>. Acesso em: 27 jul. 2013.
LONGHI, M. T. Mapeamento de aspectos afetivos em um ambiente virtual de aprendizagem 2011. 273 f. Tese (Doutorado em Informática na Educaçăo) Centro de Estudos Interdisciplinares em Novas Tecnologias na Educaçăo, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2011. Disponível em: <http://pct.capes.gov.br/teses/2011/42001013075P9/TES.PDF>. Acesso em: 27 jul. 2013.
MAIA, B.; SANTOS, D. "Who's afraid of what?" in English and Portuguese. Varieng Studies in Variation, Contacts and Change in English, v. 12, 2012. Disponível em: <http://www.helsinki.fi/varieng/journal/volumes/12/maia_santos>. Acesso em: 27 jul. 2013. Năo paginado.
MARTINS, H. Metáfora e polissemia no estudo das línguas do mundo: uma aproximaçăo năo representacionista. 1999. 190 f. Tese (Doutorado em Linguística e Filologia) Faculdade de Letras, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 1999.
MARTINS, H. Tręs caminhos na filosofia da linguagem. In: MUSSALIM, F.; BENTES, A. C. (Org.). Introduçăo ŕ Lingüística Săo Paulo: Cortez, 2004. v. 3, p. 439-474.
MOHAMMAD, S., DUNNE, C., DORR, B. Generating High-Coverage Semantic Orientation Lexicons From Overtly MarkedWords and a Thesaurus. 2009 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING, 6-7 ago. 2009, Singapura. Proceedings Disponível em: <http://www.cs.umd.edu/~cdunne/hcil/pubs/Mohammad09 Generatinghigh-coveragesemantic.pdf>. Acesso em: 27 jul. 2013. p. 599-608.
MÓIA, T. Sobre classes semânticas de adjectivos. Cadernos de Semântica, Lisboa, v. 7, p. 1-34, 1992.
NIETZSCHE, F. W. Sobre verdade e mentira no sentido extra-moral. In: Obras incompletas/Friedrich Nietzsche Seleçăo de textos de Gérard Lebrun; traduçăo e notas de Rubens Rodrigues Torres Filho. 4. ed. Săo Paulo: Nova Cultura, 1911 [1987]. (Os Pensadores).
OCHS, E.; SCHIEFFELIN, B. Language has a heart. Text Interdisciplinary Journal for the Study of Discourse, v. 9, n. 1, p. 7-26, 1989.
PANG, B.; LEE, L. Opinion Mining and Sentiment Analysis. Foundations and Trends in Information Retrieval, v. 2, n. 1-2, p. 1-135, 2008.
RIO-TORTO, G. Para uma gramática do adjectivo. Alfa, Săo Paulo, v. 50, n. 2, p. 103-129, 2006.
SAMPSON, G. Empirical Linguistics London: Continuum, 2001.
SANTOS, D. et al Relaçőes semânticas em portuguęs: comparando o TeP, o MWN.PT, o Port4NooJ e o PAPEL. In: BRITO, A. M. et al (Ed.). XXV Encontro Nacional da Associaçăo Portuguesa de Linguística: Textos seleccionados. Associaçăo Portuguesa de Linguística: Lisboa, 2010. p. 681-700. Disponível em: <http://www.apl.org.pt/apl-actas/xv-encontro-nacional-da-apl.html>. Acesso em: 27 jul. 2013.
SILVA, M.; CARVALHO, C.; SARMENTO, L. Building a Sentiment Lexicon for Social Judgement Mining. In: Computational Processing of the Portuguese Language 10th International Conference, PROPOR 2012, Coimbra, Portugal, April 17-20, 2012. Berlin: Springer Berlin Heidelberg, 2012. p. 218-228. (Lecture Notes in Computer Science, 7243).
TABOADA, M. et al Lexicon-Based Methods for Sentiment Analysis. Computational Linguistics, v. 37, n. 2, p. 267-307, Jun. 2011. Disponível em: <http://cgi.sfu.ca/~mtaboada/docs/Taboada_etal_SO-CAL.pdf>. Acesso em: 27 jul. 2013.
TAYLOR, T. Mutual Misunderstanding: Scepticism and the Theorizing of Language and Interpretation (Post-Contemporary Interventions). Durham; London: Duke University Press, 1992.
WILSON, T.; WIEBE, J.; HOFFMANN, P. Recognizing Contextual Polarity in Phrase-Level Sentiment Analysis. In: 2005 HUMAN LANGUAGE TECHNOLOGY CONFERENCE AND THE CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING, 2005, Vancouver. Proceedings Disponível em: <http://www.cs.utexas.edu/~ml/HLT-EMNLP05>. Acesso em: 27 jul. 2013. p. 347-354.
WITTGENSTEIN, L. Investigaçőes filosóficas Săo Paulo: Abril Cultural, 1979. (Os Pensadores).
Downloads
Publicado
Edição
Seção
Licença
Copyright (c) 2013 Revista Brasileira de Linguística Aplicada

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Autores de artigos publicados pela RBLA mantêm os direitos autorais de seus trabalhos, licenciando-os sob a licença Creative Commons BY Attribution 4.0, que permite que os artigos sejam reutilizados e distribuídos sem restrição, desde que o trabalho original seja corretamente citado.


