A sentiment lexicon for portuguese natural language processing
Keywords:
Corpus linguistics, polarity lexicon, sentiment lexicon, sentiment analysis, emotional words, semantic prosody, computational linguistics, opinion miningAbstract
The main goal of this paper is to describe the creation of a sentiment lexicon designed to collaborate in sentiment analysis tasks. We also show how the analysis of the affective language finds room in language description and that it can contribute to foreign language teaching as well . Thus, the lexicon was created with a dual purpose: provide a resource for natural language processing tasks and collaborate to the characterization of Portuguese language affective vocabulary, especially in informal contexts.
Downloads
References
AFONSO, S. et al Floresta sintá(c)tica: um treebank para o portuguęs. In: ENCONTRO DA ASSOCIAÇĂO PORTUGUESA DE LINGUÍSTICA, 17., out. 2001, Lisboa. Actas Disponível em: <http://www.linguateca.pt/Diana/download/AfonsoetalAPL2001.pdf>. Acesso em: 27 jul. 2013. Năo paginado.
ARROJO, R. A desconstruçăo do logocentrismo e a origem do significado. In: ______ (Org.). O signo desconstruído Campinas: Pontes, 1992. p. 41-46.
ATKINS, B. T. S. The Oxford Guide to Practical Lexicography Oxford (UK): Oxford University Press, 2008.
BIBER, D. et al Longman Grammar of Spoken and Written English New York: Pearson Education, 1999.
Bick, E. The Parsing System "Palavras": Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Aarhus: Aarhus University Press, 2000.
BIDERMAN, M. T. Teoria lingüística (teoria lexical e lingüística computacional) 2. ed. Săo Paulo: Martins Fontes, 2001.
CORPOS de português: Projecto AC/DC. Disponível em: . Acesso em: 27 jul. 2013.
CORPUS ReLi. Disponível em: <http://www.linguateca.pt/Repositorio/ReLi>. Acesso em: 27 jul. 2013.
COSTA, L.; SANTOS, D.; ROCHA, P. Estudando o portuguęs tal como é usado: o serviço AC/DC. In: Brazilian Symposium in Information and Human Language Technology (STIL 2009), 7., 8-11 set. 2009, Săo Carlos. Anais Disponível em: <http://www.lbd.dcc.ufmg.br/colecoes/stil/2009/020.pdf>. Acesso em: 27 jul. 2013. Năo paginado.
EKMAN, P. Basic Emotions. In: DALGLEISH, T.; POWER, T. (Ed.). The Handbook of Cognition and Emotion Sussex: John Wiley & Sons, 1999. p. 45-60.
ELLIS, J. M. Language, Thought and Logic Evanston: Northwestern University Press, 1993.
ESULI, A.; SEBASTIANI, F. SentiWordNet: A Publicly Available Lexical Resource for Opinion Mining. In: INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION (LREC), 5., May 2006, Genoa. Proceedings Disponível em: <http://www.lrec-conf.org/proceedings/lrec2006/pdf/384_pdf.pdf>. Acesso em: 27 jul. 2013. p. 417-422.
EXTRAORDINÁRIO. In: Dicionário Priberam da Língua Portuguesa Disponível em: <http://www.priberam.pt/dlpo/default.aspx?pal=extraordin% C3%A1rio>. Acesso em: 27 jul. 2013.
FELLBAUM, C. WordNet: An Electronic Lexical Database. Cambridge (MA): MIT Press, 1998.
FREITAS, C. et al Sparkle Vampire LoL! Annotating opinions in a book review corpus. In: ALUÍSIO, S.; TAGNIN, S. (Org.). 11th Corpus Linguistics Conference Cambridge (UK): Cambridge Scholars Publishing, 2013. No prelo.
FREITAS, C. et al Vampiro que brilha rá! Desafios na anotaçăo de opiniăo em um corpus de resenhas de livros. In: ENCONTRO DE LINGUÍSTICA DE CORPUS, 11., 2012, Săo Carlos. Anais Disponível em: . Acesso em: 27 jul. 2013. Năo paginado.
FREITAS, C.; SANTOS, D. Blogs, Amazônia e a Floresta Sintá(c)tica: um corpus de um novo gęnero? In: SARMENTO, S. et al (Org.). Pesquisas e perspectivas em linguística de corpus Campinas: Mercado de Letras, 2013.
GRIGOLETTO, M. A desconstruçăo do signo e a ilusăo da trama. In: ARROJO, R. (Org.). O signo desconstruído Campinas: Pontes, 1992. p. 31-34.
GUTHRIE, L. et al The Role of Lexicons in Natural Language Processing. Communications of the ACM, v. 39, n. 1, p. 63-72, Jan. 1996.
HOUAISS, A. Dicionário eletrônico Houaiss da língua portuguesa Versăo 3.0. Rio de Janeiro: Objetiva, 2009. 1 CD-ROM.
HUNSTON, S. Semantic Prosody Revisited. International Journal of Corpus Linguistics, v. 12, n. 2, p. 249-268, 2007. Disponível em: <http://www.researchgate.net/publication/228929277_Semantic_prosody_revisited>. Acesso em: 27 jul. 2013.
ILARI, R.; GERALDI, J. W. Semântica Săo Paulo: Ática, 1985.
INCRÍVEL. In: Dicionário Priberam da Língua Portuguesa Disponível em: <http://www.priberam.pt/dlpo/default.aspx?pal=incr%C3%ADvel>. Acesso em: 27 jul. 2013.
LONGHI, M. T. Mapeamento de aspectos afetivos em um ambiente virtual de aprendizagem 2011. 273 f. Tese (Doutorado em Informática na Educaçăo) Centro de Estudos Interdisciplinares em Novas Tecnologias na Educaçăo, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2011. Disponível em: <http://pct.capes.gov.br/teses/2011/42001013075P9/TES.PDF>. Acesso em: 27 jul. 2013.
MAIA, B.; SANTOS, D. "Who's afraid of what?" in English and Portuguese. Varieng Studies in Variation, Contacts and Change in English, v. 12, 2012. Disponível em: <http://www.helsinki.fi/varieng/journal/volumes/12/maia_santos>. Acesso em: 27 jul. 2013. Năo paginado.
MARTINS, H. Metáfora e polissemia no estudo das línguas do mundo: uma aproximaçăo năo representacionista. 1999. 190 f. Tese (Doutorado em Linguística e Filologia) Faculdade de Letras, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 1999.
MARTINS, H. Tręs caminhos na filosofia da linguagem. In: MUSSALIM, F.; BENTES, A. C. (Org.). Introduçăo ŕ Lingüística Săo Paulo: Cortez, 2004. v. 3, p. 439-474.
MOHAMMAD, S., DUNNE, C., DORR, B. Generating High-Coverage Semantic Orientation Lexicons From Overtly MarkedWords and a Thesaurus. 2009 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING, 6-7 ago. 2009, Singapura. Proceedings Disponível em: <http://www.cs.umd.edu/~cdunne/hcil/pubs/Mohammad09 Generatinghigh-coveragesemantic.pdf>. Acesso em: 27 jul. 2013. p. 599-608.
MÓIA, T. Sobre classes semânticas de adjectivos. Cadernos de Semântica, Lisboa, v. 7, p. 1-34, 1992.
NIETZSCHE, F. W. Sobre verdade e mentira no sentido extra-moral. In: Obras incompletas/Friedrich Nietzsche Seleçăo de textos de Gérard Lebrun; traduçăo e notas de Rubens Rodrigues Torres Filho. 4. ed. Săo Paulo: Nova Cultura, 1911 [1987]. (Os Pensadores).
OCHS, E.; SCHIEFFELIN, B. Language has a heart. Text Interdisciplinary Journal for the Study of Discourse, v. 9, n. 1, p. 7-26, 1989.
PANG, B.; LEE, L. Opinion Mining and Sentiment Analysis. Foundations and Trends in Information Retrieval, v. 2, n. 1-2, p. 1-135, 2008.
RIO-TORTO, G. Para uma gramática do adjectivo. Alfa, Săo Paulo, v. 50, n. 2, p. 103-129, 2006.
SAMPSON, G. Empirical Linguistics London: Continuum, 2001.
SANTOS, D. et al Relaçőes semânticas em portuguęs: comparando o TeP, o MWN.PT, o Port4NooJ e o PAPEL. In: BRITO, A. M. et al (Ed.). XXV Encontro Nacional da Associaçăo Portuguesa de Linguística: Textos seleccionados. Associaçăo Portuguesa de Linguística: Lisboa, 2010. p. 681-700. Disponível em: <http://www.apl.org.pt/apl-actas/xv-encontro-nacional-da-apl.html>. Acesso em: 27 jul. 2013.
SILVA, M.; CARVALHO, C.; SARMENTO, L. Building a Sentiment Lexicon for Social Judgement Mining. In: Computational Processing of the Portuguese Language 10th International Conference, PROPOR 2012, Coimbra, Portugal, April 17-20, 2012. Berlin: Springer Berlin Heidelberg, 2012. p. 218-228. (Lecture Notes in Computer Science, 7243).
TABOADA, M. et al Lexicon-Based Methods for Sentiment Analysis. Computational Linguistics, v. 37, n. 2, p. 267-307, Jun. 2011. Disponível em: <http://cgi.sfu.ca/~mtaboada/docs/Taboada_etal_SO-CAL.pdf>. Acesso em: 27 jul. 2013.
TAYLOR, T. Mutual Misunderstanding: Scepticism and the Theorizing of Language and Interpretation (Post-Contemporary Interventions). Durham; London: Duke University Press, 1992.
WILSON, T.; WIEBE, J.; HOFFMANN, P. Recognizing Contextual Polarity in Phrase-Level Sentiment Analysis. In: 2005 HUMAN LANGUAGE TECHNOLOGY CONFERENCE AND THE CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING, 2005, Vancouver. Proceedings Disponível em: <http://www.cs.utexas.edu/~ml/HLT-EMNLP05>. Acesso em: 27 jul. 2013. p. 347-354.
WITTGENSTEIN, L. Investigaçőes filosóficas Săo Paulo: Abril Cultural, 1979. (Os Pensadores).
Downloads
Published
Issue
Section
License
Copyright (c) 2013 Revista Brasileira de Linguística Aplicada

This work is licensed under a Creative Commons Attribution 4.0 International License.
Autores de artigos publicados pela RBLA mantêm os direitos autorais de seus trabalhos, licenciando-os sob a licença Creative Commons BY Attribution 4.0, que permite que os artigos sejam reutilizados e distribuídos sem restrição, desde que o trabalho original seja corretamente citado.


