Diving Deeper into the Waters of “se” as a Clitic in Brazilian Portuguese
Palavras-chave:
clitic pronouns, Portuguese language, syntactic analysis, corpus annotation, impersonalization, pronominal verbs, inchoative alternationResumo
This article reports on a corpus-based study of the pronoun “se” in Brazilian Portuguese aimed at developing a proposal for annotating the different uses of the pronoun in corpora to be leveraged in Natural Language Processing (NLP). We analyzed 732 occurrences of “se” retrieved from Porttinari-base, a treebank annotated following the Universal Dependency guidelines. The results allowed us to develop a proposal for syntactic and morphosyntactic annotation, which is expected to make human annotation simpler and more consistent as well as aid supplementary annotation, as in thematic role annotation, and enhance the performance of NLP tasks, as in automatic extraction of information.
Downloads
Referências
CÂMARA JR., J. M. Princípios de linguística geral. Rio de Janeiro: Livraria Acadêmica, 1972.
CANÇADO, M.; AMARAL, L. Introdução à Semântica Lexical: papéis temáticos, aspecto lexical e decomposição de predicados. Petrópolis: Editora Vozes, 2016. 256p. E-book.
DURAN, M. S.; ALUÍSIO, S. M. O tratamento da partícula “se” para fins de anotação de papéis semânticos. In: JORNADA DE DESCRIÇÃO DO PORTUGUÊS, 2., 2011; SYMPOSIUM IN INFORMATION AND HUMAN LANGUAGE TECHNOLOGY (STIL), 8., 2011, Cuiabá. Proceedings […]. Porto Alegre: Sociedade Brasileira da Computação, 2011. p. 24-26. Available at: http://www.nilc.icmc.usp.br/til/stil2011_English/jdp/artigos/STIL2011_JDP_P4.pdf. Accessed on: 24 Sept. 2025.
DURAN, M. S.; LOPES, L.; NUNES, M. G. V.; PARDO, T. A. S. The Dawn of the Porttinari Multigenre Treebank: Introducing Its Journalistic Portion. In: SYMPOSIUM IN INFORMATION AND HUMAN LANGUAGE TECHNOLOGY (STIL), 14., 2023, Belo Horizonte. Proceedings […]. Porto Alegre: Sociedade Brasileira de Computação, 2023. p. 115-124. Available at: https://sol.sbc.org.br/index.php/stil/article/view/25443/25264. Accessed on: 24 Sept. 2025.
DURAN, M. S.; SCARTON, C.; ALUISIO, S.; RAMISCH, C. Identifying Pronominal Verbs: Towards Automatic Disambiguation of the Clitic ‘se’ in Portuguese. In: WORKSHOP ON MULTIWORD EXPRESSIONS, 9., 2013, Atlanta. Proceedings […]. Atlanta: Association of Computational Linguistics, 2013. p. 93-100. Available at: https://aclanthology.org/W13-1014. Accessed on: 24 Sept. 2025.
GODOY, L. A reflexivização no português brasileiro e a decomposição semântica de predicados. 2012. 158 p. Doctoral Dissertation (PhD in Linguistic Studies) – Faculty of Letters, Federal University of Minas Gerais, Belo Horizonte, 2012.
GODOY, L.; PINHEIRO, D. A rede gramatical das construções com se no português brasileiro. Revista Soletras, Rio de Janeiro, n. 45, p. 123-150, 2023. DOI: https://doi.org/10.12957/soletras.2023.73491.
GUIBON, G.; COURTIN, M.; GERDES, K.; GUILLAUME, B. When Collaborative Treebank Curation Meets Graph Grammars. In: LANGUAGE RESOURCES AND EVALUATION CONFERENCE, 12., 2020, Marseille. Proceedings […]. Marseille: European Language Resources Association, 2020. p. 5293-5302. Available at: https://www.aclweb.org/anthology/2020.lrec-1.651. Accessed on: 24 Sept. 2025.
MARNEFFE, M. C. de; MANNING, C. D.; NIVRE, J.; ZEMAN, D. Universal Dependencies. Computational Linguistics, v. 47, n. 2, p. 255-308, 2021. MIT Press. DOI: https://doi.org/10.1162/coli_a_00402.
MARTINS, A. M.; NUNES, J. Passives and Se Constructions. In: WETZELS, W. L.; COSTA, J.; MENUZZI, S. (ed.). The Handbook of Portuguese Linguistics. Oxford: John Wiley & Sons, 2016. p. 318-337. DOI: https://doi.org/10.1002/9781118791844.ch17.
MELLO, H.; RASO, T.; OLIVEIRA JUNIOR, M. A.; SARDINHA, T. B.; FREITAS, C.; ALUÍSIO, S. M.; PARDO, T. A. S; DURAN, M. S.; LEAL, S. E.; DAVIES, M.; GALVES-CHAMBELLAND, C. Brazilian Portuguese: Spoken, Written and Diachronic Corpora. In: CONGRESS OF THE ITALIAN SOCIETY OF LINGUISTICS, 54., 2021, Online. Proceedings […]. Milan: Officinaventuno, 2022. p. 179-188. DOI: https://doi.org/10.17469/O2106SLI000011.
NUNES, J. Ainda o famigerado SE. DELTA, v. 11, n. 2, p. 201-240, 1995.
NUNES, J. O famigerado SE: uma análise sincrônica e diacrônica das construções com SE apassivador e indeterminador. 1990. 172 p. Thesis (Master’s Degree in Linguistics) – Institute of Language Studies, Unicamp, Campinas, 1990. Available at: http://www.bibliotecadigital.unicamp.br/document/?code=vtls000045410. Accessed on: 24 Sept. 2025.
SOUZA, E. de; FREITAS, C. Um pronome com muitas funções: descrição e resultados da anotação do pronome -se em um treebank segundo o esquema Universal Dependencies (UD) para Português. In: SYMPOSIUM IN INFORMATION AND HUMAN LANGUAGE TECHNOLOGY (STIL), 14., 2023, Belo Horizonte. Proceedings […]. Porto Alegre: Sociedade Brasileira de Computação, 2023. p. 278-287. DOI: https://doi.org/10.5753/stil.2023.233986.
Downloads
Publicado
Edição
Seção
Licença
Copyright (c) 2025 Magali Sanches Duran, Adriana Silvina Pagano, Thiago Alexandre Salgueiro Pardo

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Autores de artigos publicados pela RBLA mantêm os direitos autorais de seus trabalhos, licenciando-os sob a licença Creative Commons BY Attribution 4.0, que permite que os artigos sejam reutilizados e distribuídos sem restrição, desde que o trabalho original seja corretamente citado.


