From the contact between Literature, Corpus Linguistics and Natural Language Processing

the case of the anagrammatics of Guimarães Rosa

Authors

DOI:

https://doi.org/10.35699/1983-3652.2022.39316

Keywords:

Corpus Linguistics, Natural Language Processing, Guimarães Rosa

Abstract

From the attempt to achieve the cooperation between Corpus Linguistics and the Natural Language Processing (NLP), important products have been created, as the possibility of processing lots of linguistic data and developing technologies that use language. The relationship between those areas and the Literary Studies, however, has been less studied, opening spaces for this study, which has the objective of carrying out an exploratory analysis of the poems assigned to the anagrammatics of João Guimarães Rosa, in Ave, Palavra, from 1970. In order to do so, approaches of Corpus Linguistics and NLP were used together, associated with the works of Rossi (2007), Brito (2012) and Vital (2021), about the rosian oeuvre. Using computational processing, we extracted the following data from the corpus: a) the number of words; b) type-token ratio; c) the number of stanzas; d) the most frequent words for each anagrammatics. The data were displayed in the form of graphics and word clouds. From the results, we observed that there are quantitative and qualitative differences for each poet, reinforcing, through observations of the epigraphs of each author, the complexity involved in the metapoeticity of anagrammatic masks.

Downloads

Download data is not yet available.

Author Biography

Átila Augusto Soares Vital, Universidade Federal de Minas Gerais, Faculdade de Letras, Belo Horizonte, MG, Brasil

Estudante do Bacharelado em Linguística Teórica e Descritiva pela UFMG. Membro do Laboratório de Estudos Empíricos e Experimentais da Linguagem (LEEL), da Faculdade de Letras (FALE/UFMG). Trabalha com estudos da estrutura informacional da fala espontânea a partir da Linguística de Corpus e Computacional. 

References

BERBER SARDINHA, T. Lingüística de Corpus: histórico e problemática. DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada, v. 16, p. 323–367, 2000. ISSN 0102-4450, 1678-460X. DOI: 10.1590/S0102-44502000000200005. Disponível em: http://www.scielo.br/j/delta/a/vGknQkZQGsGYbrQfKmTZY4s/?lang=pt. Acesso em: 11 set. 2022.

BIRD, S.; KLEIN, E.; LOPER, E. Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit. 1ª edição. Beijing ; Cambridge Mass.: O’Reilly Media, jun. 2009.

BRITO, F. M. M. de. Aspectos metaficcionais na poética de Rosa e Pessoa: o artifício das máscaras heteronímicas e anagramáticas. Letras de Hoje, v. 47, n. 4, p. 425–429, dez. 2012. ISSN 1984-7726. Disponível em: https://revistaseletronicas.pucrs.br/ojs/index.php/fale/article/view/10619. Acesso em: 11 set. 2022.

FINATTO, M. J. B.; LOPES, L.; SILVA, A. C. Processamento de linguagem natural, linguística de corpus e estudos linguísticos: uma parceria bem-sucedida. Domínios de Linguagem, v. 9, n. 5, p. 41–59, 2015. ISSN 1980-5799. Disponível em: https://lume.ufrgs.br/handle/10183/169398. Acesso em: 11 set. 2022.

JAFAR, M.; BABB, J.; DANA, K. A Framework for an Interactive Word-Cloud Approach for Visual Analysis of Digital Text using the Natural Language Toolkit. In: PROCEEDINGS of the Conference on Information Systems Applied Research. New Orleans: [s.n.], 2012. v. 5, n. 2240, p. 1–10.

JOCKERS, M. L. Text Analysis with R for Students of Literature. Switzerland: Springer, 2014. Disponível em: https://link.springer.com/book/10.1007/978-3-319-03164-4. Acesso em: 11 set. 2022.

KAUFFMANN, C. H. Linguística de corpus e estilo: análises multidimensional e canônica na ficção de Machado de Assis. 2020. Tese (Doutorado em Linguística Aplicada e Estudos da Linguagem) – Pontifícia Universidade Católica de São Paulo, São Paulo.

MCKINNEY, W. Data structures for statistical computing in python. In: PROCEEDINGS of the 9th Python in Science Conference. [S.l.: s.n.], 2010. p. 56–61. Disponível em: https://conference.scipy.org/proceedings/scipy2010/pdfs/mckinney.pdf. Acesso em: 11 set. 2022.

RAMOS, M. L. Fenomenologia da Obra Literária. 4ª edição. Belo Horizonte: Editora UFMG, jan. 2011.

RASO, T.; MELLO, H. (Ed.). C-oral - Brasil I: Corpus de Referência do Português Brasileiro Falado Informal. 1ª edição. Belo Horizonte: Editora UFMG, jan. 2012.

ROSA, J. G. Ave, Palavra. Rio de Janeiro, RJ: Nova Fronteira, 1985.

ROSSI, E. A. As poesias de Guimarães Rosa em Ave, Palavra: um caminho de leitura. 2007. Dissertação (Mestrado em Estudos Literários) – Universidade Estadual Paulista, Faculdade de Ciências e Letras de Araraquara, Araraquara, SP.

VITAL, A. A. S. Uma possibilidade de leitura do poema “Alongo-me”, de Soares Guiamar, anagramático de Guimarães Rosa. Miguilim – Revista Eletrônica do Netlli, v. 10, n. 3, p. 980–989, 2021.

Published

2022-09-14

How to Cite

VITAL, Átila A. S. . From the contact between Literature, Corpus Linguistics and Natural Language Processing: the case of the anagrammatics of Guimarães Rosa. Texto Livre, Belo Horizonte-MG, v. 15, p. e39316, 2022. DOI: 10.35699/1983-3652.2022.39316. Disponível em: https://periodicos.ufmg.br/index.php/textolivre/article/view/39316. Acesso em: 19 oct. 2024.