Do contato entre a Literatura, a Linguística de Corpus e o Processamento de Língua Natural: o caso dos anagramáticos de Guimarães Rosa

Autores

DOI:

https://doi.org/10.35699/1983-3652.2022.39316

Palavras-chave:

Linguística de Corpus, Processamento de Língua Natural, Guimarães Rosa

Resumo

Da tentativa de realizar a cooperação entre a Linguística de Corpus e o Processamento de Língua Natural (PLN), foram alcançados importantes frutos, como a possibilidade de processamento de grandes dados linguísticos e o desenvolvimento de tecnologias que se utilizam de dados da língua. A relação entre essas duas áreas e os Estudos Literários, no entanto, tem sido pouco explorada, o que abre espaços para o presente trabalho, que tem por objetivo fazer uma análise exploratória da construção dos poemas atribuídos a anagramáticos de João Guimarães Rosa, em Ave, Palavra, obra de 1970. Para isso, foram utilizadas, em conjunto, abordagens da Linguística de Corpus e do PLN, associadas aos trabalhos de Rossi (2007), Brito (2012) e Vital (2021), acerca da obra rosiana. Com o processamento computacional do corpus, pudemos extrair: a) o número de palavras; b) a razão type-token; c) o número de estrofes e de versos e d) as palavras mais frequentes para cada um dos anagramáticos. Os dados foram dispostos em gráficos e nuvens de palavras (wordclouds). Desses resultados, foi observado que existem, de fato, diferenças quantitativas e qualitativas presentes no nível poético, reafirmando, por meio de observações das epígrafes de cada anagramático, a complexidade envolvida na criação da metapoeticidade de suas máscaras.

Downloads

Não há dados estatísticos.

Biografia do Autor

Átila Augusto Soares Vital, Universidade Federal de Minas Gerais, Faculdade de Letras, Belo Horizonte, MG, Brasil

Estudante do Bacharelado em Linguística Teórica e Descritiva pela UFMG. Membro do Laboratório de Estudos Empíricos e Experimentais da Linguagem (LEEL), da Faculdade de Letras (FALE/UFMG). Trabalha com estudos da estrutura informacional da fala espontânea a partir da Linguística de Corpus e Computacional. 

Referências

BERBER SARDINHA, T. Lingüística de Corpus: histórico e problemática. DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada, v. 16, p. 323–367, 2000. ISSN 0102-4450, 1678-460X. DOI: 10.1590/S0102-44502000000200005. Disponível em: http://www.scielo.br/j/delta/a/vGknQkZQGsGYbrQfKmTZY4s/?lang=pt. Acesso em: 11 set. 2022.

BIRD, S.; KLEIN, E.; LOPER, E. Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit. 1ª edição. Beijing ; Cambridge Mass.: O’Reilly Media, jun. 2009.

BRITO, F. M. M. de. Aspectos metaficcionais na poética de Rosa e Pessoa: o artifício das máscaras heteronímicas e anagramáticas. Letras de Hoje, v. 47, n. 4, p. 425–429, dez. 2012. ISSN 1984-7726. Disponível em: https://revistaseletronicas.pucrs.br/ojs/index.php/fale/article/view/10619. Acesso em: 11 set. 2022.

FINATTO, M. J. B.; LOPES, L.; SILVA, A. C. Processamento de linguagem natural, linguística de corpus e estudos linguísticos: uma parceria bem-sucedida. Domínios de Linguagem, v. 9, n. 5, p. 41–59, 2015. ISSN 1980-5799. Disponível em: https://lume.ufrgs.br/handle/10183/169398. Acesso em: 11 set. 2022.

JAFAR, M.; BABB, J.; DANA, K. A Framework for an Interactive Word-Cloud Approach for Visual Analysis of Digital Text using the Natural Language Toolkit. In: PROCEEDINGS of the Conference on Information Systems Applied Research. New Orleans: [s.n.], 2012. v. 5, n. 2240, p. 1–10.

JOCKERS, M. L. Text Analysis with R for Students of Literature. Switzerland: Springer, 2014. Disponível em: https://link.springer.com/book/10.1007/978-3-319-03164-4. Acesso em: 11 set. 2022.

KAUFFMANN, C. H. Linguística de corpus e estilo: análises multidimensional e canônica na ficção de Machado de Assis. 2020. Tese (Doutorado em Linguística Aplicada e Estudos da Linguagem) – Pontifícia Universidade Católica de São Paulo, São Paulo.

MCKINNEY, W. Data structures for statistical computing in python. In: PROCEEDINGS of the 9th Python in Science Conference. [S.l.: s.n.], 2010. p. 56–61. Disponível em: https://conference.scipy.org/proceedings/scipy2010/pdfs/mckinney.pdf. Acesso em: 11 set. 2022.

RAMOS, M. L. Fenomenologia da Obra Literária. 4ª edição. Belo Horizonte: Editora UFMG, jan. 2011.

RASO, T.; MELLO, H. (Ed.). C-oral - Brasil I: Corpus de Referência do Português Brasileiro Falado Informal. 1ª edição. Belo Horizonte: Editora UFMG, jan. 2012.

ROSA, J. G. Ave, Palavra. Rio de Janeiro, RJ: Nova Fronteira, 1985.

ROSSI, E. A. As poesias de Guimarães Rosa em Ave, Palavra: um caminho de leitura. 2007. Dissertação (Mestrado em Estudos Literários) – Universidade Estadual Paulista, Faculdade de Ciências e Letras de Araraquara, Araraquara, SP.

VITAL, A. A. S. Uma possibilidade de leitura do poema “Alongo-me”, de Soares Guiamar, anagramático de Guimarães Rosa. Miguilim – Revista Eletrônica do Netlli, v. 10, n. 3, p. 980–989, 2021.

Downloads

Publicado

2022-09-14

Como Citar

VITAL, Átila A. S. . Do contato entre a Literatura, a Linguística de Corpus e o Processamento de Língua Natural: o caso dos anagramáticos de Guimarães Rosa. Texto Livre, Belo Horizonte-MG, v. 15, p. e39316, 2022. DOI: 10.35699/1983-3652.2022.39316. Disponível em: https://periodicos.ufmg.br/index.php/textolivre/article/view/39316. Acesso em: 4 out. 2022.