Identificação computacional de estruturas métricas de versificação na prosa de Euclides da Cunha / Computational identification of versification metric structures in Euclides da Cunha’s prose
estruturas de versificação, prosa, mineração de versos, Euclides da Cunha, structures of versification, verse mining, prose.Resumo
Resumo: Estruturas de versificação em prosa de língua portuguesa constituem um fenômeno ainda inexplorado por teóricos e historiadores da literatura, e a mineração automática de tais estruturas é inédita em Linguística Computacional. O sistema MIVES (Mining Verse Structure) foi desenvolvido para escansão computacional de estruturas métricas de versificação em prosa de língua portuguesa. Ele é capaz de identificar, classificar e comparar, frequência, densidade e dispersão de estruturas heterométricas de versificação, distribuídas em diversas escalas de observação -- de uma obra ou autor, até períodos e movimentos literários. Apresentamos o sistema, e fazemos uma validação preliminar dele em três obras de Euclides da Cunha (Os Sertões, À Margem da História, Contrastes e Confrontos). Elas foram selecionadas porque constituem o corpus principal de um dos mais importantes prosadores de língua portuguesa e porque Os Sertões foi objeto do que Augusto de Campos chamou de “leitura verso-espectral”, uma operação capaz de revelar “mais de 500 decassílabos na obra”. MIVES identificou estruturas métricas em 48,18% das sentenças de Os Sertões, 48,96% de À Margem da História e 37,48% de Contrastes e Confrontos, uma taxa surpreendente, quando comparada aos resultados exibidos por Augusto de Campos. Pode-se afirmar que MIVES inaugura novos padrões de observação e análise de estruturas ainda não investigadas na prosa literária de língua portuguesa.
Palavras-Chave: estruturas de versificação; prosa; mineração de versos; Euclides da Cunha.
Abstract: Versification structures written in Portuguese language prose are still an unexplored phenomenon to literary theorists and historians, and the automatic mining of such structures is still unseen in Computational Linguistics. The MIVES (Mining Verse Structure) system was developed for computational scansion of metric versification structures in Portuguese language prose. It is able to identify, classify and compare, frequency, density and dispersion of heterometric structures of versification, distributed at different scales of observation, from a work or author, to historical periods and movements. We present the system, and a preliminary validation analysing three works by Euclides da Cunha (Os Sertões, À Margem da História, Contrastes e Confrontos). They were selected because they constitute the main corpus of one of the most important Portuguese-language writers, and because Os Sertões was the object of what Augusto de Campos (2010, p. 14) called “verse-spectral reading”, an operation able of revealing “more than 500 decasyllables in the book, among sapphic and heroic verses, and more than two hundred dodecasyllables. MIVES identified metric structures in 48.18% of the sentences of Os Sertões, 48.96% of À Margem da História and 37.48% of Contrastes e Confrontos, an unexpected rate when compared to the partial results of Augusto de Campos. It can be said that MIVES inaugurates new patterns of observation and analysis of structures not yet investigated in Portuguese language literary prose.
Keywords: structures of versification; verse mining; prose; Euclides da Cunha.