‘Discourse reading’ predication and gender

putting together corpus and discourse analysis

Authors

DOI:

https://doi.org/10.35699/1983-3652.2022.36213

Keywords:

Digital Humanities, Corpus linguistics, Text mining, Discourse analysis, Gender studies

Abstract

This paper proposes a methodological synergy between corpus linguistics and discourse studies. We use a literary corpus composed of more than 200 books of Brazilian literature (about 5 million words) and present a quantitative and qualitative analysis that takes the gender element as an analytical operator, selecting one of its dimensions: characterizations attributed to female and male characters. Searching for linguistic structures indicative of predication, we distinguished four axes of analysis (appearance, emotion, character e social role), expanding a type of research that is normally restricted to case studies. Using computational tools, we switch the glasses that bring the text to a close or a distant reading, making the best of each of these perspectives. The results reinforce the idea of female characterization centered on appearance (specifically on beauty), but also signal the importance of taking into account not only the high frequency elements of the corpus.

Downloads

Download data is not yet available.

References

ARTSTEIN, R. Inter-annotator agreement. In: IDE, N.; PUSTEJOVSKY, J. (Ed.). Handbook of linguistic annotation. Dordrecht: Springer, 2017. p. 297–313.

BAKER, P.; GABRIELATOS, C.; KHOSRAVINIK, M. et al. A useful methodological synergy? Combining critical discourse analysis and corpus linguistics to examine discourses of refugees and asylum seekers in the UK press. Discourse & society, Sage Publications Sage UK: London, England, v. 19, n. 3, p. 273–306, 2008.

BAKER, P.; GABRIELATOS, C.; MCENERY, T. Sketching Muslims: A corpus driven analysis of representations around the word ‘Muslim’in the British press 1998–2009. Applied linguistics, Oxford University Press, v. 34, n. 3, p. 255–278, 2013.

BAKHTIN, M.; VOLOCHINOV, V. N. Marxismo e filosofia da linguagem. São Paulo: Hucitec, 1979.

BAKTHIN, M. M. Estética da criação verbal. São Paulo: Martins Fontes, 1992.

BARDIN, L. Análise de conteúdo. Lisboa: Edições 70, 1977.

BICK, E. The parsing system palavras: Automatic grammatical analysis of Portuguese in a constraint grammar famework. Aarhus: Aarhus Universitetsforlag, 2000.

BUTLER, J. Problemas de gênero: feminismo e subversão da identidade. Rio de Janeiro: Civilização Brasileira, 2003[1990].

DENZIN, N. K; LINCOLN, Y. S. O planejamento da pesquisa qualitativa: teorias e abordagens. Porto Alegre: Artmed, 2006.

FAIRCLOUGH, N. Discourse and Social Change. Cambridge: Polity Press, 1992.

FINATTO, M. J. B. et al. Linguı́stica de corpus: perspectivas. Rio Grande do Sul: UFRGS. Instituto de Letras, 2018.

FOUCAULT, M. A Arqueologia do Saber. Rio de Janeiro: Forense Universitária, 2004 [1969].

FOUCAULT, M. A ordem do discurso: aula inaugural no Collège de France, pronunciada em 2 de dezembro de 1970. Tradução: Laura Fraga de Almeida Sampaio. São Paulo: Edições Loyola, 2012.

FREITAS, C. Estudos linguı́sticos e Humanidades digitais: corpus e descorporificação. Gragoatá, v. 22, n. 44, p. 1207–1227, 2017.

FRIGINAL, E.; HARDY, J. A. The Routledge Handbook of Corpus Approaches to Discourse Analysis. [S.l.]: Routledge, 2020.

HEARST, M. A. Automatic acquisition of hyponyms from large text corpora. In: COLING 1992 volume 2: The 15th international conference on computational linguistics. Nantes: [s.n.], 1992. Disponível em: http://www.aclweb.org/anthology/C92-2082. Acesso em: 15 fev. 2022.

IDE, N.; PUSTEJOVSKY, J. Handbook of linguistic annotation. Dordrecht: Springer Netherlands, 2017.

LEITE, M; FREITAS, C. Pesquisa em Educação: perspectivas (qualitativas?) na exploração de grandes corpora. OSLa-Oslo Studies in Language, v. 7, n. 1, p. 139–152, 2015.

MAINGUENEAU, D. Discurso e análise do discurso. São Paulo: Parábola Editorial, 2015.

MAINGUENEAU, D. Discurso literário. São Paulo: Contexto, 2006.

MANNING, C.; SCHUTZE, H. Foundations of statistical natural language processing. Cambridge, Massachusetts: MIT press, 1999.

MCENERY, T.; HARDIE, A. Corpus linguistics: Method, theory and practice. Cambridge: Cambridge University Press, 2011.

MORETTI, F. A literatura vista de longe. Porto Alegre: Arquipélago Editorial, 2008 [2005].

MORETTI, F.; SOBCHUK, O. Hidden in Plain Sight: Data Visualization in the Humanities. New Left Review, New Left Review Ltd., v. 118, p. 86–115, 2019.

MUSSALIM, F. Análise do discurso literário. Domı́nios de Lingu@ gem, v. 12, n. 1, p. 581–603, 2018.

OLIVEIRA, L. A. (Org.). Estudos do discurso: perspectivas teóricas. São Paulo: Parábola, 2013.

PAIXÃO DE SOUSA, M. C. A filologia digital em língua portuguesa: alguns caminhos. Patrimônio Textual e Humanidades Digitais: da antiga à nova Filologia, Évora: CIDEHUS, 2013.

POSSENTI, S. Análise do discurso; um caso de múltiplas rupturas. In: INTRODUÇÃO à lingüìstica: fundamentos epistemológicos. São Paulo: Editora Cortez, 2004. p. 353–366.

RAJAGOPALAN, K. Nova pragmática: fases e feições de um fazer. São Paulo: Parábola, 2010.

ROCHA, D.; DEUSDARÁ, B. Análise de Conteúdo e Análise do Discurso: aproximações e afastamentos na (re) construção de uma trajetória. Alea: estudos neolatinos, SciELO Brasil, v. 7, p. 305–322, 2005.

SAMPSON, G. Empirical linguistics. London ; New York: Continuum, 2002.

SANTOS, D. Corporizando algumas questões. In: TAGNIN, S. E. O.; VALE, O. A. (Ed.). Avanços da Lingüística de Corpus no Brasil. USP, São Paulo: Editora Humanitas, 2008. p. 41–66. Disponível em: http://www.linguateca.pt/Diana/download/Santos2008livroStellaOtofinal.pdf%22. Acesso em: 2 nov. 2020.

SANTOS, D. Literature studies in Literateca: between digital humanities and corpus linguistics. In: DOERR, M. et al. (Ed.). Humanists and the digital toolbox: In honour of Christian-Emil Smith Ore. Oslo: Novus Forlag, 2019. p. 89–109. Disponível em: http://www.linguateca.pt/Diana/download/DianaSantosFSCEO.pdf.

SANTOS, D. Podemos contar com as contas? In: ALUÍSIO, Sandra Maria; TAGNIN, Stella E. O. (Ed.). New Language Technologies and Linguistic Research: A Two-Way Road. Cambridge: Cambridge Scholars Publishing, maio 2014. p. 194–213. Disponível em: http://www.linguateca.pt/Diana/download/Santos2014contas.pdf.

SANTOS, D.; FREITAS, C.; BICK, E. OBras: a fully annotated and partially human-revised corpus of Brazilian literary works in public domain. In: CORLEX. Canela, RGS: [s.n.], 24 de setembro 2018. Disponível em: http://www.linguateca.pt/Diana/download/CorLex.pdf.

SILVA, F. M. da R. P. da. Diferenciações de gênero na caracterização de personagens: uma proposta metodológica e primeiros resultados. Rio de Janeiro, RJ: Departamento de Letras, PUC-Rio, abr. 2021. 169 p. Disponível em: https://www.maxwell.vrac.puc-rio.br/54130/54130.PDF.

SILVERSTEIN, M. Shifters, linguistic categories, and cultural description. Meaning in anthropology, University of New Mexico Press, p. 11–55, 1976.

SMITH, S. L; CHOUEITI, M.; PIEPER, K. Gender bias without borders: An investigation of female characters in popular films across 11 countries. Los Ángeles University of Southern California, 2014.

STROM, M.; ALCOCK, E. Floods, waves, and surges: the representation of Latin immigrant children in the United States mainstream media. Critical Discourse Studies, Taylor & Francis, v. 14, n. 4, p. 440–457, 2017.

THOMPSOM, J. B. Ideologia e cultura moderna: teoria social crı́tica na era dos meios de comunicação de massa. Petrópolis, RJ: Vozes, 1995 [1990].

UNDERWOOD, T.; BAMMAN, D.; LEE, S. The transformation of gender in English-language fiction. Journal of Cultural Analytics, Department of Languages, Literatures, e Cultures, v. 3, n. 2, p. 11035, 2018.

Published

2022-02-15

How to Cite

FREITAS, C.; MARTINS, F.; BIAR, L. ‘Discourse reading’ predication and gender: putting together corpus and discourse analysis. Texto Livre, Belo Horizonte-MG, v. 15, p. e36213, 2022. DOI: 10.35699/1983-3652.2022.36213. Disponível em: https://periodicos.ufmg.br/index.php/textolivre/article/view/36213. Acesso em: 17 jul. 2024.