CorCel

A Brazilian Portuguese Corpus of Celpe-Bras Exam Written Texts

Autores

Palavras-chave:

Celpe-Bras, Portuguese as an Additional Language, proficiency assessment, corpus compilation

Resumo

This paper introduces CorCel – a corpus of written texts produced under exam conditions for the Celpe-Bras exam. The goal is to compile over 70,000 texts produced in response to Celpe-Bras written tasks in four editions. The texts were provided as digitized manuscript copies, which were manually transcribed, reviewed, and anonymized. CorCel now consists of 15,315 typed and revised texts, estimated to total around three million words. The corpus classification and analysis will be carried out using multimodal, state-of-the-art transformer-based large language models, such as BERT, GPT, and Gemini. Preliminary studies showed that CorCel can be used to list relevant lexical indices for the characterization of different proficiency levels in written tasks, enabling analyses that contribute to the validation process of the exam, strengthening and refining the descriptions for each of the certified proficiency levels. CorCel’s innovative nature can contribute to enhancing teaching, learning, and proficiency assessment through improved descriptions of proficiency levels in Portuguese.

Downloads

Os dados de download ainda não estão disponíveis.

Referências

ACERVO CELPE-BRAS. [S. l.: s.n.], 2025. Available at: www.ufrgs.br/acervocelpebras. Accessed on: 27 Aug. 2025.

ALDERSON, J. C.; WALL, D. Does Washback Exist? Applied Linguistics, v. 14, n. 2, p. 115-129, 1 jun. 1993. Oxford University Press (OUP). DOI: http://dx.doi.org/10.1093/applin/14.2.115. Available at: https://academic.oup.com/applij/article-abstract/14/2/115/224706. Accessed on: 4 July 2025.

BAKHTIN, M. Estética da criação verbal. São Paulo: Martins Fontes, 2003.

BANERJEE, J.; FRANCESCHINA, F.; SMITH, A. M. Documenting Features of Written Language Production Typical at Different IELTS Score Band Levels. British Council, Cambridge English Language Assessment and IDP: IELTS Australia. IELTS Research Reports Online Series, v. 7, 2007. Available at: https://ielts.org/researchers/our-research/research-reports/documenting-features-of-written-language-production-typical-at-different-ielts-band-score-levels. Accessed on: 4 July 2025.

BARKAOUI, K. What Changes and What Doesn’t? An Examination of Changes in the Linguistic Characteristics of IELTS Repeaters’ Writing Task 2 Scripts. IELTS Research Report Series, n. 3, p. 1-55, 2016.

BARKER, F.; SALAMOURA, A.; SAVILLE, N. Learner Corpora and Language Testing. In: GRANGER, S.; GILQUIN, G.; MEUNIER, F. (org.). The Cambridge Handbook of Learner Corpus Research. Cambridge: Cambridge University, 2015. p. 511-534.

BERBER SARDINHA, T.; MOREIRA FILHO, J. L.; ALAMBERT, E. CORPUS Brasileiro: Corpus of Brazilian Portuguese. Sketch Engine, São Paulo Catholic University, Apr. 2010. Available at: https://www.sketchengine.eu/corpus-brasileiro/. Accessed on: 29 Aug. 2025.

BIBER, D.; GRAY, B. Discourse Characteristics of Writing and Speaking Task Types on the TOEFL iBT® Test: A Lexico‐Grammatical Analysis. Research Report Series, i-128, 2013.

BICK, E. The Parsing System PALAVRAS: Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Aarhus: Aarhus University Press, 2000.

BORTOLINI, L.; SANTOS, L.; SCHOFFEN, J.; SCHLATTER, M. Critérios para a avaliação de compreensão e produção de texto no exame Celpe-Bras. Porto Alegre: UFRGS, 2006. Available at: https://lume.ufrgs.br/handle/10183/68807. Accessed on: 30 July 2024.

BRASIL. Documento-base do exame Celpe-Bras. Brasília, DF: Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira, 2020a. 130 p. Available at: https://www.ufrgs.br/acervocelpebras/wp-content/uploads/2021/12/Documento-base-do-exame-Celpe-Bras-2020.pdf. Accessed on:

5 July 2025.

BRASIL. Ministério da Educação. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Caderno de Questões 2015/2: Certificado de Proficiência em Língua Portuguesa para Estrangeiros. Brasília, DF: MEC; INEP, 2015. 10p.

BRASIL. Ministério das Relações Exteriores (MRE). Proposta curricular para o ensino de português nas unidades da rede de ensino do Itamaraty em contextos de línguas de média distância. Brasília, DF: FUNAG, 2021.

BRASIL. Ministério das Relações Exteriores. Proposta curricular para o ensino de português nas unidades da rede de ensino do Itamaraty em países de língua oficial espanhola. Brasília, DF: FUNAG, 2020b.

BRASIL. Ministério das Relações Exteriores. Proposta curricular para o ensino de português nas unidades da rede de ensino do Itamaraty em países de língua oficial portuguesa. Brasília, DF: FUNAG, 2020c.

CALLIES, M.; DÍEZ-BEDMAR, B.; ZAYTSEVA, E. Using Learner Corpora for Testing and Assessing L2 Proficiency. In: LECLERCQ, P.; HILTON, H.; EDMONDS, A. (ed.). Measuring L2 Proficiency: Perspectives from SLA. Bristol, UK: Multilingual Matters, 2014. p. 71-90.

CALLIES, M.; GÖTZ, S. Learner Corpora in Language Testing and Assessment. In: CALLIES, M.; GÖTZ, S. Studies in Corpus Linguistics, Amsterdam: Philadelphia: John Benjamins, 2015. v; 70. 220p. DOI: http://dx.doi.org/10.1075/scl.70.001int.

CARLSEN, C. (ed.). Norsk Profil. Det europeiske rammeverket spesifisert for norsk. Et forste steg. Oslo: Novus forlag, 2013.

CENTRO DE LINGUÍSTICA DA UNIVERSIDADE DE LISBOA. Recolha de Dados de PLE. Lisboa: CLUL, 2010. Available at: https://www.clul.ulisboa.pt/recurso/recolha-de-dados-de-ple. Accessed on: 29 Aug. 2025.

CENTRO DE LINGUÍSTICA DA UNIVERSIDADE NOVA DE LISBOA. Corpus de Aquisição de L2 (CAL2). [S. l.]: UNL, 2012. Available at: https://cal2.clunl.fcsh.unl.pt/index.html. Accessed on: 29 Aug. 2025.

CHAPELLE, C. A. Conceptions of Validity. In: FULCHER, G.; DAVIDSON, F. The Routledge Handbook of Language Testing. London: Routledge, 2012. p. 21-33.

CHENG, L.; SULTANA, N. Washback: Looking Backward and Forward. In: FULCHER, G.; HARDING, L. The Routledge Handbook of Language Testing. London: Routledge, 2022. Chap. 8. p. 136-152.

COSTA, E. V. da. Práticas de formação de professores de português língua adicional em um instituto cultural brasileiro no exterior. 2013. 162 f. Thesis (Master’s Degree in Applied Linguistics) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2013.

COUNCIL OF EUROPE. Common European Framework of Reference for Languages: Learning, Teaching, Assessment – Companion Volume. Strasbourg: Council of Europe Publishing, 2020. Available at: www.coe.int/lang-cefr. Accessed on: 5 July 2025.

CRESPO, M. C. R. M.; ROCHA, M. L. de S. J.; STURZENEKER, M. L.; SERRAS, F. R.; MELLO, G. L. de; COSTA, A. S.; PALMA, M. F.; MESQUITA, R. M.; GUETS, R. de P.; SILVA, M. M. da. Carolina: A General Corpus of Contemporary Brazilian Portuguese with Provenance, Typology, and Versioning Information. Arxiv, 2303.16098, 28 Mar. 2023. Preprint. DOI: https://doi.org/10.48550/arXiv.2303.16098.

CUMMING, A.; KANTOR, R.; BABA, K.; ERDOSY, U.; EOUANZOUI, K.; JAMES, M. Differences in Written Discourse in Independent and Integrated Prototype Tasks for Next Generation TOEFL. Assessing Writing, v. 10, n. 1, p. 5-43, 2005.

CUSHING, S. T. Corpus Linguistics and Language Testing. In: FULCHER, G.; HARDING, L. (ed.). The Routledge Handbook of Language Testing. 2nd. ed. London: Routledge, 2022. Chap. 32. p. 345-360.

CUSHING, S. T. Corpus Linguistics in Language Testing Research. Language Testing, v. 34, n. 4, p. 441-449, Sept. 2017. DOI: https://doi.org/10.1177/0265532217713044.

DAVIES, M.; FERREIRA, M. Corpus do Português. [S. l.], 2006. Available at: https://www.corpusdoportugues.org/. Accessed on: 29 Aug. 2025.

DIVINO, L. S. Contribuições da linguística de corpus para a definição de níveis de proficiência escrita no exame Celpe-Bras. 2024. Thesis (Master’s Degree in Applied Linguistics) – Post-Graduate Program in Letters, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2024.

DIVINO, L. S. Índices lexicais de análise para a caracterização dos níveis intermediário e avançado superior no exame Celpe-Bras: uma pesquisa guiada por corpus. 2021. Final Paper for Undergraduate Course (B.A. in Letters) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2021.

DUTRA, D. P.; ORFANÒ, B. M.; GUEDES, A. de S.; ALVES, J. C.; FEKETE, J. G. The Learner Corpus Path: A Worthwhile Methodological Challenge. DELTA, v. 38, n. 2, p. 1-24, 2022. DOI: https://doi.org/10.1590/1678-460X202238249731.

EICKHOFF, S. A. PTC Error Correction Protocol. Flagstaff: Northern Arizona University, 2022.

FERREIRA, T.; SANTOS, I.; CARAPINHA, C.; MARTINS, C.; PEREIRA, I.; RIO‑TORTO, G.; INVERNO, L.; PEREIRA, R.; FERREIRA, C.; SOUSA, S.; CHAPOUTO, S. Construção do corpus. Études Romanes de Brno, v. 44, n. 1, p. 245-261, 2023. Masaryk University Press. DOI: http://dx.doi.org/10.5817/erb2023-1-14. Available at: https://www.researchgate.net/publication/371204856_Construcao_do_corpus_Producao_Oral_em_Provas_de_Portugues_L2_POPL2. Accessed on: 4 July 2025.

FORTES, M. S. Uma compreensão etnometodológica do trabalho de fazer ser membro na fala-em-interação de entrevista de proficiência oral em português como língua adicional. 2009. Doctoral Dissertation (Ph.D. in Applied Linguistics) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2009.

FULCHER, G. Does Thick Description Lead to Smart Tests? A Data-Based Approach to Rating Scale Construction. Language Testing, v. 13, n. 2, p. 208-238, 1996.

FULCHER, G.; HARDING, L. Epilogue: Language Testing: Where Are We Heading? In: FULCHER, G.; HARDING, L. (ed.). The Routledge Handbook of Language Testing. 2nd. ed. London: Routledge, 2022. Chap. 32. p. 345-360.

GABLASOVA, D. Corpora for Second Language Assessments. In: WINKE, P.; BRUNFAUT, T. The Routledge Handbook of Second Language Acquisition and Language Testing. London: Routledge, 2021.

p. 45-53.

GABLASOVA, D.; BREZINA, V.; MCENERY, T. Exploring Learner Language Through Corpora: Comparing and Interpreting Corpus Frequency Information. Language Learning, v. 67, n. 1, p. 130-154, 2017. DOI: http://dx.doi.org/10.1111/lang.12226.

GOMES, M. S. A complexidade de tarefas de leitura e produção escrita no exame Celpe-Bras. 2009. 109p. Thesis (Master’s Degree in Letters) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2009. Available at: https://lume.ufrgs.br/handle/10183/16228. Accessed on: 4 July 2025.

GÖTZ, S. Learner Corpora to Inform Testing and Assessment. In: WINKE, P.; BRUNFAUT, T. The Routledge Handbook of Corpora and English Language Teaching and Learning. London: Routledge, 2022. p. 311-326.

GRANGER, S. Learner Corpora. In: CHAPELLE, C. A. (ed.). The Encyclopedia of Applied Linguistics. Louvain: Blackwell Publishing Ltd, 2013. DOI: https://doi.org/10.1002/9781405198431.wbeal0669.

GRANGER, S. Learner Corpora. In: LÜDELING, A.; KYTÖ, M. (org.). Corpus Linguistics: An International Handbook. Berlin; New York: Walter de 5 Gruyter, 2008. v. 1, p. 259-275.

GRANGER, S. Learner Corpora in Foreign Language Education. In: THORNE, S.; MAY, S. (org.). Language, Education and Technology: Encyclopedia of Language and Education. [S. l.]: Springer, 2017. p. 427-440.

GRANGER, S. The Contribution of Learner Corpora to Second Language Acquisition and Foreign Language Teaching: A Critical Evaluation. In: AIJMER, K. (org.). Corpora and Language Teaching. Amsterdam; Philadelphia: Benjamins, 2009. p. 13-32.

GRANGER, S.; SWALLOW, H.; THEWISSEN, J. The Louvain Error Tagging Manual Version 2.0. Louvain: Centre for English Corpus Linguistics, Université Catholique de Louvain, 2022.

GRUPO AVALIA. [S. l.: s.n.], 2025. Homepage. Available at: https://www.ufrgs.br/grupoavalia/. Accessed on: 27 Aug. 2025.

GYLLSTAD, H.; GRANFELDT, J.; BERNARDINI, P.; KÄLLKVIST, M. Linguistic Correlates to Communicative Proficiency Levels of the CEFR: The Case of Syntactic Complexity in Written L2 English, L3 French and L4 Italian. EUROSLA Yearbook, v. 14, n. 1, p. 1-30, Aug. 2014. DOI: https://doi.org/10.1075/eurosla.14.01gyl.

HANAUER, I. D. Caracterização dos níveis intermediário e avançado superior do exame Celpe-Bras em produções escritas de examinandos no gênero carta/e-mail: contribuições de uma análise guiada por corpus. 2023. Final Paper for Undergraduate Course (B.A. in Letters) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2023.

HANAUER, I. D. Influência das inadequações ortográficas em análise de tarefa escrita do Celpe-Bras guiada por corpus. XXXIV Salão de Iniciação Científica, UFRGS. 2022. Available at: https://youtu.be/C6iomOTWRwM. Accessed on: 4 July 2025.

HARRISON, J.; BARKER, F. English Profile in Practice. Cambridge: Cambridge University Press, 2015.

HAWKINS, J. A.; FILIPOVIC, L. Criterial Features in L2 English: Specifying the Reference Levels of the Common European Framework. Cambridge: Cambridge University Press, 2012.

JENKINS, J. ELF at the Gate: The Position of English as a Lingua Franca. Humanising Language Teaching, Oxford, v. 7, n. 2, Mar. 2005. Available at: http://old.hltmag.co.uk/mar05/idea.htm#C2. Accessed on: 4 July 2025.

KENNEDY, C.; THORP, D.; TAYLOR, L.; FALVEY, P. A Corpus-Based Investigation of Linguistic Responses to an IELTS Academic Writing Task. In: TAYLOR, L.; FALVEY, P. (ed.). IELTS Collected Papers: Research in Speaking and Writing Assessment. Studies in Language Testing. Cambridge: Cambridge University Press, 2007. v. 19. Chap. 8. p. 316-378.

KILGARRIFF, A.; RYCHLÝ, P.; SMRŽ, P.; TUGWELL, D. The Sketch Engine. In: EURALEX INTERNATIONAL CONGRESS, 11., 2004, Universite de Bretagne-Sud. Proceedings […]. Leiden: Euralex, 2004. p. 105-116. Available at: https://www.sketchengine.co.uk/wp-content/uploads/The_Sketch_Engine_2004.pdf. Accessed on: 4 July 2025.

KUNRATH, S. P. Os descritores gerais e a progressão dos níveis de proficiência do exame Celpe-Bras. 2019. Doctoral Dissertation (Ph.D. in Applied Linguistics) – Post-Graduate Program in Letters, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2019. Available at: https://www.lume.ufrgs.br/handle/10183/239041. Accessed on: 4 July 2025.

LI, Y. A preparação de candidatos chineses para o Exame Celpe-Bras: aprendendo o que significa “uso da linguagem”. 2009. 130p. Thesis (Master’s Degree in Language Studies) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2009.

MARTINS, C.; FERREIRA, T.; SITOE, M.; ABRANTES, C.; JANSSEN, M.; FERNANDES, A.; SILVA, A.; LOPES, I.; PEREIRA, I.; SANTOS, J. Corpus de produções escritas de aprendentes de PL2 (PEAPL2): subcorpus Português Língua Estrangeira. Coimbra: CELGA-ILTEC, 2019. Available at: https://teitok2.iltec.pt/peapl2/#http://teitok.iltec.pt/peapl2/. Accessed on: 29 Aug. 2025.

MAURANEN, A. Learners and Users – Who Do We Want Corpus Data From? In: MEUNIER, F. et al. A Taste for Corpora: In Honour of Sylviane Granger. Amsterdam: John Benjamins, 2011. p. 155-171.

MENDEL, K. Proficiência e autoria na avaliação integrada de leitura e escrita do exame Celpe-Bras. 2019. 177p. Thesis (Master’s Degree in Letters) – Institute of Letters, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2019.

MENDES, A.; ANTUNES, S.; JANSSEN, M.; GONÇALVES, A. The COPLE2 Corpus: A Learner Corpus for Portuguese. In: LREC, 10., 2016, Portorož. Proceedings […]. Portorož: European Language Resources Association (ELRA), 2016. p. 3207-3214. Available at: https://aclanthology.org/L16-1511/. Accessed on: 4 July 2025.

MEUNIER, F. Corpus Linguistics and Second/Foreign Language Learning: Exploring Multiple Paths. Revista Brasileira de Linguística Aplicada, Belo Horizonte, v. 11, n. 2, p. 459-477, 2011. Available at: https://www.scielo.br/j/rbla/a/BLJ6xy89SLRH7KNYSzJTPjS/?lang=en. Accessed on: 4 July 2025.

MINISTÉRIO DAS RELAÇÕES EXTERIORES. PEC-G (Undergraduate). 2024. Available at: https://www.gov.br/mre/en/subjects/culture-and-education/educational-themes/study-opportunities-for-international-applicants/pec-g. Accessed on: 29 Aug. 2025.

MITTELSTADT, D. D. Orientações curriculares e pedagógicas para o nível avançado de português como língua adicional. 2013. Thesis (Master’s Degree) – Institute of Letters, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2013.

MIZUMOTO, A., EGUCHI, M. Exploring the Potential of Using an AI Language Model for Automated Essay Scoring. Research Methods in Applied Linguistics, v. 2, n. 2, 100050, 2023. DOI: https://doi.org/10.1016/j.rmal.2023.100050.

NAGASAWA, E. Y. O conteúdo de insumo em tarefas que integram leitura e escrita no Celpe-Bras: uma abordagem informada por corpus. 2023. 302p. Doctoral Dissertation (Ph.D. in Applied Linguistics) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2023.

OHLWEILER, B. M. D. Criação de um jornal na sala de aula de português língua estrangeira. 2006. Thesis (Master’s Degree) – Institute of Letters, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2006.

PACK, A.; BARRETT, A.; ESCALANTE, J. Large Language Models and Automated Essay Scoring of English Language Learner Writing: Insights into Validity and Reliability. Computers and Education: Artificial Intelligence, v. 6, e100234, 2024. Available at: https://www.sciencedirect.com/science/article/pii/S2666920X24000353?via%3Dihub. Accessed on: 4 July 2025.

PAQUOT, M. The Phraseological Dimension in Interlanguage Complexity Research. Second Language Research, California, v. 35, n. 1, p. 121-145, Jan. 2019. DOI: https://doi.org/10.1177/0267658317694221.

PRODEAU, M.; LOPEZ, S.; VÉRONIQUE, D. Acquisition of French as a Second Language: Do Developmental Stages Correlate with CEFR Levels? Apples, Finland, v. 6, n. 1, p. 47-68, Oct. 2012. Available at: https://apples.journal.fi/article/view/97832. Accessed on: 4 July 2025.

RAUPP, A. Características lexicais das produções escritas do exame CELPE-BRAS na tarefa 3 de 2016-2: uma pesquisa guiada por corpus. 2024. Final Paper for Undergraduate Course (B.A. in Letters) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2024.

RAYSON, P. Matrix: A Statistical Method and Software Tool for Linguistic Analysis Through Corpus Comparison. 2002. Doctoral Dissertation (Ph.D. in Computer Science) – Lancaster University, Lancaster, 2002.

READ, J.; NATION, P. An Investigation of the Lexical Dimension of the IELTS Speaking Test. IELTS Research Reports, v. 6, n. 6, p. 207-231, 2006.

SAVILLE, N.; HAWKEY, R. The English Profile Programme: The First Three Years. English Profile Journal, Cambridge, v. 1, n. 1, Sept. 2010. DOI: https://doi.org/10.1017/S2041536210000061.

SCARAMUCCI, M. V. R. Efeito retroativo da avaliação no ensino/aprendizagem de línguas: o estado da arte. Trabalhos em Linguística Aplicada, v. 43, n. 2, p. 203-226, 2004. FapUNIFESP (SciELO). DOI: http://dx.doi.org/10.1590/s0103-18132004000200002. Available at: https://www.scielo.br/j/tla/a/PpG6gN9pbJVhVbhWB6JWZkw/. Accessed on: 4 July 2025.

SCARAMUCCI, M. V. R. Validade e consequências sociais das avaliações em contextos de ensino de línguas. Linguarum Arena, Porto, v. 2, p. 103-120, 2011. Available at: https://ler.letras.up.pt/uploads/ficheiros/9836.pdf. Accessed on: 4 July 2025.

SCHEPERS, B. M. The Use of Pragmatic Markers by English Speaking Learners of Brazilian Portuguese. 2021. 184p. Doctoral Dissertation (Ph.D. in Linguistics) – Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2021.

SCHLATTER, M.; ALMEIDA, A. N.; FORTES, M. S.; SCHOFFEN, J. R. Avaliação de desempenho e os conceitos de validade, confiabilidade e efeito retroativo. In: NASCIMENTO, V. F. et al. (org.). A redação no contexto do vestibular 2005: a avaliação em perspectiva. Porto Alegre: Universidade Federal do Rio Grande do Sul, 2005. p. 11-35.

SCHLATTER, M.; SCARAMUCCI, M. V. R.; PRATI, S.; ACUÑA, L. Celpe-Bras e Celu: impactos da construção de parâmetros comuns de avaliação de proficiência em português e em espanhol. In: FONTANA, M. G. Z. O português do Brasil como língua transnacional. Campinas: Editora Rg, 2009. p. 95-122.

SCHOFFEN, J. R. Avaliação de proficiência oral em língua estrangeira: descrição dos níveis de candidatos falantes de espanhol no exame Celpe-Bras. 2003. Thesis (Master’s Thesis in Applied Linguistics) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2003.

SCHOFFEN, J. R. Gêneros do discurso e parâmetros de avaliação de proficiência em português como língua estrangeira no Exame Celpe-Bras. 2009. 192p. Doctoral Dissertation (Ph.D. in Letters) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2009.

SCHOFFEN, J. R.; MARTINS, A. F. Políticas linguísticas e definição de parâmetros para o ensino de português como língua adicional: perspectivas portuguesa e brasileira. ReVEL, Novo Hamburgo, v. 14, n. 26, p. 271-306, Mar. 2016.

SCHOFFEN, J. R.; SCHLATTER, M.; KUNRATH, S. P.; NAGASAWA, E. Y.; SIRIANNI, G. R.; MENDEL, K.; TRUYLLIO, L. R.; DIVINO, L. S. Estudo descritivo das tarefas da Parte Escrita do exame Celpe-Bras: edições de 1998 a 2017. Porto Alegre: Instituto de Letras, UFRGS, 2018. Available at: https://lume.ufrgs.br/handle/10183/195625. Accessed on: 4 July 2025.

SCHOFFEN, J.; STUMPF, E.; AMARAL, D.; DIVINO, L.; HANAUER, I.; LISBOA, I.; RAUPP, A.; XAVIER, B. Compilation and Tagging of a Corpus with Celpe-Bras Texts. In: INTERNATIONAL CONFERENCE ON COMPUTATIONAL PROCESSING OF PORTUGUESE, 16., 2024, Santiago de Compostela. Proceedings […]. [S. l.]: Association for Computational Linguistics, 2024. p. 627-632.

SHOHAMY, E. Language Policy: Hidden Agendas and New Approaches. London; New York: Routledge, 2006.

SIDI, W. A. Níveis de proficiência em leitura e escrita de falantes de espanhol no exame CELPE-Bras. 2002. 73p. Thesis (Master’s Degree in Letters) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2002.

SIRIANNI, G. R. Descrição dos níveis de proficiência em tarefa de leitura e escrita a partir de produções textuais de alunos do curso Preparatório Celpe-Bras. 2016. 76p. Final Paper for Undergraduate Course (B.A. in Letters) – Institute of Letters, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2016.

SIRIANNI, G. R. Entre a certificação e a não certificação no Celpe-Bras: um estudo sobre os níveis de proficiência na Parte Escrita do exame. 2020. Thesis (Master’s Degree in Letters) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2020.

SIRIANNI, G. R.; MENDEL, K.; NAGASAWA, E. Y.; SCHOFFEN, J. R. Os desdobramentos do Acervo Celpe-Bras para ensino, aprendizagem, avaliação e pesquisa em Português como Língua Adicional. BELT – Brazilian English Language Teaching Journal, v. 10, n. 1, p. 1-19, 1 Aug. 2019. EDIPUCRS. DOI: http://dx.doi.org/10.15448/2178-3640.2019.1.33233. Available at: https://lume.ufrgs.br/bitstream/handle/10183/213764/001116866.pdf?sequence=1&isAllowed=y. Accessed on: 4 July 2025.

SOMMER-FARIAS, B.; VINOKUROVA, V.; GORLOVA, A.; CENTANIN-BERTHO, M. Teaching with Learner Corpus Data. The FLTMAG, p. 1-10, Nov. 2023. DOI: http://dx.doi.org/10.17613/VSTF-WB40. Available at: https://hcommons.org/deposits/objects/hc:60290/datastreams/CONTENT/content. Accessed on: 4 July 2025.

SOSTRUZNIK, J. L. O uso de conjunções em produções escritas no exame Celpe-Bras: um estudo baseado em corpus. 2023. 76p. Final Paper for Undergraduate Course (B.A. in Letters) – Universidade Federal do Rio Grande do Sul, Porto Alegre, 2023.

SPINELLI, B.; PARIZZI, F. (ed.). Profilo della lingua italiana. Florença: La Nuova Italia, 2010.

STAPLES, S.; FERNÁNDEZ, J. Corpus Linguistics Approaches to L2 Pragmatics Research. In: TAGUCHI, N. (ed.). The Routledge Handbook of Second Language Acquisition and Pragmatics. London: Routledge, 2019. p. 241-254.

STAPLES, S.; NOVIKOV, A.; PICORAL, A.; SOMMER-FARIAS, B. Multilingual Academic Corpus of Assignments: Writing and Speech, [Tucson]: CERCLL, 2019. Available at: https://macaws.corporaproject.org/. Accessed on: 29 Aug. 2025.

STUMPF, E.; SCHOFFEN, J.; AMARAL, D.; DIVINO, L.; HANAUER, I.; LISBOA, I.; RAUPP, A.; XAVIER, B. Interrater Reliability Study of a Tagging Protocol for an L2 Corpus: The Case of CorCel. Manuscript.

TAYLOR, L. Washback and Impact. ELT Journal, v. 59, n. 2, p. 154-155, 1 Apr. 2005. Oxford University Press (OUP). DOI: http://dx.doi.org/10.1093/eltj/cci030.

TAYLOR, L.; BARKER, F. Using Corpora for Language Assessment. In: SHOHAMY E.; HORNBERGER, N. H. (ed.). Encyclopaedia of Language and Education: Language Testing and Assessment. New York: Springer, 2008. v. 7, p. 241-254.

TOSATTI, N. M. O desempenho de estudantes de Países Africanos de língua oficial portuguesa no Certificado de Proficiência em Língua Portuguesa para Estrangeiros (Celpe-Bras). 2021. 260p. Doctoral Dissertation (Ph.D. in Applied Linguistics) – Universidade Federal de Minas Gerais, Belo Horizonte, 2021.

USP. CAROLINA: Corpus Geral do Português Brasileiro Contemporâneo, v. Ada 1.2 Center for Artificial Intelligence, São Paulo: USP, 2023. Available at: https://sites.usp.br/corpuscarolina/. Accessed on: 29 Aug. 2025.

VIANA, V. Linguística de corpus: conceitos, técnicas & análises. In: TAGNIN, S.; VIANA, V. (org.). Corpora no ensino de línguas estrangeiras. São Paulo: Hub, 2011. p. 25-96.

VICENTINI, M. P. As dimensões do construto compreensão oral para produção escrita no Exame Celpe-Bras: percepções, processos, estratégias e desempenhos em examinandos. 2022. 241p. Doctoral Dissertation (Ph.D. in Applied Linguistics) – Universidade Estadual de Campinas, Campinas, 2022. Available at: https://repositorio.unicamp.br/acervo/detalhe/1253389. Accessed on: 4 July 2025.

VYATKINA, N. The Development of Second Language Writing Complexity in Groups and Individuals: A Longitudinal Learner Corpus Study. The Modern Language Journal, v. 96, n. 4, p. 576-598, Dec. 2012. DOI: https://doi.org/10.1111/j.1540-4781.2012.01401.x.

WALL, D. Washback. In: FULCHER, G.; DAVIDSON, F. The Routledge Handbook of Language Testing. London: Routledge, 2012. p. 79-92.

WALTERS, F. S. Ethics and Fairness. In: FULCHER, G.; HARDING, L. (ed.). The Routledge Handbook of Language Testing. 2nd. ed. London: Routledge, 2022. Chap. 32. p. 345-360.

WEIGLE, S. C. Assessing Writing. Cambridge: Cambridge University Press, 2002. 282p.

WISNIEWSKI, K. Empirical Learner Language and the Levels of the Common European Framework of Reference. Language Learning, Michigan, v. 67, n. 1, p. 232-253, Jun. 2017. DOI: http://dx.doi.org/10.1111/lang.12223.

YAN, Q. De práticas sociais a gêneros do discurso: uma proposta para o ensino de português para falantes de outras línguas. 2008. Thesis (Master’s Degree in Letters) – PPG-Letras, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2008.

Downloads

Publicado

09-12-2025

Edição

Seção

Número Temático - Corpus Linguistics: Studies and Applications (lançamento em 2025)