Corpus Multilíngue sobre Migração e Refúgio (COMMIRE)
planejamento, compilação e conteúdo, em linhas gerais
DOI:
https://doi.org/10.35699/1983-3652.2022.36965Palavras-chave:
Compilação de corpora, Corpus especializado, Terminologia direcionada por corpus, Corpus multilíngue, Migração e refúgioResumo
Nos últimos anos, o mundo tem enfrentado uma crise migratória sem precedentes. O grupo de pesquisa "Mobilidades e contatos de línguas" (MOBILANG), da Universidade de Brasília, dedicado ao estudo da língua em contextos de migração e refúgio, identificou que a barreira linguística é a maior dificuldade que os migrantes enfrentam para acessar serviços básicos no Brasil. Para mitigar esse problema, o grupo planejou a criação de um glossário multilíngue direcionado por corpus sobre o tema, voltado para tradutores, intérpretes, pessoas que trabalham na área e migrantes. O projeto é fruto de uma parceria com o grupo "Terminologia e Tradução Direcionadas por Corpus" (TermiTraDiCo), além de receber o apoio da Cátedra UNESCO em Políticas Linguísticas para o Multilinguismo. A primeira etapa consistiu na compilação de um corpus eletrônico robusto para servir de base para o glossário. Este artigo tem o objetivo de descrever o planejamento, a compilação e as principais características desse corpus, batizado Corpus Multilíngue sobre Migração e Refúgio – COMMIRE, um corpus médio-grande contendo textos comparáveis (e alguns paralelos) em português brasileiro, espanhol, francês e inglês.
Referências
BERBER SARDINHA, T. Linguística de corpus. Barueri: Editora Manole, 2004.
BOWKER, L.; CORPAS PASTOR, G. Translation Technology. In: MITKOV, R. (Ed.). The Oxford Handbook of Computational Linguistics 2nd edition. [S.l.]: Oxford University Press, Mar. 2015. Available from: https://oxfordhandbooks.com/view/10.1093/oxfordhb/9780199573691.001.0001/oxfordhb-9780199573691-e-007. Visited on: 26 Mar. 2022.
BOWKER, L.; PEARSON, J. Working with Specialized Language: A Practical Guide to Using Corpora. UK ed. edição. London ; New York: Taylor & Francis Ltd, 2002.
CASTELLS, M. A galáxia da Internet: reflexões sobre a Internet, os negócios e a sociedade. Rio de Janeiro: Jorge Zahar Ed., 2003.
DALE, R. Automated Writing Assistance. In: MITKOV, R.; DALE, R. (Eds.). The Oxford Handbook of Computational Linguistics 2nd edition. [S.l.]: Oxford University Press, May 2014. Available from: http://oxfordhandbooks.com/view/10.1093/oxfordhb/9780199573691.001.0001/oxfordhb-9780199573691-e-019. Visited on: 26 Mar. 2022.
FROMM, G. et al. Wordsmith Tools e Sketch Engine: um estudo analítico-comparativo para pesquisas científicas com uso de corpora / Wordsmith Tools and Sketch Engine: an analytical-comparative study for scientific research with corpora manipulation. Revista de Estudos da Linguagem, v. 28, n. 3, p. 1191–1248, May 2020. DOI: 10.17851/2237-2083.28.3.1191-1248. Available from: http://www.periodicos.letras.ufmg.br/index.php/relin/article/view/15766. Visited on: 26 Mar. 2022.
FURTADO, A. B. D. Glossário Multilíngue Online sobre Migração e Refúgio: uma proposta para tradutores e intérpretes. 2019. Undergraduate thesis (Bachelor in Foreign Languages Applied to Multilingualism and the Information Society) – University of Brasilia, Institute of Letters, Department of Foreign Languages and Translation, Brasília. Available from: https://bdm.unb.br/handle/10483/23240. Visited on: 26 Mar. 2022.
FURTADO, A. B. D.; GOROVITZ, S. Primeiros passos para a compilação de um corpus terminológico sobre situações de mobilidade: Coleta e análise de duas cartilhas informativas multilíngues. In: ANAIS do 23º Congresso de Iniciação Científica da Unb e 14º do DF. Brasília: [s.n.], 2017. Available from: https://conferencias.unb.br/index.php/iniciacaocientifica/23cicunb14df/paper/view/9170. Visited on: 26 Mar. 2022.
FURTADO, A. B. D.; TEIXEIRA, E. D. Compilação de um Banco Multilíngue de Acolhimento a Pessoas Refugiadas. In: PROCEEDINGS of the XII Symposium in Information and Human Language Technology and Collocates Events. Salvador: [s.n.], Oct. 2019. Available from: http://comissoes.sbc.org.br/ce-pln/stil2019/proceedings-stil-2019-Final-Publicacao.pdf. Visited on: 26 Mar. 2022.
FURTADO, A. B. D.; TEIXEIRA, E. D. Compilação de um Corpus Comparável Multilíngue de Migração e Refúgio. In: ANAIS do 25º Congresso de Iniciação Científica da UNB e 16º Congresso de Iniciação Científica do DF. Brasília: [s.n.], 2019. Available from: https://conferencias.unb.br/index.php/iniciacaocientifica/25CICUnB16df/paper/view/19444. Visited on: 26 Mar. 2022.
GARCIA, F. de D. O papel do intérprete comunitário na entrevista de solicitação de refúgio. Feb. 2019. Master Thesis (Masters in Translation Studies) – University of Brasilia, Department of Foreign Languages and Translation, Brasília. Available from: https://repositorio.unb.br/handle/10482/35323. Visited on: 26 Mar. 2022.
HALLIDAY, M. A. K. Corpus studies and probabilistic grammar. In: AIJMER, K.; ALTENBERG, B. (Eds.). English corpus linguistics. London: Longman, 1991. p. 30–43. DOI: 10.4324/9781315845890. Available from: https://www.taylorfrancis.com/books/9781317899242. Visited on: 26 Mar. 2022.
HALLIDAY, M. A. K. Language as system and language as instance: The corpus as a theoretical construct. In: SVARTVIK, J. (Ed.). Directions in Corpus Linguistics. Berlin, New York: De Gruyter, Jan. 1992. DOI: 10.1515/9783110867275.61. Available from: https://www.degruyter.com/document/doi/10.1515/9783110867275.61/html. Visited on: 26 Mar. 2022.
HOFFMAN, C. The spread of English and the growth of multilingualism with English in Europe. In: CENOZ, J.; JESSNER, U. (Eds.). English in Europe: The Acquisition of a Third Language. Clevedon: Multilingual Matters, 2000. p. 1–21.
JOHNS, T. Micro-concord: A language learner’s research tool. System, v. 14, n. 2, p. 151–162, 1986. DOI: 10.1016/0346-251X(86)90004-7. Available from: https://linkinghub.elsevier.com/retrieve/pii/0346251X86900047. Visited on: 26 Mar. 2022.
JURAFSKY, D.; MARTIN, J. H. Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition. 2nd ed. Upper Saddle River, N.J: Pearson Prentice Hall, 2009. (Prentice Hall series in artificial intelligence).
KILGARRIFF, A.; BAISA, V., et al. The Sketch Engine. [S.l.: s.n.], 2021. Available from: http://www.sketchengine.eu/. Visited on: 26 Mar. 2022.
KILGARRIFF, A.; RYCHLY, P., et al. The Sketch Engine. Information Technology, v. 1, n. 1, p. 7–36, 2004. Available from: https://www.sketchengine.eu/wp-content/uploads/The_Sketch_Engine_2004.pdf. Visited on: 26 Mar. 2022.
LAMEL, L.; GAUVAIN, J.-L. Speech Recognition. Ed. by R. Mitkov. [S.l.]: Oxford University Press, Sept. 2014. v. 1. DOI: 10.1093/oxfordhb/9780199276349.013.0016. Available from: http://oxfordhandbooks.com/view/10.1093/oxfordhb/9780199276349.001.0001/oxfordhb-9780199276349-e-16. Visited on: 26 Mar. 2022.
MCENERY, T.; HARDIE, A. Corpus linguistics: method, theory and practice. Cambridge ; New York: Cambridge University Press, 2012. (Cambridge textbooks in linguistics).
POIBEAU, T. Machine translation. [S.l.]: MIT Press, 2017.
PRAGER, J. Question Answering. In: MITKOV, R. (Ed.). The Oxford Handbook of Computational Linguistics 2nd edition. [S.l.]: Oxford University Press, May 2014. DOI: 10.1093/oxfordhb/9780199573691.013.003. Available from: https://oxfordhandbooks.com/view/10.1093/oxfordhb/9780199573691.001.0001/oxfordhb-9780199573691-e-003. Visited on: 26 Mar. 2022.
RICO PEREZ, C. From hacker spirit to collaborative terminology: Resourcefulness in humanitarian work. Translation Spaces, v. 2, p. 19–36, Nov. 2013. DOI: 10.1075/ts.2.02ric. Available from: http://www.jbe-platform.com/content/journals/10.1075/ts.2.02ric. Visited on: 26 Mar. 2022.
RICO PEREZ, C. Tecnologías de la traducción para la mediación intercultural. Lengua y Migración, v. 3, n. 1, p. 115–129, 2010. Available from: http://lym.linguas.net/Download.axd?type=ArticleItem&id=92. Visited on: 26 Mar. 2022.
RODRÍGUEZ MARTÍNEZ, M. C. Extracción de contextos definitorios de tecnologías biomédicas en corpus especializado francés. Mutatis Mutandis. Revista Latinoamericana de Traducción, v. 14, n. 2, p. 509–526, July 2021. DOI: 10.17533/udea.mut.v14n2a11. Available from: https://revistas.udea.edu.co/index.php/mutatismutandis/article/view/345123. Visited on: 3 May 2022.
SÁNCHEZ RAMOS, M. del M. Corpus paralelos y traducción especializada: ejemplificación de diseño, compilación y alineación de un corpus paralelo bilingüe (inglés-español) para la traducción jurídica. Lebende Sprachen, v. 64, n. 2, p. 269–285, Nov. 2019. DOI: 10.1515/les-2019-0015. Available from: https://www.degruyter.com/document/doi/10.1515/les-2019-0015/html. Visited on: 26 Mar. 2022.
SÁNCHEZ RAMOS, M. del M. Documentación digital y léxico en la traducción e interpretación en los servicios públicos (TISP): fundamentos teóricos y prácticos. Berlin, Germany: Peter Lang Verlag, Feb. 2020. Available from: https://www.peterlang.com/document/1111377. Visited on: 26 Mar. 2022.
SEGHIRI, M. Metodología protocolizada de compilación de un corpus de seguros de viajes: aspectos de diseño y representatividad. RLA. Revista de lingüística teórica y aplicada, v. 49, n. 2, p. 13–30, 2011. DOI: 10.4067/S0718-48832011000200002. Available from: http://www.scielo.cl/scielo.php?script=sci_abstract&pid=S0718-48832011000200002&lng=en&nrm=iso&tlng=en. Visited on: 26 Mar. 2022.
SEGHIRI, M. Too Big or Not Too Big: Establishing the Minimum Size for a Legal Ad Hoc Corpus. HERMES - Journal of Language and Communication in Business, v. 27, n. 53, p. 85, Dec. 2014. DOI: 10.7146/hjlcb.v27i53.20981. Available from: https://tidsskrift.dk/her/article/view/20981. Visited on: 26 Mar. 2022.
SILVA, G. J. et al. Refúgio em Números - Portal de Imigração Laboral, 6ª Edição. [S.l.: s.n.], 2021. Available from: https://portaldeimigracao.mj.gov.br/pt/dados/refugio-em-numeros. Visited on: 26 Mar. 2022.
TAGNIN, S. A produção de glossários direcionados pelo corpus e orientados ao tradutor como metodologia de formação de tradutores. In: ANAIS do X Encontro Nacional de Tradutores e IX Encontro Internacional de Tradutores. Ouro Preto: [s.n.], 2009.
TAGNIN, S. Corpora na e para a tradução. In: VIANA, V.; TAGNIN, S. (Eds.). Corpora na Tradução. São Paulo: Hub Editorial, 2015.
TAGNIN, S.; TEIXEIRA, E. D. Translator-oriented, corpus-driven technical glossaries: the case of cooking terms. Corpora, v. 7, n. 1, p. 51–67, 2012. DOI: 10.3366/cor.2012.0017. Available from: https://www.euppublishing.com/doi/10.3366/cor.2012.0017. Visited on: 26 Mar. 2022.
TEIXEIRA, E. D. A lingüística de corpus a serviço do tradutor: proposta de um dicionário de culinária voltado para a produção textual. Dec. 2008. Doctoral Dissertation (PhD in English Literature and Linguistics Studies) – Universidade de São Paulo. DOI: 10.11606/T.8.2008.tde-16022009-141747. Available from: http://www.teses.usp.br/teses/disponiveis/8/8147/tde-16022009-141747/. Visited on: 26 Mar. 2022.
Downloads
Publicado
Edição
Seção
Licença
Copyright (c) 2022 Anna Beatriz Dimas Furtado, Elisa Duarte Teixeira
Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Este é um artigo em acesso aberto que permite o uso irrestrito, a distribuição e reprodução em qualquer meio desde que o artigo original seja devidamente citado.