A linguagem da ciência: prospecção de dados baseados em corporas

Authors

  • Heliana Ribeiro de Mello Universidade Federal de Minas Gerais
  • Renato Rocha Souza Fundação Getúlio Vargas

DOI:

https://doi.org/10.17851/1983-3652.7.1.158-166

Keywords:

Linguística de corpus. Ferramentas computacionais. Garimpagem de dados. Processamento da linguagem natural.

Abstract

Neste artigo, discutimos brevemente a trajetória da linguística de corpus e suas aplicações aos estudos da linguagem científica. Oferecemos algumas exemplificações de ferramentas de exploração de corpora, aplicações de corpora ao estudo da linguagem científica e empregos ligando-os à garimpagem de dados e processamento da linguagem natural.

Author Biographies

  • Heliana Ribeiro de Mello, Universidade Federal de Minas Gerais
    Possui graduação em Letras pela Universidade Federal de Minas Gerais (1987), mestrado em Linguística pela Universidade Federal de Minas Gerais (1990) e pela City University of New York (1992), doutorado (1997) e pós-doutorado (1998) em Linguística pela City University of New York e pós-doutorado pela Escola de Matemática Aplicada da Fundação Getúlio Vargas (2012-2013). Atualmente é Professor Associado IV da Universidade Federal de Minas Gerais. Atua na área de Estudos Linguísticos na graduação e na pós-graduação, com ênfase em análises baseadas em corpora, relacionadas a mudanças de sistemas gramaticais e contato linguístico, semântica, sintaxe e pragmática. Seu foco em Linguística de Corpus abarca a compilação de corpora e metodologias quantitativas de análise linguística baseadas em corpora. Atua também na área de Linguística Aplicada com interesse em pesquisas empíricas e experimentais sobre aquisição de línguas e estudos da interlíngua. Dentre seus projetos de pesquisa atuais destacam-se o C-ORAL-BRASIL, o COBAI e o IMAGACT. Colabora com projeto extensionista dedicado à formação continuada para professores de línguas (EDUCONLE).
  • Renato Rocha Souza, Fundação Getúlio Vargas
    Possui graduação em Engenharia Elétrica pela Pontifícia Universidade Católica do Rio de Janeiro (1993), mestrado em Engenharia de Produção pela Universidade Federal de Santa Catarina (2000), doutorado em Ciência da Informação pela Universidade Federal de Minas Gerais (2005) e pós-doutorado (01/2009-01/2010) em Tecnologias Semânticas para Recuperação de Informação - University of Glamorgan, UK, sob supervisão de Douglas Tudhope e com bolsa do CNPQ. É atualmente professor e pesquisador da Escola de Matemática Aplicada (EMAp) da Fundação Getúlio Vargas e professor colaborador da Escola de Ciência da Informação da Universidade Federal de Minas Gerais. É Visiting Fellow da University of South Wales (2009-2014). É membro do Corpo Editorial do periódico "Knowledge Organization" e Editor Adjunto do periódico "New Review of Hypermedia and Multimedia". Tem experiência na área de Ciência da Informação, com ênfase em Representação do Conhecimento e Recuperação de Informação, atuando principalmente nos seguintes temas: Sistemas de Recuperação de Informações, Processamento de Linguagem Natural, Indexação Automática, Representação do Conhecimento, Ontologias, Gestão do Conhecimento. Tem também experiência em Tecnologia na Educação, Software Educativo e Ensino a Distância.

References

SARDINHA, Tony Berber. Lingüística de corpus: histórico e problemática. DELTA, São Paulo, v. 16, n. 2, 2000 . Available from http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0102-44502000000200005&lng=en&nrm=iso. Access on: 27 Aug. 2012.

FIRTH, J. R. Papers in Linguistics – 1934-1951. Oxford: Oxford University Press. 1957.

MCENERY, T. & A. WILSON. corpus Linguistics. Edinburgh: Edinburgh University Press. 1996.

SINCLAIR, J. corpus, Concordance, Collocation. Oxford: Oxford University Press. 1991.

Published

2014-03-22

How to Cite

A linguagem da ciência: prospecção de dados baseados em corporas. Texto Livre, Belo Horizonte-MG, v. 7, n. 1, p. 158–166, 2014. DOI: 10.17851/1983-3652.7.1.158-166. Disponível em: https://periodicos.ufmg.br/index.php/textolivre/article/view/16665. Acesso em: 26 dec. 2024.

Similar Articles

1-10 of 565

You may also start an advanced similarity search for this article.