A linguagem da ciência: prospecção de dados baseados em corporas

Autores

  • Heliana Ribeiro de Mello Universidade Federal de Minas Gerais
  • Renato Rocha Souza Fundação Getúlio Vargas

DOI:

https://doi.org/10.17851/1983-3652.7.1.158-166

Palavras-chave:

Linguística de corpus. Ferramentas computacionais. Garimpagem de dados. Processamento da linguagem natural.

Resumo

Neste artigo, discutimos brevemente a trajetória da linguística de corpus e suas aplicações aos estudos da linguagem científica. Oferecemos algumas exemplificações de ferramentas de exploração de corpora, aplicações de corpora ao estudo da linguagem científica e empregos ligando-os à garimpagem de dados e processamento da linguagem natural.

Downloads

Não há dados estatísticos.

Biografia do Autor

Heliana Ribeiro de Mello, Universidade Federal de Minas Gerais

Possui graduação em Letras pela Universidade Federal de Minas Gerais (1987), mestrado em Linguística pela Universidade Federal de Minas Gerais (1990) e pela City University of New York (1992), doutorado (1997) e pós-doutorado (1998) em Linguística pela City University of New York e pós-doutorado pela Escola de Matemática Aplicada da Fundação Getúlio Vargas (2012-2013). Atualmente é Professor Associado IV da Universidade Federal de Minas Gerais. Atua na área de Estudos Linguísticos na graduação e na pós-graduação, com ênfase em análises baseadas em corpora, relacionadas a mudanças de sistemas gramaticais e contato linguístico, semântica, sintaxe e pragmática. Seu foco em Linguística de Corpus abarca a compilação de corpora e metodologias quantitativas de análise linguística baseadas em corpora. Atua também na área de Linguística Aplicada com interesse em pesquisas empíricas e experimentais sobre aquisição de línguas e estudos da interlíngua. Dentre seus projetos de pesquisa atuais destacam-se o C-ORAL-BRASIL, o COBAI e o IMAGACT. Colabora com projeto extensionista dedicado à formação continuada para professores de línguas (EDUCONLE).

Renato Rocha Souza, Fundação Getúlio Vargas

Possui graduação em Engenharia Elétrica pela Pontifícia Universidade Católica do Rio de Janeiro (1993), mestrado em Engenharia de Produção pela Universidade Federal de Santa Catarina (2000), doutorado em Ciência da Informação pela Universidade Federal de Minas Gerais (2005) e pós-doutorado (01/2009-01/2010) em Tecnologias Semânticas para Recuperação de Informação - University of Glamorgan, UK, sob supervisão de Douglas Tudhope e com bolsa do CNPQ. É atualmente professor e pesquisador da Escola de Matemática Aplicada (EMAp) da Fundação Getúlio Vargas e professor colaborador da Escola de Ciência da Informação da Universidade Federal de Minas Gerais. É Visiting Fellow da University of South Wales (2009-2014). É membro do Corpo Editorial do periódico "Knowledge Organization" e Editor Adjunto do periódico "New Review of Hypermedia and Multimedia". Tem experiência na área de Ciência da Informação, com ênfase em Representação do Conhecimento e Recuperação de Informação, atuando principalmente nos seguintes temas: Sistemas de Recuperação de Informações, Processamento de Linguagem Natural, Indexação Automática, Representação do Conhecimento, Ontologias, Gestão do Conhecimento. Tem também experiência em Tecnologia na Educação, Software Educativo e Ensino a Distância.

Referências

SARDINHA, Tony Berber. Lingüística de corpus: histórico e problemática. DELTA, São Paulo, v. 16, n. 2, 2000 . Available from http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0102-44502000000200005&lng=en&nrm=iso. Access on: 27 Aug. 2012.

FIRTH, J. R. Papers in Linguistics – 1934-1951. Oxford: Oxford University Press. 1957.

MCENERY, T. & A. WILSON. corpus Linguistics. Edinburgh: Edinburgh University Press. 1996.

SINCLAIR, J. corpus, Concordance, Collocation. Oxford: Oxford University Press. 1991.

Downloads

Publicado

22-03-2014

Como Citar

MELLO, H. R. de; SOUZA, R. R. A linguagem da ciência: prospecção de dados baseados em corporas. Texto Livre, Belo Horizonte-MG, v. 7, n. 1, p. 158–166, 2014. DOI: 10.17851/1983-3652.7.1.158-166. Disponível em: https://periodicos.ufmg.br/index.php/textolivre/article/view/16665. Acesso em: 26 abr. 2024.