O léxico do corpo e anotação de sentidos em grandes corpora: o projeto Esqueleto

Autores/as

  • Cláudia Freitas PUC-Rio
  • Diana Santos UiO (Universidade de Oslo)
  • Cristina Mota Linguateca
  • Bruno Carriço PUC-Rio
  • Heidi Jansen UiO (Universidade de Oslo)

DOI:

https://doi.org/10.17851/2237-2083.23.3.641-680

Palabras clave:

Human Body, Lexicon, Sense Annotation, Corpus Linguistics, Portuguese.

Resumen

Resumo: Apresentamos aqui os resultados iniciais de um amplo estudo sobre o léxico do corpo humano e os seus sentidos, realizado por meio da anotação e revisão de corpora de grandes  dimensões. Ao longo do artigo explicitamos as decisões linguísticas subjacentes à anotação, relatamos o resultado de um estudo sobre as classes de anotação e exploramos o vasto material criado: um corpus de entrevistas (1,4 milhão de palavras) e um corpus literário (1,2 milhão de palavras) anotados e integralmente revistos, e demais corpora do projeto, parcialmente revistos. Todo o material está publicamente disponível para a comunidade.

Palavras-chave: corpo humano; léxico; anotação semântica; corpus; descrição do português.

Abstract: This paper presents the first results of a broad study regarding the lexicon of the human body. The study was based on the annotation of large corpora of Portuguese language. We explain the linguistic annotation choices, present the results of an agreement study and explore the material made available: a corpus of interviews (1.4 million words) and a literary corpus (1.2 million words) full annotated and revised, and the remained corpora partially revised. The whole material is publicly available.

Keywords: Human Body; Lexicon; Sense Annotation; Corpus Linguistics; Portuguese.

Publicado

2015-12-22

Número

Sección

Linguística de Corpus

Cómo citar

O léxico do corpo e anotação de sentidos em grandes corpora: o projeto Esqueleto. Revista de Estudos da Linguagem, [S. l.], v. 23, n. 3, p. 641–680, 2015. DOI: 10.17851/2237-2083.23.3.641-680. Disponível em: https://periodicos.ufmg.br/index.php/relin/article/view/28448. Acesso em: 24 dec. 2025.