Extração de relações hiponímicas em um corpus de língua portuguesa

Authors

  • Pablo Neves Machado PUCRS
  • Vera Lúcia Strube de Lima Pontifícia Universidade Católica do Rio Grande do Sul

DOI:

https://doi.org/10.17851/2237-2083.23.3.599-640

Keywords:

Processamento da Linguagem Natural, Relações semânticas, Linguística de corpus

Abstract

Resumo: As relações hiponímicas são importantes na construção de estruturas de conhecimento, tais como ontologias ou taxonomias, para melhorar o processo de busca. O presente trabalho estuda em detalhe padrões para extração de relações hiponímicas com base em um corpus de língua portuguesa. Para tanto, toma como base os padrões específicos propostos por Hearst (1992), Freitas e Quental (2007) e Taba e Caseli (2014). Constrói, a partir desses padrões, regras que alimentam um protótipo, o qual as aplica a um corpus e extrai, como resultado, relações hiponímicas. Avaliadores humanos avaliam as relações extraídas, utilizando a escala proposta por Freitas e Quental. A precisão das extrações é compatível com as da literatura. O trabalho ainda apresenta um minucioso estudo quanto à produtividade dos padrões e quanto à avaliação das extrações.

Palavras-chave: relações hiponímicas; extração de relações; padrões de extração de relações.

Abstract: Hyponym relations are important in the building of knowledge structures such as ontologies or taxonomies to enhance the search process. This work studies patterns for extraction of hyponym relations from a specific Portuguese language corpus. It starts from selected patterns proposed by Hearst (1992), Freitas and Quental (2007), and Taba and Caseli (2014). From these patterns, it builds up rules that feed a prototype. This prototype applies them to the corpus and extracts, as a result, hyponym relations. Human evaluators assess the extracted relations, using the scale proposed by Freitas and Quental. Precision of the extractions is consistent with the literature. The paper also describes a detailed study on the productivity of the patterns and the assessment of the extractions.

Keywords: Hyponym Relations; Relation Extraction; Relation Extraction Patterns.

Author Biography

  • Vera Lúcia Strube de Lima, Pontifícia Universidade Católica do Rio Grande do Sul
    Professora Titular da Faculdade de Informática da PUCRS. Doutora em Informática pela Université Joseph Fourier, Grenoble, França, 1990. Área de pesquisa: Processamento da Linguagem Natural.

Published

2015-12-22

Issue

Section

Corpus Linguistics

How to Cite

Extração de relações hiponímicas em um corpus de língua portuguesa. Revista de Estudos da Linguagem, [S. l.], v. 23, n. 3, p. 599–640, 2015. DOI: 10.17851/2237-2083.23.3.599-640. Disponível em: https://periodicos.ufmg.br/index.php/relin/article/view/28449. Acesso em: 24 dec. 2025.