Corpus  CEFALA-1: Base de dados audiovisual de locutores para estudos de biometria, fonética e fonologia / Corpus CEFALA-1: Audiovisual Database of Speakers  for Biometric, Phonetic and Phonology Studies

Arlindo Follador Neto; Adelino Pinheiro Silva; Hani Camille Yehia

doi:10.17851/2237-2083.27.1.191-212

Authors

Arlindo Follador Neto Universidade Federal dos Vales do Jequitinhonha e Mucuri
Adelino Pinheiro Silva Instituto de Criminalística de Minas Gerais
Hani Camille Yehia Universidade Federal de Minas Gerais

DOI:

https://doi.org/10.17851/2237-2083.27.1.191-212

Keywords:

corpus de locutores, biometria, fonética e fonologia, base de dados audiovisual, corpus of speakers, biometry, phonetics and phonology, audiovisual database.

Abstract

Resumo: A fala humana tem sido estudada em diferentes áreas do conhecimento, as quais incluem desde biometria até fonética e fonologia. Nas pesquisas realizadas em tais áreas, amostras da fala são recursos necessários para a obtenção de resultados e validação de hipóteses. Para isso, amostras de diferentes locutores e conteúdos são armazenadas em arquivos de áudio e organizadas em bases de dados. Tais bases de dados permitem a continuidade, praticidade e confiabilidade de pesquisas, eliminando a difícil e demorada etapa de coleta de dados. Além disso, permitem comparações consistentes entre estudos diferentes. Entretanto, bases de acesso livre na língua portuguesa ou gravadas em ambiente controlado são raramente encontradas. Dessa forma, o objetivo deste trabalho foi construir uma base de dados pública e gratuita do português brasileiro, nomeada Corpus CEFALA-1. A base de dados reúne 104 locutores orientados por um protocolo específico para coleta de amostras audiovisuais de fala gravadas em estúdio. Este trabalho apresenta as metodologias de processamento, segmentação e organização às quais as amostras de fala foram submetidas, além de análises estatísticas, aplicação à verificação biométrica e análises fonético-fonológicas preliminares do corpus.

Palavras-chave: corpus de locutores; biometria; fonética e fonologia; base de dados audiovisual.

Abstract: Human speech has been studied in different areas of knowledge, which range from biometry to phonetics and phonology. In research conducted in such areas, speech samples are necessary resources for obtaining results and validating hypotheses. For this, samples of different speakers and contents are stored in audio files and organized into databases. Such databases allow the continuity, practicality and reliability of studies, eliminating the difficult and time consuming step of data collection. Moreover, they allow consistent comparisons between different studies. However, free access databases in the Portuguese language or recorded in controlled environments are rarely found. The objective of this paper is to construct a free and public database of Brazilian Portuguese, named Corpus CEFALA-1. The database comprises 104 speakers guided by a specific protocol for the collection of audiovisual speech samples recorded in a studio. The paper presents the methodologies for processing, segmentation and organization of speech samples, statistical analysis, application to biometric verification and preliminary phonetic-phonological analyses.

Keywords: corpus of speakers; biometry; phonetics and phonology; audiovisual database.

Downloads

Download data is not yet available.

Author Biographies

Arlindo Follador Neto, Universidade Federal dos Vales do Jequitinhonha e Mucuri

Instituto de Ciência e Tecnologia
CEFALA - Centro de Estudos da Fala, Acústica, Linguagem e Música

Professor

Adelino Pinheiro Silva, Instituto de Criminalística de Minas Gerais

Seção de Engenharia Legal

CEFALA - Centro de Estudos da Fala, Acústica, Linguagem e Música

Perito

Hani Camille Yehia, Universidade Federal de Minas Gerais

Hani Camille Yehia holds the degree of Electronics Engineer (ITA, 1988), Master of Electronics Engineering and Computer Science (ITA, 1992) and Doctor of Electrical Engineering (Nagoya University, Japan 1997). From 1996 to 1998 he held the position of researcher at the ATR Laboratories (Japan). He was the dean of the Graduate Program in Electrical Engineering from 2005 to 2009, head of the Graduate Program Concil of the School of Engineering of UFMG from 2007 to 2009, and head of the technology incubator INOVA-UFMG from 2011 to 2013. From 2013 to 2014, he was resident professor at the UFMG Institute of Advanced Transdisciplinary Studies. Currently, he holds the position of Full Professor at the UFMG Department of Electronics Engineering and is the coordinator of the Undergraduate Course in Electrical Engineering and head of CEFALA - Center for Research on Speech, Acoustics, Language and Music.

Corpus CEFALA-1: Base de dados audiovisual de locutores para estudos de biometria, fonética e fonologia / Corpus CEFALA-1: Audiovisual Database of Speakers for Biometric, Phonetic and Phonology Studies

Authors

DOI:

Keywords:

Abstract

Downloads

Author Biographies

Arlindo Follador Neto, Universidade Federal dos Vales do Jequitinhonha e Mucuri

Adelino Pinheiro Silva, Instituto de Criminalística de Minas Gerais

Hani Camille Yehia, Universidade Federal de Minas Gerais

Downloads

Published

How to Cite

Issue

Section

Current Issue

Information

Language