Alimentação de um banco de dados do Semiofon, via corpus NILC/São Carlos, com palavras cujas vogais médias se encontram em posição tônica nas palavras

Autores/as

  • Adelma Araújo Universidade Federal de Minas Gerais
  • Ana Cristina Fricke Matte Universidade Federal de Minas Gerais

DOI:

https://doi.org/10.17851/1983-3652.2.2.11-19

Palabras clave:

Corpus NILC/São Carlos. Vogais médias. Transcrição fonológica letra-fonema.

Resumen

Neste trabalho, apresentamos como recursos da web são usados em uma pesquisa sobre vogais médias desenvolvida pelo grupo SEMIOFON. Inicialmente, apresentamos brevemente o corpus NILC/São Carlos. Em seguida, detalhamos as etapas da pesquisa desde a coleta dos dados até a transcrição fonológica dos dados seguindo a conversão letra-fonema de Albano & Moreira (1996).

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Adelma Araújo, Universidade Federal de Minas Gerais

doutoranda em Estudos Linguísticos na Faculdade de Letras da Universidade Federal de Minas Gerais.

Ana Cristina Fricke Matte, Universidade Federal de Minas Gerais

Professora da Faculdade de Letras da Universidade Federal de Minas Gerais.

Citas

ALBANO. E. & MOREIRA, A.A. Archisegment-based letter-to-phone conversion for concatenative speech synthesis in Portuguese. In: International Conference on Spoken Language Processing, 1996, Filadelfia. Proceedings ICSLP 96. Filadelfia - EUA, 1996. v. 3. p. 1208-1711. Disponível em: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.16.3931. Acessado em

de setembro de 2009.

BICK, Eckhard. The Parsing System "Palavras": Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Dr. Phil. Thesis. Aarhus University. Aarhus, Denmark: Aarhus University Press. November 2000.

MATTE, A; MEIRELES, A; FAGUAS, C. SIÇWeb – syllabic -accentual phonological parser of witten texts. Rev. Est. Ling., v.14, n.1, p.31-50, jan./jun.2006.

ROCHA, Paulo Alexandre & SANTOS, Diana. "CETEMPúblico: Um corpus de grandes dimensões de linguagem jornalística portuguesa". In Maria das Graças Volpe Nunes (ed.), V Encontro para o processamento computacional da língua portuguesa escrita e falada (PROPOR 2000) (São Paulo, Brasil, 19-22 de Novembro de 2000), São Paulo : ICMC/USP, p. 131-140.

SANTOS, Diana. O projecto Processamento Computacional do Português: Balanço e perspectivas. In: Maria das Graças Volpe Nunes (ed.). V Encontro para o processamento computacional da língua portuguesa escrita e falada (PROPOR 2000) (São Paulo, Brasil, 19-22 de Novembro de 2000), São Paulo : ICMC/USP, pp. 105-113, 2000. Disponível em: http://www.linguateca.pt/documentos/SantosPROPOR2000.pdf. Acessado em 10 de setembro de 2009.

OKSEFJELL, Signe & SANTOS, Diana. Breve panorâmica dos recursos de português mencionados na Web. In: Lima, V. L. S. de (ed.). III Encontro para o Processamento Computacional do Português Escrito e Falado (PROPOR'98), Porto Alegre, RS, 3-4 de Novembro de 1998, p. 38-47.

PINHEIRO, G. M & ALUÍSIO, S.M. Córpus Nilc: descrição e análise crítica com vistas ao projeto Lacio-Web. NILC-TR-03-03, fevereiro 2003.

ROCHA, P. A & SANTOS, D. CETEM Público: Um corpus de grandes dimensões de linguagem jornalística portuguesa. In: NUNES, M. G. V. (ed.). V Encontro para o processamento computacional da língua portuguesa escrita e falada (PROPOR 2000), São Paulo, ICMC/USP, p. 131-140, 19-22 de Novembro de 2000. Disponível em: http://

http://www.linguateca.pt/documentos/RochaSantosPROPOR2000.pdf. Acesso em: 13 de setembro de 2009.

SANTOS, Diana & COSTA, Luís. A Linguateca e o projecto Processamento Computacional do português. Terminómetro - A terminologia em Portugal e nos países de língua portuguesa em África, nº 7, 2005, p. 63-69. Disponível em:

http:///www.linguateca.pt/documentos/SantosCostaTerminometro2005.pdf. Acesso em: 13 de setembro de 2009.

SANTOS, Diana & BICK, Eckhard. Providing internet access to portuguese corpora: the AC/DC project. In: GAVRILIDOU, M; CARAYANNIS, G; MARKANTONATOU, S; PIPERIDIS, S; STAINHAUER, G. (eds.). Proceedings of the Second International Conference on Language Resources and Evaluation (LREC 2000), Atenas, Grécia, 31 de Maio a 2 de Junho de 2000, p. 205- 210. Disponível em: http://www.linguateca.pt/documentos/SantosBickLREC2000.pdf. Acesso em: 14 de setembro de 2009.

SARDINHA, Tony Berber. Linguística de Corpus. Barueri, SP: Editora Manole, 2004.

Publicado

27-08-2011

Cómo citar

ARAÚJO, A.; MATTE, A. C. F. Alimentação de um banco de dados do Semiofon, via corpus NILC/São Carlos, com palavras cujas vogais médias se encontram em posição tônica nas palavras. Texto Livre, Belo Horizonte-MG, v. 2, n. 2, p. 11–19, 2011. DOI: 10.17851/1983-3652.2.2.11-19. Disponível em: https://periodicos.ufmg.br/index.php/textolivre/article/view/16566. Acesso em: 22 nov. 2024.

Número

Sección

Lingüística y Tecnología

Artículos más leídos del mismo autor/a

1 2 > >>