Alimentação de um banco de dados do Semiofon, via corpus NILC/São Carlos, com palavras cujas vogais médias se encontram em posição tônica nas palavras

Autores

  • Adelma Araújo Universidade Federal de Minas Gerais
  • Ana Cristina Fricke Matte Universidade Federal de Minas Gerais

DOI:

https://doi.org/10.17851/1983-3652.2.2.11-19

Palavras-chave:

Corpus NILC/São Carlos. Vogais médias. Transcrição fonológica letra-fonema.

Resumo

Neste trabalho, apresentamos como recursos da web são usados em uma pesquisa sobre vogais médias desenvolvida pelo grupo SEMIOFON. Inicialmente, apresentamos brevemente o corpus NILC/São Carlos. Em seguida, detalhamos as etapas da pesquisa desde a coleta dos dados até a transcrição fonológica dos dados seguindo a conversão letra-fonema de Albano & Moreira (1996).

Downloads

Não há dados estatísticos.

Biografia do Autor

Adelma Araújo, Universidade Federal de Minas Gerais

doutoranda em Estudos Linguísticos na Faculdade de Letras da Universidade Federal de Minas Gerais.

Ana Cristina Fricke Matte, Universidade Federal de Minas Gerais

Professora da Faculdade de Letras da Universidade Federal de Minas Gerais.

Referências

ALBANO. E. & MOREIRA, A.A. Archisegment-based letter-to-phone conversion for concatenative speech synthesis in Portuguese. In: International Conference on Spoken Language Processing, 1996, Filadelfia. Proceedings ICSLP 96. Filadelfia - EUA, 1996. v. 3. p. 1208-1711. Disponível em: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.16.3931. Acessado em

de setembro de 2009.

BICK, Eckhard. The Parsing System "Palavras": Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Dr. Phil. Thesis. Aarhus University. Aarhus, Denmark: Aarhus University Press. November 2000.

MATTE, A; MEIRELES, A; FAGUAS, C. SIÇWeb – syllabic -accentual phonological parser of witten texts. Rev. Est. Ling., v.14, n.1, p.31-50, jan./jun.2006.

ROCHA, Paulo Alexandre & SANTOS, Diana. "CETEMPúblico: Um corpus de grandes dimensões de linguagem jornalística portuguesa". In Maria das Graças Volpe Nunes (ed.), V Encontro para o processamento computacional da língua portuguesa escrita e falada (PROPOR 2000) (São Paulo, Brasil, 19-22 de Novembro de 2000), São Paulo : ICMC/USP, p. 131-140.

SANTOS, Diana. O projecto Processamento Computacional do Português: Balanço e perspectivas. In: Maria das Graças Volpe Nunes (ed.). V Encontro para o processamento computacional da língua portuguesa escrita e falada (PROPOR 2000) (São Paulo, Brasil, 19-22 de Novembro de 2000), São Paulo : ICMC/USP, pp. 105-113, 2000. Disponível em: http://www.linguateca.pt/documentos/SantosPROPOR2000.pdf. Acessado em 10 de setembro de 2009.

OKSEFJELL, Signe & SANTOS, Diana. Breve panorâmica dos recursos de português mencionados na Web. In: Lima, V. L. S. de (ed.). III Encontro para o Processamento Computacional do Português Escrito e Falado (PROPOR'98), Porto Alegre, RS, 3-4 de Novembro de 1998, p. 38-47.

PINHEIRO, G. M & ALUÍSIO, S.M. Córpus Nilc: descrição e análise crítica com vistas ao projeto Lacio-Web. NILC-TR-03-03, fevereiro 2003.

ROCHA, P. A & SANTOS, D. CETEM Público: Um corpus de grandes dimensões de linguagem jornalística portuguesa. In: NUNES, M. G. V. (ed.). V Encontro para o processamento computacional da língua portuguesa escrita e falada (PROPOR 2000), São Paulo, ICMC/USP, p. 131-140, 19-22 de Novembro de 2000. Disponível em: http://

http://www.linguateca.pt/documentos/RochaSantosPROPOR2000.pdf. Acesso em: 13 de setembro de 2009.

SANTOS, Diana & COSTA, Luís. A Linguateca e o projecto Processamento Computacional do português. Terminómetro - A terminologia em Portugal e nos países de língua portuguesa em África, nº 7, 2005, p. 63-69. Disponível em:

http:///www.linguateca.pt/documentos/SantosCostaTerminometro2005.pdf. Acesso em: 13 de setembro de 2009.

SANTOS, Diana & BICK, Eckhard. Providing internet access to portuguese corpora: the AC/DC project. In: GAVRILIDOU, M; CARAYANNIS, G; MARKANTONATOU, S; PIPERIDIS, S; STAINHAUER, G. (eds.). Proceedings of the Second International Conference on Language Resources and Evaluation (LREC 2000), Atenas, Grécia, 31 de Maio a 2 de Junho de 2000, p. 205- 210. Disponível em: http://www.linguateca.pt/documentos/SantosBickLREC2000.pdf. Acesso em: 14 de setembro de 2009.

SARDINHA, Tony Berber. Linguística de Corpus. Barueri, SP: Editora Manole, 2004.

Downloads

Arquivos adicionais

Publicado

27-08-2011

Como Citar

ARAÚJO, A.; MATTE, A. C. F. Alimentação de um banco de dados do Semiofon, via corpus NILC/São Carlos, com palavras cujas vogais médias se encontram em posição tônica nas palavras. Texto Livre, Belo Horizonte-MG, v. 2, n. 2, p. 11–19, 2011. DOI: 10.17851/1983-3652.2.2.11-19. Disponível em: https://periodicos.ufmg.br/index.php/textolivre/article/view/16566. Acesso em: 29 mar. 2024.

Edição

Seção

Linguística e Tecnologia