Alimentação de um banco de dados do Semiofon, via corpus NILC/São Carlos, com palavras cujas vogais médias se encontram em posição tônica nas palavras
DOI:
https://doi.org/10.17851/1983-3652.2.2.11-19Palavras-chave:
Corpus NILC/São Carlos. Vogais médias. Transcrição fonológica letra-fonema.Resumo
Neste trabalho, apresentamos como recursos da web são usados em uma pesquisa sobre vogais médias desenvolvida pelo grupo SEMIOFON. Inicialmente, apresentamos brevemente o corpus NILC/São Carlos. Em seguida, detalhamos as etapas da pesquisa desde a coleta dos dados até a transcrição fonológica dos dados seguindo a conversão letra-fonema de Albano & Moreira (1996).
Downloads
Referências
ALBANO. E. & MOREIRA, A.A. Archisegment-based letter-to-phone conversion for concatenative speech synthesis in Portuguese. In: International Conference on Spoken Language Processing, 1996, Filadelfia. Proceedings ICSLP 96. Filadelfia - EUA, 1996. v. 3. p. 1208-1711. Disponível em: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.16.3931. Acessado em
de setembro de 2009.
BICK, Eckhard. The Parsing System "Palavras": Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Dr. Phil. Thesis. Aarhus University. Aarhus, Denmark: Aarhus University Press. November 2000.
MATTE, A; MEIRELES, A; FAGUAS, C. SIÇWeb – syllabic -accentual phonological parser of witten texts. Rev. Est. Ling., v.14, n.1, p.31-50, jan./jun.2006.
ROCHA, Paulo Alexandre & SANTOS, Diana. "CETEMPúblico: Um corpus de grandes dimensões de linguagem jornalística portuguesa". In Maria das Graças Volpe Nunes (ed.), V Encontro para o processamento computacional da língua portuguesa escrita e falada (PROPOR 2000) (São Paulo, Brasil, 19-22 de Novembro de 2000), São Paulo : ICMC/USP, p. 131-140.
SANTOS, Diana. O projecto Processamento Computacional do Português: Balanço e perspectivas. In: Maria das Graças Volpe Nunes (ed.). V Encontro para o processamento computacional da língua portuguesa escrita e falada (PROPOR 2000) (São Paulo, Brasil, 19-22 de Novembro de 2000), São Paulo : ICMC/USP, pp. 105-113, 2000. Disponível em: http://www.linguateca.pt/documentos/SantosPROPOR2000.pdf. Acessado em 10 de setembro de 2009.
OKSEFJELL, Signe & SANTOS, Diana. Breve panorâmica dos recursos de português mencionados na Web. In: Lima, V. L. S. de (ed.). III Encontro para o Processamento Computacional do Português Escrito e Falado (PROPOR'98), Porto Alegre, RS, 3-4 de Novembro de 1998, p. 38-47.
PINHEIRO, G. M & ALUÍSIO, S.M. Córpus Nilc: descrição e análise crítica com vistas ao projeto Lacio-Web. NILC-TR-03-03, fevereiro 2003.
ROCHA, P. A & SANTOS, D. CETEM Público: Um corpus de grandes dimensões de linguagem jornalística portuguesa. In: NUNES, M. G. V. (ed.). V Encontro para o processamento computacional da língua portuguesa escrita e falada (PROPOR 2000), São Paulo, ICMC/USP, p. 131-140, 19-22 de Novembro de 2000. Disponível em: http://
http://www.linguateca.pt/documentos/RochaSantosPROPOR2000.pdf. Acesso em: 13 de setembro de 2009.
SANTOS, Diana & COSTA, Luís. A Linguateca e o projecto Processamento Computacional do português. Terminómetro - A terminologia em Portugal e nos países de língua portuguesa em África, nº 7, 2005, p. 63-69. Disponível em:
http:///www.linguateca.pt/documentos/SantosCostaTerminometro2005.pdf. Acesso em: 13 de setembro de 2009.
SANTOS, Diana & BICK, Eckhard. Providing internet access to portuguese corpora: the AC/DC project. In: GAVRILIDOU, M; CARAYANNIS, G; MARKANTONATOU, S; PIPERIDIS, S; STAINHAUER, G. (eds.). Proceedings of the Second International Conference on Language Resources and Evaluation (LREC 2000), Atenas, Grécia, 31 de Maio a 2 de Junho de 2000, p. 205- 210. Disponível em: http://www.linguateca.pt/documentos/SantosBickLREC2000.pdf. Acesso em: 14 de setembro de 2009.
SARDINHA, Tony Berber. Linguística de Corpus. Barueri, SP: Editora Manole, 2004.
Downloads
Arquivos adicionais
Publicado
Como Citar
Edição
Seção
Licença
Este é um artigo em acesso aberto que permite o uso irrestrito, a distribuição e reprodução em qualquer meio desde que o artigo original seja devidamente citado.