Alimentação de um banco de dados do Semiofon, via corpus NILC/São Carlos, com palavras cujas vogais médias se encontram em posição tônica nas palavras
DOI:
https://doi.org/10.17851/1983-3652.2.2.11-19Keywords:
Corpus NILC/São Carlos. Vogais médias. Transcrição fonológica letra-fonema.Abstract
Neste trabalho, apresentamos como recursos da web são usados em uma pesquisa sobre vogais médias desenvolvida pelo grupo SEMIOFON. Inicialmente, apresentamos brevemente o corpus NILC/São Carlos. Em seguida, detalhamos as etapas da pesquisa desde a coleta dos dados até a transcrição fonológica dos dados seguindo a conversão letra-fonema de Albano & Moreira (1996).
Downloads
References
ALBANO. E. & MOREIRA, A.A. Archisegment-based letter-to-phone conversion for concatenative speech synthesis in Portuguese. In: International Conference on Spoken Language Processing, 1996, Filadelfia. Proceedings ICSLP 96. Filadelfia - EUA, 1996. v. 3. p. 1208-1711. Disponível em: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.16.3931. Acessado em
de setembro de 2009.
BICK, Eckhard. The Parsing System "Palavras": Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Dr. Phil. Thesis. Aarhus University. Aarhus, Denmark: Aarhus University Press. November 2000.
MATTE, A; MEIRELES, A; FAGUAS, C. SIÇWeb – syllabic -accentual phonological parser of witten texts. Rev. Est. Ling., v.14, n.1, p.31-50, jan./jun.2006.
ROCHA, Paulo Alexandre & SANTOS, Diana. "CETEMPúblico: Um corpus de grandes dimensões de linguagem jornalística portuguesa". In Maria das Graças Volpe Nunes (ed.), V Encontro para o processamento computacional da língua portuguesa escrita e falada (PROPOR 2000) (São Paulo, Brasil, 19-22 de Novembro de 2000), São Paulo : ICMC/USP, p. 131-140.
SANTOS, Diana. O projecto Processamento Computacional do Português: Balanço e perspectivas. In: Maria das Graças Volpe Nunes (ed.). V Encontro para o processamento computacional da língua portuguesa escrita e falada (PROPOR 2000) (São Paulo, Brasil, 19-22 de Novembro de 2000), São Paulo : ICMC/USP, pp. 105-113, 2000. Disponível em: http://www.linguateca.pt/documentos/SantosPROPOR2000.pdf. Acessado em 10 de setembro de 2009.
OKSEFJELL, Signe & SANTOS, Diana. Breve panorâmica dos recursos de português mencionados na Web. In: Lima, V. L. S. de (ed.). III Encontro para o Processamento Computacional do Português Escrito e Falado (PROPOR'98), Porto Alegre, RS, 3-4 de Novembro de 1998, p. 38-47.
PINHEIRO, G. M & ALUÍSIO, S.M. Córpus Nilc: descrição e análise crítica com vistas ao projeto Lacio-Web. NILC-TR-03-03, fevereiro 2003.
ROCHA, P. A & SANTOS, D. CETEM Público: Um corpus de grandes dimensões de linguagem jornalística portuguesa. In: NUNES, M. G. V. (ed.). V Encontro para o processamento computacional da língua portuguesa escrita e falada (PROPOR 2000), São Paulo, ICMC/USP, p. 131-140, 19-22 de Novembro de 2000. Disponível em: http://
http://www.linguateca.pt/documentos/RochaSantosPROPOR2000.pdf. Acesso em: 13 de setembro de 2009.
SANTOS, Diana & COSTA, Luís. A Linguateca e o projecto Processamento Computacional do português. Terminómetro - A terminologia em Portugal e nos países de língua portuguesa em África, nº 7, 2005, p. 63-69. Disponível em:
http:///www.linguateca.pt/documentos/SantosCostaTerminometro2005.pdf. Acesso em: 13 de setembro de 2009.
SANTOS, Diana & BICK, Eckhard. Providing internet access to portuguese corpora: the AC/DC project. In: GAVRILIDOU, M; CARAYANNIS, G; MARKANTONATOU, S; PIPERIDIS, S; STAINHAUER, G. (eds.). Proceedings of the Second International Conference on Language Resources and Evaluation (LREC 2000), Atenas, Grécia, 31 de Maio a 2 de Junho de 2000, p. 205- 210. Disponível em: http://www.linguateca.pt/documentos/SantosBickLREC2000.pdf. Acesso em: 14 de setembro de 2009.
SARDINHA, Tony Berber. Linguística de Corpus. Barueri, SP: Editora Manole, 2004.
Downloads
Additional Files
Published
How to Cite
Issue
Section
License
This is an open access article that allows unrestricted use, distribution and reproduction in any medium as long as the original article is properly cited.