Alimentação de um banco de dados do Semiofon, via corpus NILC/São Carlos, com palavras cujas vogais médias se encontram em posição tônica nas palavras
DOI :
https://doi.org/10.17851/1983-3652.2.2.11-19Mots-clés :
Corpus NILC/São Carlos. Vogais médias. Transcrição fonológica letra-fonema.Résumé
Neste trabalho, apresentamos como recursos da web são usados em uma pesquisa sobre vogais médias desenvolvida pelo grupo SEMIOFON. Inicialmente, apresentamos brevemente o corpus NILC/São Carlos. Em seguida, detalhamos as etapas da pesquisa desde a coleta dos dados até a transcrição fonológica dos dados seguindo a conversão letra-fonema de Albano & Moreira (1996).
Téléchargements
Références
ALBANO. E. & MOREIRA, A.A. Archisegment-based letter-to-phone conversion for concatenative speech synthesis in Portuguese. In: International Conference on Spoken Language Processing, 1996, Filadelfia. Proceedings ICSLP 96. Filadelfia - EUA, 1996. v. 3. p. 1208-1711. Disponível em: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.16.3931. Acessado em
de setembro de 2009.
BICK, Eckhard. The Parsing System "Palavras": Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Dr. Phil. Thesis. Aarhus University. Aarhus, Denmark: Aarhus University Press. November 2000.
MATTE, A; MEIRELES, A; FAGUAS, C. SIÇWeb – syllabic -accentual phonological parser of witten texts. Rev. Est. Ling., v.14, n.1, p.31-50, jan./jun.2006.
ROCHA, Paulo Alexandre & SANTOS, Diana. "CETEMPúblico: Um corpus de grandes dimensões de linguagem jornalística portuguesa". In Maria das Graças Volpe Nunes (ed.), V Encontro para o processamento computacional da língua portuguesa escrita e falada (PROPOR 2000) (São Paulo, Brasil, 19-22 de Novembro de 2000), São Paulo : ICMC/USP, p. 131-140.
SANTOS, Diana. O projecto Processamento Computacional do Português: Balanço e perspectivas. In: Maria das Graças Volpe Nunes (ed.). V Encontro para o processamento computacional da língua portuguesa escrita e falada (PROPOR 2000) (São Paulo, Brasil, 19-22 de Novembro de 2000), São Paulo : ICMC/USP, pp. 105-113, 2000. Disponível em: http://www.linguateca.pt/documentos/SantosPROPOR2000.pdf. Acessado em 10 de setembro de 2009.
OKSEFJELL, Signe & SANTOS, Diana. Breve panorâmica dos recursos de português mencionados na Web. In: Lima, V. L. S. de (ed.). III Encontro para o Processamento Computacional do Português Escrito e Falado (PROPOR'98), Porto Alegre, RS, 3-4 de Novembro de 1998, p. 38-47.
PINHEIRO, G. M & ALUÍSIO, S.M. Córpus Nilc: descrição e análise crítica com vistas ao projeto Lacio-Web. NILC-TR-03-03, fevereiro 2003.
ROCHA, P. A & SANTOS, D. CETEM Público: Um corpus de grandes dimensões de linguagem jornalística portuguesa. In: NUNES, M. G. V. (ed.). V Encontro para o processamento computacional da língua portuguesa escrita e falada (PROPOR 2000), São Paulo, ICMC/USP, p. 131-140, 19-22 de Novembro de 2000. Disponível em: http://
http://www.linguateca.pt/documentos/RochaSantosPROPOR2000.pdf. Acesso em: 13 de setembro de 2009.
SANTOS, Diana & COSTA, Luís. A Linguateca e o projecto Processamento Computacional do português. Terminómetro - A terminologia em Portugal e nos países de língua portuguesa em África, nº 7, 2005, p. 63-69. Disponível em:
http:///www.linguateca.pt/documentos/SantosCostaTerminometro2005.pdf. Acesso em: 13 de setembro de 2009.
SANTOS, Diana & BICK, Eckhard. Providing internet access to portuguese corpora: the AC/DC project. In: GAVRILIDOU, M; CARAYANNIS, G; MARKANTONATOU, S; PIPERIDIS, S; STAINHAUER, G. (eds.). Proceedings of the Second International Conference on Language Resources and Evaluation (LREC 2000), Atenas, Grécia, 31 de Maio a 2 de Junho de 2000, p. 205- 210. Disponível em: http://www.linguateca.pt/documentos/SantosBickLREC2000.pdf. Acesso em: 14 de setembro de 2009.
SARDINHA, Tony Berber. Linguística de Corpus. Barueri, SP: Editora Manole, 2004.
Téléchargements
Fichiers supplémentaires
Publiée
Comment citer
Numéro
Rubrique
Licence
Il s'agit d'un article en libre accès qui permet une utilisation, une distribution et une reproduction sans restriction sur n'importe quel support tant que l'article original est correctement cité.