Secciones
Referencias
Resumen
Servicios
Descargas
HTML
ePub
PDF
Buscar
Fuente


Softwares de transcrição como auxílio para as pesquisas com enfoque multimodal no processo de aquisição da linguagem
Transcription softwares as aid for research with multimodal approach in the language acquisition process
Texto Livre: Linguagem e Tecnologia, vol. 9, núm. 1, pp. 77-93, 2016
Universidade Federal de Minas Gerais

Linguística e Tecnologia


Recepção: 03 Março 2016

Aprovação: 06 Maio 2016

DOI: https://doi.org/10.17851/1983-3652.9.1.77-93

Resumo: Através do presente trabalho, almeja-se contribuir com as pesquisas realizadas no âmbito das análises em Aquisição da Linguagem, identificando de que forma dois softwares livres, de transcrição de dados, podem auxiliar a organização e a análise das interações comunicativas em uso natural com base na multimodalidade. A abordagem multimodal em Aquisição da Linguagem propõe que gestos e produções vocais não podem ser dissociados e compõem uma matriz única de significação (KENDON, 1982, 2000, 2004; McNEILL, 1985, 1992, 2000). Para tal, os programas Eudico Language Annotator (ELAN) e o Computerized Language ANalysis (CLAN) são apresentados. O ELAN, desenvolvido pelo Max Planck Institute for Psycholinguistics, é um software de transcrição que tem o objetivo de auxiliar a anotação de dados sobre gravações de áudio ou vídeo. Esse programa foi desenvolvido para a análise linguística, podendo englobar além dos dados da linguagem, anotações sobre gestos. É por isso que o software é atrativo às pesquisas multimodais, pois possibilita o exame do verbal, não verbal e contextual. O CLAN é um software que permite a realização de anotações simultâneas de fala, gestos e elementos contextuais observados em interações comunicativas. Ele permite análises que abrangem a contagem de frequência, pesquisas de palavra, análises de coocorrência, contagens MLU (Mean Length of Utterance – Extensão Média do Enunciado), mudanças de texto e análise morfossintática (MacWHINNEY, 2000). De modo geral, espera-se colaborar com pesquisas na área da linguagem, que analisam seu corpus sob a perspectiva multimodal.

Palavras-chave: interação e tecnologias, softwares de transcrição, aquisição da linguagem.

Abstract: Through this work, it aims to contribute to the research carried out under the analysis in language acquisition, through the presentation of two data transcription free software that assist the organization and analysis of communicative interactions in natural use. The multimodal approach Language Acquisition proposes that gestures and vocal productions can not be dissociated and form a single matrix of meaning (KENDON, 1982, 2000, 2004; McNEILL, 1985, 1992, 2000). For this, it presented the Eudico Linguistic Annotator and the Computerized Language Analysis programs. The ELAN, developed by Max Planck Institute for Psycholinguistics, is a transcription software aims to assist data recording on audio or video recordings. This software was developed for linguistic analysis, which may cover beyond data language, notes about gestures. Because of this the software is attractive to multimodal research, since it allows the examination of verbal, nonverbal and contextual. CLAN is a software that allows the realization of simultaneous speech notes, gestures and contextual elements observed in communicative interactions. It enables analysis that cover the frequency count, word searches, co-occurrence analysis, MLU (Mean Length of Utterance) counts, text changes and morphosyntactic analysis (MacWHINNEY, 2000). Overall, it is expected to cooperate with research in the area of language, which analyze your corpus in multimodal perspective.

Keywords: interaction and technologies, transcription softwares, language acquisition.

1. Introdução

A pesquisa em Aquisição da Linguagem tem o objetivo de investigar como os seres humanos desenvolvem e adquirem a linguagem. Na década de 40, os primeiros estudos tiveram como embasamento teórico o behaviorismo comportamentalista de Skinner, no qual a criança adquire a linguagem por meio de estímulos e imitação daquilo que ouve.

Nos anos 50 surge a tese do inatismo, abordagem desenvolvida por Noam Chomsky. Para essa hipótese, a linguagem é um dispositivo hereditário e biológico que constitui uma Gramática Universal (GU), que organiza um conjunto de princípios que norteiam o desenvolvimento da linguagem. A criança nasce com esse aparato e, por isso, há capacidade de desenvolver uma língua, com suas variações e especificidades. Para Chomsky, o inatismo explica a questão da criatividade, ou seja, a possibilidade de criar sentenças nunca usadas ou ouvidas (KENEDY, 2013).

A partir da década de 1980, outras perspectivas tomam espaço, explicando os estágios de aquisição da linguagem sem tomar como base a GU. Sendo baseadas em habilidades cognitivas e sociais, as pesquisas em Linguística Cognitiva, mais especificamente os Modelos Baseados em Uso (LANGACKER, 1987; GOLDBERG, 1995; TOMASELLO, 1988), propõem que os indivíduos utilizam conhecimentos sociocognitivos gerais no processo de Aquisição da Linguagem.

Nos últimos anos, a teoria que aborda a língua como um sistema integrado por gestos e fala, constituindo a premissa da multimodalidade, é uma das principais abordagens investigativas do mundo. Na perspectiva multimodal (McNEILL, 1985), a criança é inserida na linguagem desde muito cedo e utiliza características multimodais como os gestos e o olhar, ao mesmo tempo em que apresenta a produção de fala. Essa linguagem surge a partir das interações naturalísticas entre criança e seu cuidador, que pode ser os pais ou outro responsável (NÓBREGA; CAVALCANTE, 2012).

A perspectiva multimodal[1] realiza seus estudos com base em interações em contexto natural, fazendo uso da transcrição escrita dos dados de fala obtidos através de observação. Essa tarefa é bastante árdua devido a sua meticulosidade, o que gerava dificuldades para o pesquisador, pois toda transcrição ocorria de maneira manual, o que demandava muito tempo de dedicação. Com o advento das tecnologias, as pesquisas na área da Aquisição da Linguagem ganharam alternativas que facilitam a visualização e análise de corpus: os softwares de transcrição. Esses recursos permitem uma maior organização de dados de linguagem em seu uso natural, o que gera facilidades na interpretação e na divulgação dos resultados de pesquisa.

McCLEARY et al. (2010) apontam para três questões importantes da transcrição de dados na pesquisa linguística: exigência minuciosa da análise dos dados por parte do pesquisador, o que pode gerar uma atenção maior a dados que poderiam passar despercebidos; a transcrição por meio de símbolos linguísticos promove uma simplificação dos dados, o que gera uma padronização; e a transcrição auxilia na divulgação dos resultados de pesquisa, pois o sistema escrito é o mais procurado e utilizado em todo o mundo.

Partindo da premissa que a transcrição de dados é o objeto de estudo de pesquisas inseridas na perspectiva multimodal da linguagem, neste trabalho são estudados dois softwares livres, de transcrição de linguagem: ELAN e o CLAN[2]. O intuito é colaborar com pesquisas na área da linguagem que analisam seu corpus sob a perspectiva multimodal utilizando os recursos midiáticos e tecnológicos de softwares de transcrição.

2. Abordagem multimodal da linguagem

A abordagem multimodal da aquisição da linguagem propõe que a língua é uma matriz constituída por gestos e fala que ocorre simultaneamente, compondo um sistema linguístico único, ou seja, gestos e produções vocais não podem ser dissociados (KENDON, 1982, 2000, 2004; McNEILL, 1985, 1992, 2000). Conforme afirma McNeill (1985), “a ocorrência de gestos ao longo da fala implica que, durante o ato de fala, dois tipos de pensamento, imagístico e sintático, estão sendo coordenados”. Corroborando com essa ideia, Fonte (2011, p. 42) indica que:

A linguagem humana manifesta-se por diferentes formas na interação com o outro, seja por meio da linguagem falada ou da gestual, contribuindo para o percurso da trajetória linguística infantil, ou seja, da aquisição da linguagem e para a construção do sentido da integração dialógica.

Com relação ao uso dos gestos e da linguagem verbal e não verbal, Sousa e Faria (2010) apontam a perspectiva de Kerbat-Orecchioni (1990), em que “o gesto faz parte da linguagem não verbal a qual permeia todos os nossos enunciados verbais [...]”. “Os elementos verbais e os não verbais formam um conjunto, já que na interação ambos podem se encontrar e se relacionar em harmonia” (SOUSA; FARIA, 2010, p. 138).

Segundo Laver (2000), há uma grande importância do gesto no processo interativo. O autor afirma que, ao observar-se qualquer processo comunicativo, é necessário entender a relação entre a diferença do que foi desejado pelo infante para o processo comunicativo-interativo e o que realmente aconteceu durante esse processo. O autor afirma ainda que, embora haja gestos comuns a uma comunidade falante, esses gestos tornam a variar de pessoa para pessoa e de acordo com os fatores intrapessoais que estão presentes em cada indivíduo, que precisam ser levados em consideração no momento da descrição de uma interação.

McNeill (2000) afirma que o termo gestos, necessariamente, precisa de uma atenção particular, já que não se tem gesto no singular, e sim, gestos, no plural, pois é preciso diferenciar os diferentes movimentos nomeados corriqueiramente por gestos. Com isso, McNeill (2000) mostra um quadro de gestos, elaborado por Kendon, conhecido como o Continuum de Kendon (Kendon´s continuum).

Kendon (1982) organizou em seu contínuo quatro relações estabelecidas entre gesto e fala, sendo elas: presença ou ausência da produção verbal, presença ou ausência de propriedades linguísticas, relação com as convenções e caráter semiótico. Os gestos que estão presentes no contínuo são: gesticulação, pantomima, emblemas e língua de sinais.

A gesticulação são os gestos que co-acompanham a produção de fala. Os principais exemplos de gesticulação são o movimento das mãos, do pescoço, da cabeça, distribuição da postura corporal etc. Esses gestos apresentam idiossincrasias do sujeito e características da comunidade.

A pantomima é o gesto de imitação ou simulação de um ato, não sendo acompanhada pela produção de fala. As pantomimas podem apresentar um caráter narrativo, pois podem referenciar uma sequência de atos de um indivíduo.

Os emblemáticos são os gestos parcialmente convencionais que podem apresentar ou não a produção de fala. São parcialmente convencionais porque os gestos emblemáticos podem variar entre as diferentes culturas. Por exemplo, o uso da mão fechada e a indicação com o dedo polegar para cima é o gesto que indica “ok” na cultura ocidental.

A língua de sinais não apresenta elementos da produção de verbal e é totalmente convencionalizada a partir de uma determinada comunidade. O exemplo de língua de sinais é a LIBRAS (Língua de Sinais Brasileira), sistema linguístico destinado à comunicação entre/com surdos.

Tabela 1
Contínuo de Kendon

McNeill (2000, p. 5)

Em relação à produção prosódico-vocal, outro elemento multimodal, Barros (2012) propõe cinco tipos distintos de produções vocais: balbucio, jargão, primeiras palavras, holófrases e blocos de enunciado. O balbucio são as produções repetitivas de sílabas formadas por consoante+vogal (por exemplo, BA BA BA). Os jargões são elementos que apresentam prosódia (contorno entonacional) semelhante a fala adulta, mas que não são constituídos por estrutura gramatical[3], sendo ininteligíveis. As primeiras palavras são identificadas quando não representam nem balbucios e nem jargões, pois são reconhecidas (as palavras) e interpretadas pelo locutor por terem uma estrutura gramatical. As holófrases são os primeiros enunciados pronunciados por uma criança que são acompanhados por gestos corporais, como o apontar, o olhar, o gesticular etc. Já os blocos de enunciados são a alternância entre produção de holófrase e enunciados completos, em que as crianças já são capazes de fazer e responder perguntas com significado (FONTE et al., 2014).

Para Silva (2014, p. 28), é importante compreender que a relação entre gestos e fala é um “processo multimodal, no qual elementos atuam para que as interações linguísticas promovam a passagem da criança à falante de sua língua”.

É sobre o contexto multimodal descrito que se inserem as análises de corpus das interações mãe-bebê, por exemplo, na área da Aquisição da Linguagem. Projetos como o PALiM e o Hologesto[4] buscam mostrar a importância da linguagem da mãe no desenvolvimento da linguagem do infante, já que “a produção gestual da mãe de forma contínua é de extrema importância, pois é através dela que o bebê vai sendo apresentado aos tipos de gestos existentes” (CAVALCANTE, 2012, p. 12).

A partir da relevância do tema e da necessidade da transcrição do corpus das interações comunicativas entre mãe e bebê, compostas por gesto e fala, são apresentados dois softwares de transcrição: o ELAN e o CLAN. Esses dois programas podem facilitar a percepção da emergência dos gestos que coincidem com as primeiras produções verbais, o que afasta a concepção de primitivismo gestual e do caráter pré-linguístico dos gestos.

3. ELAN - Eudico Language Annotator

O Eudico Language Annotator, ELAN, é um software de transcrição de dados que foi desenvolvido pelo Max Planck Institute for Psycholinguistics. Com ele, é possível criar anotações, editar textos, visualizar vídeos, realizar anotações através de dados de áudio e vídeo, simultaneamente. O ELAN, além das vantagens já apresentadas, é um software livre, como dito na introdução, que permite uma análise linguística completa, podendo englobar, além da fala, transcrições de gestos, olhar, expressão facial, entre outros, promovendo, assim, uma análise dos elementos multimodais. É por esse design de anotação da linguagem e de outros elementos multimodais (gestos, olhar, expressão corporal e facial), concomitantemente, que o software é atrativo às pesquisas, pois possibilita amplas observações no âmbito verbal, não verbal e contextual.

O ELAN possibilita a transcrição e anotações das análises linguísticas em linhas denominadas de trilhas. A criação dessas trilhas e suas nomeações são determinadas pelo pesquisador/transcritor e permitem fazer anotações de determinado registro no tempo exato, e se, caso for necessário fazer alguma alteração, isso poderá ser feito sem nenhuma dificuldade ou possibilidade de perda de anotações anteriores ou subsequentes.

Esse software que traz vantagens para qualquer pessoa que necessite utilizá-lo, não apresentando dificuldades no manuseio, além de apresentar vantagens no processo de transcrição e organização de dados. Como mencionado, o ELAN é disponibilizado livremente na internet, podendo ser baixado para Windows, Mac e Linux. A Figura 1 apresenta a estrutura do ELAN e seus elementos de edição:


Figura 1
Tela inicial do ELAN e recursos de transcrição.
Silva (2014, p. 44).

Pode-se observar que o programa apresenta, além da barra de ferramentas, outros elementos acessórios para os momentos de transcrição e análise, como: “play” para ver o vídeo sem pausas, “play” para o modo de repetição constante, setas para voltar ou acelerar a passagem do vídeo, entre outros. Percebe-se que a barra de ferramentas é bem simples e assemelha-se a uma barra de ferramentas de áudio comum, o que facilita o manuseio no momento de transcrição.

O elemento de edição que mais contribui com o trabalho de transcrição comum e a transcrição multimodal é a possibilidade de criar de trilhas. O pesquisador pode desenvolver diversas anotações sobre diferentes aspectos, optando por transcrever só áudio no formato WAV ou áudio e vídeo nos formatos AVI, MPEG, MP4, MOV, assistindo com base na cronologia dessa mídia. Por exemplo, em uma trilha o pesquisador pode transcrever a fala da mãe, e em outra trilha os diferentes gestos que o bebê produzir. É importante ressaltar que essas transcrições são realizadas ao mesmo tempo em que a mídia é reproduzida, podendo o pesquisador pausar/parar para realização da anotação. Deve-se destacar que não existe um número mínimo, máximo ou exato para a criação de trilhas, isso vai depender de cada pesquisa a ser desenvolvida, cabendo ao pesquisador refletir e decidir qual o número de trilhas que precisará e quais pontos irá observar.

As trilhas criadas no ELAN podem ser visualizadas individualmente através do recurso “grade”, o que permite analisar as especificidades de cada elemento da interação. Na Figura 2, tem-se a grade retirada da análise de momentos de interação entre mãe e criança, na qual foi observada a produção de fala do bebê.


Figura 2
Grade de trilhas editada no ELAN com a produção oral/produção de fala da criança
Silva (2014, p. 64).

A grade da trilha de fala do bebê possibilita uma melhor percepção das anotações de produção de fala da criança. Além disso, pode-se perceber o tempo inicial, o tempo final e a duração daquela determinada produção vocal do participante, nesse caso, o bebê. Para casos em que são observados mais de um participante, todos os elementos multimodais podem ser analisados, além da possibilidade de criar o número de trilhas que for necessário para a análise.

O software ELAN proporciona ainda ao pesquisador a elaboração de novos quadros com mesclas das trilhas. As trilhas geradas pelo programa a partir das transcrições podem ser mescladas, criando novos quadros, denominadas “quadros de mesclas”. As trilhas a serem mescladas são escolhidas de acordo com o enfoque da pesquisa e permitem a visualização de componentes multimodais de maneira concomitante. Segue, na Figura 3, um exemplo de mescla de trilhas denominado como “quadro mescla”:


Figura 3
Quadro Mescla retirado do ELAN
Silva (2014, p. 47).

Como se pode verificar na Figura 3, através da mescla das trilhas, há a presença da transcrição de elementos que ocorrem concomitantemente: gestos e produção verbal, o que é coerente com presença da multimodalidade no processo de aquisição da linguagem. Assim, a organização das relações entre gestos e fala fica evidente na transcrição, o que facilita a análise e a percepção dos gestos baseadas no contínuo de Kendon (McNEILL, 2000).

O software ELAN disponibiliza em sua plataforma/tela inicial ferramentas interativas de fácil manuseio, ampliando as possibilidades de adequações às pesquisas que envolvem transcrição de dados. Ainda sobre as ferramentas interativas, Calil e Del Ré salientam que o ELAN:

[...] oferece ferramentas interativas para se trabalhar a complexidade de dados registrados em sistema audiovisual, incorporando à transcrição de forma bastante fidedigna, simultânea e precisa, distintos aspectos presentes na situação filmada, como por exemplo, gestos, expressões faciais, direção do olhar, falas, rasuras orais e escritas, entre outros aspectos semióticos que possam ser definidos e organizados em “trilhas” separadas, permitindo uma maior sincronia do momento exato em que se deu uma e/ou outra ação (CALIL; DEL RÉ, 2009, p. 13).

ELAN possibilita ao transcritor fazer um levantamento quantitativo dos dados analisados, desde que as anotações sejam feitas utilizando uma mesma nomenclatura para a recorrência de um determinado elemento. Por exemplo: anotar a ocorrência da gesticulação nos momentos de recorrência desse gesto, anotar a ocorrência do olhar de acompanhamento sempre que esse aparecer na cena interativa e assim por diante. Desse modo, o próprio programa identifica as palavras que foram usadas com a mesma denominação e contabiliza, apresentando um quadro com o levantamento quantitativo da ocorrência daquele elemento multimodal naquela dada cena interativa. Nesse caso, o quadro denominado pelo programa como “estatísticas” possibilita tal análise, como registrado na Figura 4:


Figura 4
Quadro estatística retirado do ELAN
print screen do software no sistema operacional Windows 8

Além do quadro das estatísticas, o programa também disponibiliza na sua tela inicial, na barra de ferramentas de transcrição/trabalho, a opção de ‘visualizar’ e depois ‘atalho’. Após selecionar essas duas opções na barra de ferramentas, o ELAN apresenta um quadro, como presente na Figura 5, com os comandos para a execução do trabalho de transcrição, caso o pesquisador esqueça de como seguir em um dado momento da análise.


Figura 5
Quadro estatística retirado do ELAN
print screen do software no sistema operacional Windows 8

Em se tratando de pesquisa, existem trabalhos e análises que destacam a importância do ELAN. Calil e Del Ré (2009) utilizaram o ELAN para observar a multimodalidade na criação de histórias inventadas por crianças, percebendo as facilidades que o software oferece para os estudos multimodais. McCleary et al. (2010), após avaliar diferentes softwares de transcrição linguística, optaram pelo ELAN como método de transcrição da língua de sinais pelas vantagens apresentadas a seguir:

i) ser especificamente desenvolvido para descrição e análise linguísticas multimodais; ii) estar sendo amplamente utilizado por pesquisadores de várias línguas, em particular de línguas de sinais; iii) estar sendo constantemente atualizado por meio de novas versões que corrigem problemas e introduzem novos recursos; iv) ser disponibilizado gratuitamente; v) ser compatível com PC; vi) possibilitar o uso de arquivos de vídeo e áudio, o que é importante para transcrição e análise de interação bimodal surdo-ouvinte, bem como para os estudos da gestualidade (McCLEARY et al., 2010, p. 273).

Em linhas gerais, o programa ELAN oferece meios para que a pesquisa linguística com foco na multimodalidade seja facilitada, e, dentre os inúmeros recursos do programa, destaca-se a criação dos ‘quadros mesclas’ desenvolvidos a partir das trilhas transcritas. O ELAN atinge as metas propostas por McCleary et al. (2010) sobre a importância da transcrição de dados: possibilita uma análise detalhada dos dados por parte do pesquisador, promove uma simplificação dos dados por meio de símbolos linguísticos e, consequentemente, auxilia na divulgação dos resultados de pesquisa. É interessante salientar que o ELAN pode ser utilizado por outras áreas e com diferentes enfoques, como os estudos neurofisiológicos (LAUSBERG; SLOETJES, 2009), estudos que envolvem danças e terapia, traduções, ensino e aprendizagem de língua estrangeira, língua de sinais – LIBRAS, estudos que observam professores e alunos na sala de aula, entrevistas, entrevistas apenas com áudio ou com vídeo e áudio, entre outros.

4. Computerized Language ANalysis - CLAN

O Computerized Language ANalysis, CLAN, é um software livre de transcrição de dados que contribui com as pesquisas sobre a linguagem, principalmente pesquisas sob a perspectiva multimodal, pois permite anotações de fala, gestos e elementos contextuais observados em interações comunicativas. O software é disponibilizado gratuitamente na plataforma CHILDES. Abaixo, a tela inicial do CLAN para Windows (sem as linhas de transcrições):


Figura 6
Tela inicial do CLAN, print screen do software no sistema operacional Windows 8
própria

O CLAN permite executar um grande número de análises automáticas em dados de transcrição. As análises abrangem a contagem de frequência, pesquisas de palavra, análises de coocorrência, contagens MLU (Mean Length of Utterance; em português, Extensão Média do Enunciado), análises de interação, mudanças de texto e análise morfossintática (MacWHINNEY, 2000). Segundo Falasca (2012, p. 50):

Uma das grandes contribuições do programa para as análises dos dados é a quantidade de comandos que ele oferece, os quais permitem buscar, ao longo das transcrições, exatamente o que está em jogo durante a análise. Assim, o pesquisador tem acesso rápido às ocorrências relevantes e pode também criar tabelas que expõem objetivamente os itens procurados.

O software possibilita que o pesquisador ordene as transcrições ao vídeo, o que gera uma maior atenção a dados extralinguísticos e oferece uma maior confiabilidade à pesquisa, por poder originar conclusões menos subjetivas. O programa “permite, ainda, o acréscimo de linhas de descrição da situação em que o enunciado é produzido, linha fonética e linha de comentários do transcritor” (FALASCA, 2012, p. 50). Essas linhas de descrição, semelhantes às trilhas presentes no ELAN, são interessantes para as transcrições e análises das relações entre fala e gestos com base na multimodalidade, o que permite observar com mais detalhe a emergência dos gestos e a importância da fala da mãe/cuidador no processo de aquisição da linguagem.

O software CLAN comporta a edição de arquivos que estão no formato CA (Conversation Analysis) ou CHAT (Codes for the Human Analysis of Transcripts). O destaque ao CHAT é maior por ser o código de transcrição mais comumente utilizado nas pesquisas em aquisição da linguagem.

O CHAT é o sistema padrão de transcrição da plataforma CHILDES, ou seja, todas as transcrições da base de dados do CHILDES seguem o código CHAT. O sistema de códigos CHAT permite uma padronização de transcrições de interações comunicativas computadorizadas. Essas interações podem envolver criança e pais, paciente e médico, professores e aprendizes de segunda língua com ou sem afasias. O CHAT também permite opções para a análise de discursos mais básicos, para uma análise fonológica ou morfológica detalhada, assim como uma análise morfossintática. Os arquivos CHAT também são compatíveis com o ELAN (MacWHINNEY, 2000). Abaixo, um exemplo de cabeçalho preenchido em CHAT (baseado em DEL RÉ et al., 2012):

@Begin @Languages: pt @Participants: CHI Amanda Target_Child, MOT Aline Mother OBS Mariana @ID: pt|Amanda|CHI|2;04.00|female|||Target_child|| @ID: pt|Aline|MOT|||||Mother|| @ID: pt|Mariana|OBS|||||Observer|| @Birth of CHI: 21-MAR-2013 @Age of CHI: 1;11.11 @Media: A_1_11_11 video@Date: 10-MAR-2014 @Time Duration: 01:39:10 @Coder: Aline @Location: Casa de Amanda@Situation: Amanda está jantando na cozinha da casa, juntamente com a mãe.

Para iniciar a transcrição do corpus através do CLAN, é necessário ter em mente os comandos necessários para realizar as anotações. Isso é possível através de códigos padrões ao programa, que são semelhantes à linguagem de programação. De Acordo com Del Ré et al. (2012), existem três informações que precisam fazer parte de um arquivo de transcrição de corpus: o cabeçalho (linhas que devem iniciar por @), os enunciados (linhas principais que devem iniciar por *) e informações extras sobre os enunciados (linhas adicionais que devem iniciar por %).

Toda transcrição é digitada na página inicial (em branco) do software, como apresentado na Figura 7. Cada informação é digitada linha abaixo de linha (que ficam enumeradas após digitação) antecedida pelos códigos específicos para cada função dentro de uma transcrição. MacWhinney (2000) apresenta alguns princípios básicos para uma transcrição através do CHAT: cada enunciado deve terminar por um ponto de exclamação ou ponto de interrogação, somente os nomes próprios devem ser iniciados por letras maiúsculas, palavras com forma fonética não identificada devem ser transcritas por “xxx”, palavras incompletas podem ser transcritas com o material omitido entre parênteses. Assim, pode-se transcrever uma interação da seguinte forma MacWhinney (2000, p. 21):

@Begin @Languages: eng @Participants: CHI Ross Child, FAT Brian Father @ID: eng|macwhinney|CHI|2;10.10||||Target_Child||| @ID: eng|macwhinney|FAT|35;2.||||Target_Child||| *ROS: why isn't Mommy coming? %com: Mother usually picks Ross up around 4 PM. *FAT: don't worry. *FAT: she'll be here soon. *CHI: good. @End

MacWhinney et al. (2012) utilizaram o programa CLAN e o sistema de transcrição CHAT para organizar a base de dados AphasiaBank, que contêm entrevistas entre pessoas com afasia (PWAs) e clínicos. O objetivo geral do AphasiaBank é a construção de um sistema de acumulação e compartilhamento de dados sobre o uso da linguagem por PWAs. Para atingir esse objetivo, existe um protocolo padrão de levantamento de dados e métodos sistemáticos automáticos e manuais para transcrição, codificação e análise. A Figura 7 ilustra uma das transcrições realizadas pelo AphasiaBank:


Figura 7
Transcrições de vídeo editadas no CLAN.
MacWhinney et al. (2012, p. 1300).

No Brasil, existem trabalhos em aquisição da linguagem que utilizam o software CLAN e o sistema CHAT. Del Ré et al. (2012), por exemplo, desenvolveram um tutorial em língua portuguesa com comandos básicos que auxilia na utilização do CLAN. Esse manual é trabalhado em cursos que são ministrados nos congressos de Linguística (no Brasil) e é indicado, principalmente, para as pesquisas fonológicas no campo da aquisição da linguagem.

Em suma, o CLAN é um recurso bastante eficaz para a transcrição de dados linguísticos, por fornecer uma ampla gama de funções úteis para a análise quantitativa, como a reprodução de áudio e vídeo, ligação com áudio e vídeo, fontes para ortografias romanas e não romanas, validação de dados, códigos para arquivos e dados de envio para outros programas. Dessa maneira, o CLAN alcança os três pontos importantes na transcrição de dados que são evidenciados por McCleary et al. (2010): possibilidade de análise minuciosa dos dados por parte do pesquisador, a transcrição por meio de símbolos linguísticos e a facilidade na divulgação dos resultados de pesquisa através do sistema linguístico. Mesmo não apresentando muita facilidade de manuseio pelo fato de utilizar linguagem de programação para edição (o sistema de transcrição CHAT), essa dificuldade não inviabiliza o uso do software, pois existem manuais e tutoriais presentes na plataforma CHILDES, em inglês, e o tutorial desenvolvido por Del Ré et al. (2012) em português.

Conclusão

A questão da metodologia de transcrição é um fator importante nos estudos em aquisição da linguagem, visto que alguns pesquisadores têm dúvidas e até dificuldades para escolher o software que ofereça mais recursos para a pesquisa. No âmbito das pesquisas linguísticas sob uma perspectiva multimodal, já existem diversos programas de transcrição que automatizam o processo de análise e padronizam as transcrições, dos quais destacam-se o ELAN e o CLAN.

Os programas descritos auxiliam bastante o trabalho de pesquisadores, principalmente aqueles que optam por trabalhar com a multimodalidade e observar os elementos considerados multimodais no processo de linguagem. O ELAN e o CLAN, os dois softwares aqui abordados, abarcam recursos que podem transcrever produções de fala, gestos, olhares, interação face a face, elementos extralinguísticos e o contexto situacional. O ELAN, através das trilhas, permite que o pesquisador realize anotações sobre as interações comunicativas, gerando uma análise de cunho observacional, qualitativo e quantitativo. O CLAN através das produções das linhas de descrição permite uma melhor análise de aspectos fonológicos e morfossintáticos das interações, além de contabilizar elementos da produção de fala, contribuindo, assim, para uma análise quantitativa, além da qualitativa referente aos elementos da linguagem.

Embora existam diversos trabalhos que utilizem esses softwares, ainda existem poucos tutoriais disponibilizados que abordem questões mais práticas e específicas para cada tipo de pesquisa. Por isso, a partir do presente trabalho, espera-se contribuir com um entendimento geral das funções, dos objetivos e das facilidades ocasionadas pelos softwares ELAN e CLAN, visando divulgar esses dois softwares livres e auxiliar nos momentos de transcrições e análises de dados na área de Aquisição da Linguagem e áreas afins. Assim, espera-se contribuir com a criação de tutorais explicativos sobre o ELAN e o CLAN com foco na criação de trilhas, linhas de descrição e aplicação das transcrições como legenda nos próprios vídeos analisados.

Referências

BARRETT, L. F. The relationship among momentary emotional experiences, personality descriptions, and retrospective ratings of emotion. Personality and Social Psychology Bulletin, n. 23, p. 1100-1110, 1997.

BARROS, A. T. M de C. Fala inicial e prosódia: do balbucio aos blocos de enunciados. 2012. 103 f. Dissertação (Mestrado em Linguística) – Pós-Graduação em Linguística, Universidade Federal da Paraíba, João Pessoa, 2012.

CALIL, E.; DEL RÉ, A. Análise multimodal de uma história inventada: o caso da onomatópeia visual. Revista da Anpoll, Belo Horizonte, n. 27, p. 30-45, 2009.

CAVALCANTE, M. C. B. Hologestos: produções linguísticas numa perspectiva multimodal. Revista de Letras, v. 1, n. 31, p. 9-16, 2012. Disponível em: http://www.periodicos.ufc.br/index.php/revletras/article/view/1057 . Acesso em: 24 jun. 2016.

CLANWin, version 1.0. [s.l.]. 2015. Disponível em: http://childes.psy.cmu.edu/ . Acesso em: 10 fev. 2015

DEL RÉ, A.; HILÁRIO, R. N.; MOGNO, A. S. Programa CLAN da base CHILDES: normas de transcrição (CHAT) e comandos básicos. In: FERREIRA-GONÇALVES, G.; BRUM-DE-PAULA, M. R.; KESKE-SOARES, M. (Org.). Estudos em aquisição fonológica. Pelotas: Editora e Gráfica Universitária PREC – UFPel, 2012. v. 4, p. 11-30.

ELAN, version 4.9. 2015. [s.l.]. Max Planck Psycholinguistics Institute, Disponível em: . Acesso em: 15 mai. 2015.

FALASCA, P. Aquisição/aprendizagem de LE: subjetividade e deslocamentos identitários. 2012. 153 f. Dissertação (Mestrado) – Faculdade de Ciências e Letras, Universidade Estadual Paulista “Júlio de Mesquita Filho”, Araraquara, 2012.

FONTE, R. F. L. O funcionamento da atenção conjunta na interação mãe-criança cega. Tese de doutorado em Linguística. Universidade Federal da Paraíba. João Pessoa, 2011.

FONTE, R. F. L. et al. A matriz gesto-fala na aquisição da linguagem: algumas reflexões. In: BARROS, I. do R. et al. (Org.). Aquisição, desvios e práticas de linguagem. Curitiba: CRV, 2014. p. 11-26.

GOLDBERG, A. E. Constructions: a construction grammar approach to argument structure. Chicago: University of Chicago Press, 1995.

KENDON, A. The study of gesture: some remarks on its history. Recherches Sémiotiques/Semiotic Inquiry, v. 2, p. 45-62, 1982.

KENDON, A. Language and gesture: unity or duality? In: MCNEILL, D. (Ed.). Language and gesture. Cambridge: Cambridge University Press, 2000. p. 47-63.

KENDON, A. Gesture: visible action as utterance. Cambridge: Cambridge University Press, 2004.

KENEDY, E. Curso básico de Linguística Gerativa. São Paulo: Contexto, 2013.

LANGACKER, R. W. Foundations of cognitive grammar. Stanford: Stanford University Press, 1987. v. 1: theoretical prerequisites.

LAUSBERG, H.; SLOETJES, H. Coding gestural behavior with the NEUROGES-ELAN system. Behavior Research Methods, v. 41, n. 3, p. 841-849, 2009.

LAVER, J. Unifying principles in the description of voice, posture and gesture. In: CAVE, C.; GUAITELLA, I. Interactions et comportement multimodaux dans la communication. Paris: L’Harmattan, 2000.

LOCKE, J. L. Desenvolvimento da capacidade para a linguagem falada. In: FLETCHER, P.; MACWHINNEY, B. (Eds.). Compêndio da linguagem da criança. Porto Alegre: Artes Médicas, 1997.

MACWHINNEY, B. The CHILDES Project: tools for analyzing talk. 3rd ed. Mahwah, NJ: Lawrence Erlbaum Associates, 2000.

MACWHINNEY, B. et al. AphasiaBank: methods for studying discourse. Aphasiology, v. 25, p. 1286–1307, 2012.

MCCLEARY, L.; VIOTTI, E.; LEITE, T. de A. Descrição das línguas sinalizadas: a questão da transcrição dos dados. Alfa, São Paulo, v. 54, n. 1, p. 265-289, 2010.

MCNEILL, D. So you think gestures are nonverbal? Psychological Review, cidade, v. 92, n. 3, p. 350-371, 1985.

MCNEILL, D. Hand and mind: what gestures reveal about thought. Chicago: University of Chicago Press, 1992.

MCNEILL, D. Language and gesture. Cambridge: Cambridge University Press, 2000.

NÓBREGA, P. V. A.; CAVALCANTE, M. C. B. Aquisição da linguagem e dialogia mãe-bebê: o envelope multimodal em foco em contextos de atenção conjunta. Revista Investigações, Recife, v. 25, n. 2, p. 157-183, 2012. Disponível em: . Acesso em: 24 jun. 2016.

SILVA, P. M. S. da. Gestos e produção verbal: a fluência multimodal em aquisição da linguagem. 2014. 88 f. Dissertação (Mestrado em Linguística) – Centro de Ciências Humanas, Letras e Artes, Universidade Federal da Paraíba. João Pessoa, 2014.

SNOW, C. E. Questões no estudo de input: Sintonia, universalidade, diferenças individuais e evolutivas, e causas necessárias. In: FLETCHER, P.; WHINNEY, B. M. (Orgs.). Compêndio da linguagem da criança. São Paulo: Artmed. p. 153-63, 1997.

SOUSA, W.; FARIA, E. M. O gesto como facilitador da produção do sentido no diálogo entre crianças surdas em aquisição de linguagem. In: CAVALCANTE, M. C. B. (Org.). Multimodalidade em aquisição da linguagem. João Pessoa, PB: Editora Universitária da UFPB, 2010. v. 01, p. 135-148.

TOMASELLO, M. The role of joint attentional process in early language development. Language Sciences, n. 10, p. 69-88, 1988.

Notas

1 Existem estudos aquisicionistas que não levam em consideração a perspectiva multimodal da linguagem (SNOW, 1997; LOCKE, 1997; BARRETT, 1997).
2 De acordo com o site https://tla.mpi.nl/tools/tla-tools/elan/ , consultado em 24 de jun. 2016, “All Software developed by TLA may be used free of charge (freeware). It is also ‘open source’: the source code is available upon request under the Gnu Public License 2 (in some cases GPL 3)”. (Todos os softwares desenvolvidos pela TLA podem ser usados gratuitamente (freeware). Eles são também ‘open source’ (fonte aberta): o código fonte está disponível mediante solicitação sob a Licença Pública GNU 2 (em alguns casos GPL 3)) (tradução nossa).
3 Os jargões surgem em torno dos 12 ou 13 meses de idade (FONTE et al., 2014).
4 Ambos coordenados pela pesquisadora autor (UFPB/CNPq).

Ligação alternative



Buscar:
Ir a la Página
IR
Visualizador XML-JATS4R. Desarrollado por