INTERPRETAÇÃO AUTOMÁTICA. PROBLEMAS EM ABERTO E ALGUMAS SOLUÇÕES

Susanne Johanna Jekat; Alexandra Klein; Flávio de Sousa Freitas; Marileide Dias Esqueda

Traduções

Recepção: 17 Março 2020

Aprovação: 08 Maio 2020

NOTA DOS TRADUTORES

A interpretação automática (IA), ou tradução automática de fala, é uma tecnologia que traduz discurso oral de uma língua para outra através de três funcionalidades acopladas em um único sistema computacional: reconhecimento automático de fala, tradução automática e síntese de voz. Apresentado pela primeira vez em 1983, durante a convenção ITU Telecom, em Genebra, o conceito de IA veicula a ideia de sistemas capazes de promover a comunicação entre pessoas que falam línguas diferentes de forma espontânea e eficaz.

O presente artigo foi publicado originalmente em 1996 por duas pesquisadoras do Departamento de Ciência da Computação da Universidade de Hamburgo, que participavam do desenvolvimento do projeto de interpretação automática VERBMOBIL.

Nas últimas duas décadas, novos avanços surgiram no universo das tecnologias de processamento de linguagem natural. Desde então, distintas abordagens tecnológicas emergiram; algumas foram aperfeiçoadas e outras descartadas. Pode-se dizer que, atualmente, as máquinas aprendem de forma automática (machine learning) e atuam em redes neurais artificiais (artificial neural network) que as tornam mais inteligentes do que no passado. Os problemas fundamentais com os quais as máquinas têm lidado durante a tarefa de tradução e interpretação automáticas, no entanto, são anteriores aos avanços da atualidade.

É nesse sentido que este artigo é dotado de certo vanguardismo e, por isso, despertou nosso interesse em traduzi-lo para a língua portuguesa do Brasil. Foco de nossas pesquisas desde 2016, a tradução e interpretação automáticas, com ênfase especial aos processos de reconhecimento automático de fala, tradução automática e síntese de voz, vêm recentemente recebendo atenção em contexto nacional (FREITAS, 2016; FREITAS; ESQUEDA, 2017; ESQUEDA; FREITAS, 2019; FREITAS, ESQUEDA; 2020). Assim, a tradução que propomos é, quiçá, mais uma oportunidade de ampliar nosso horizonte de pesquisa e tornar a interpretação automática um objeto de estudo mais visível aos interessados em tecnologias da tradução e interpretação.

No que tange à tradução propriamente dita do artigo, podemos dizer que, dos distintos métodos de tradução descritos por Hurtado Albir (1999) e Molina e Hurtado Albir (2002), quais sejam, interpretativo-comunicativo (por meio do qual se traduz o sentido), literal (passível de transcodificação linguística), livre (com modificação de categorias semióticas e comunicativas) ou filológico (em que ocorre uma tradução crítico-acadêmica de caráter interlinear, isto é, trata-se de um método de tradução extremamente literal, em que as palavras são apresentadas com suas traduções linha a linha, sendo utilizado frequentemente na tradução de textos bíblicos), optamos pelo primeiro, o método interpretativo-comunicativo. Ao fazermos uso deste método, buscamos fornecer ao leitor a intenção comunicativa expressa no texto de Susanne J. Jekat e Alexandra Klein, por vezes lançando mão de técnicas tradutórias de transposição (mudanças de categorias gramaticais), compensação (introdução de informações ou efeitos estilísticos rearranjados em outro parágrafo ou lugar no texto-alvo), generalizações ou, ainda, de utilização de equivalente usual, isto é, adoção de uma terminologia consagrada pelo uso, como foi o caso do termo interpretação automática como equivalente para machine interpreting. Este termo, utilizado no título e no decorrer de todo o artigo traduzido, foi adotado com base em Freitas (2016), Freitas e Esqueda (2017), Esqueda e Freitas (2019) e Freitas e Esqueda (2020).

Assim, agradecemos as sugestões fornecidas pelos pareceristas do periódico Texto Livre: Linguagem e Tecnologia e esperamos que os leitores afeitos ao tema possam se sentir instigados a acompanhar e investigar os avanços das tecnologias relacionadas à tradução e interpretação automáticas.

Este artigo discute os problemas de tradução automática com foco em uma tarefa específica, i.e., a interpretação automática de diálogos. Na tradução de discurso falado[1] existe uma crescente tendência de se utilizar informações pragmáticas que estão comumente associadas à oralidade e aos atos de fala para solucionar problemas típicos encontrados no processamento de fala.

Após discutirmos algumas características da linguagem oral e as principais limitações da interpretação automática, propomos uma síntese das abordagens existentes e descrevemos um modelo de interpretação automática em que a transferência de uma língua para a outra é realizada por um componente de ato de diálogo, a fim de solucionar problemas de tradução no contexto do Projeto VERBMOBIL. A última seção do presente trabalho descreve como a transferência baseada em atos de diálogo, com o uso limitado de informações disponíveis, pode resultar em novas soluções para os problemas existentes.

1 Principais limitações

1.1 Relações de equivalência

Assim como descrito por Jekat (1995), a qualidade de uma tradução é comumente avaliada de acordo com seu grau de equivalência com o texto original. Existem

diferenças entre indivíduos

(explicitadas claramente pela seguinte afirmação de Quine (1960, p. 26): “Dois homens podem se equiparar em todas as suas pré-disposições para as interações verbais, a partir de quaisquer estímulos sensoriais possíveis, e, ainda assim, os significados e ideias idênticas por eles expressas e os sons idênticos por eles emitidos, podem divergir radicalmente”)[2], assim como

diferenças interculturais e interlinguísticas,

e, por isso, é impossível fornecer uma definição universalmente válida de equivalência. Afinal, a relação entre o texto-fonte e o texto-alvo depende, em certo grau, de decisões individuais tomadas pelo tradutor, embora tais decisões não sejam arbitrárias, mas baseadas em escolhas que foram desenvolvidas durante sua formação. Na interpretação de diálogos, diferentemente da tradução de textos escritos, a tomada de decisão é afetada por limitações de tempo e pela condição da capacidade limitada da memória.

Seguindo o que propõe Koller (1992), a natureza da relação de equivalência deveria ser definida caso a caso (de acordo com o propósito específico de uma tradução). Basicamente, o tradutor tem que escolher entre a equivalência formal (a correspondência entre a forma e o conteúdo de um texto-fonte e alvo) e a equivalência funcional, em que tanto o texto-fonte quanto o texto-alvo cumprem as mesmas funções, mas podem diferir quanto aos aspectos formais (DE WAARD; NIDA, 1986, p. 37). O que foi dito antes pode ser de conhecimento geral (pelo menos para a comunidade de intérpretes e tradutólogos), mas evidencia dois pontos:

1. Se é particularmente difícil avaliar o grau de equivalência entre um texto-fonte e um texto-alvo, é ainda mais difícil prescrever fatores de equivalência para textos que ainda serão traduzidos;
2. Ao interagir com um sistema de interpretação automática, o receptor da língua-alvo deve ser informado sobre o desempenho que se espera do sistema (por exemplo, que tipo de equivalência será estabelecida pelo sistema).

1.2 Fatores relevantes da interpretação humana

Um sistema de interpretação automática não pode, nem almeja, substituir o intérprete humano. Todavia, esse tipo de sistema é desenvolvido para ser empregado em situações altamente convencionais. A investigação dos mecanismos da interpretação humana, no entanto, é necessária para o desenvolvimento de sistemas de interpretação automática. Além disso, a comparação entre tradução humana e tradução automática é uma condição prévia para descrever as possíveis soluções encontradas por um sistema de interpretação automática. Por outro lado, os procedimentos da interpretação só recentemente tornaram-se objeto central de pesquisa (cf. KUENZLI; MOSER-MERCER, 1995). Hahn (1995) resume o estado da arte:

1. A tradução automática (TA) e a interpretação automática (IA) são pragmática e estruturalmente muito diferentes da tradução humana (TH) e interpretação humana (IH);
2. A TA e a IA nunca investigaram em profundidade a TH e a IH como se deveria;
3. Não foram feitos esforços suficientes no campo das Humanidades para analisar os processos de IH e TH.

Por essas razões, no presente trabalho nos concentramos nos fenômenos da interpretação que podem ser isolados diretamente a partir das gravações de diálogos interpretados; e devido às restrições técnicas do sistema, mencionamos apenas alguns fenômenos que, do nosso ponto de vista, são relevantes para o propósito do presente estudo.

Além das constatações gerais de que os intérpretes humanos influenciam diretamente o decurso da comunicação (cf. WANDENSJÖ, 1992), são capazes de adaptar a tradução às demandas da situação em que se encontram e têm a possibilidade de processar informações extralinguísticas, várias estratégias de tradução podem ser isoladas a partir de nossos dados de tradução (ver a seguir informações detalhadas sobre a coleta de dados). O termo estratégia de tradução foi proposto, por exemplo, por Prahl e colaboradores (1995) e refere-se a mecanismos de mudança da estrutura do texto-fonte para o texto-alvo. As estratégias de tradução são aplicadas por diferentes razões, mas a motivação central é facilitar e, por fim, garantir a comunicação.

As seguintes estratégias de tradução são importantes para a proposta descrita aqui:

Redução: Concentra-se na mensagem central, omite informações redundantes.

Emissor (emissor da língua-fonte): Wednesdays or Wednesdays, Fridays or Saturdays are the best for me. I'm something along lines of. Perhaps Saturday, December eighteenth. [Habitualmente às quartas, quartas-feiras, sextas-feiras ou aos sábados são os melhores dias. Pelo menos é assim que tem sido). Talvez sábado, 18 de dezembro].

Intérprete: Wie sieht's Samstag achtzehnten Dezember aus [Que tal sábado, 18 de dezembro?]

Correção: Reparo de um trecho inconsistente da língua-fonte ou adaptação do texto-alvo de acordo com as convenções da língua-alvo.

Emissor: Also, Sie brauchen eine Tastatur, die sowohl Deutsch als auch Englisch versteht? [Então você precisa de um teclado que entenda alemão e inglês?]

Intérprete: That means, you need a keyboard that understands both German and English, if I understand you correctly? [Isso significa que você precisa de um teclado que reconheça tanto a língua alemã quanto a inglesa, se é que eu entendi corretamente?]

As estratégias de redução e correção permitem que o intérprete perceba elementos importantes da comunicação intercultural face a face: fenômenos de desempenho redundantes (que levam a traduções redundantes) podem ser ignorados, ao passo que elementos que não foram contemplados (obrigatórios na língua-alvo para a obtenção dos objetivos da comunicação ou para garantir certo grau de cortesia) podem ser acrescentados.

1.3 Limitações da Interpretação Automática

Ao contrário da interpretação humana, a interpretação automática tem que lidar com as seguintes condições:

o reconhecimento de fala nem sempre será capaz de reconhecer toda a mensagem da língua-fonte;
o conhecimento linguístico disponível para o sistema é limitado;
atualmente, informações não verbais e situacionais não podem ser processadas;
fenômenos irrelevantes para a tradução tais como hesitações e correções devem ser isolados das partes relevantes do discurso.

Como consequência, as relações de equivalência devem ser definidas antecipadamente e o módulo de tradução terá que compensar trechos incompletos. Além disso, as aplicações preliminares do sistema abrangerão apenas domínios limitados, nos quais a estrutura do diálogo e outros fenômenos linguísticos são previsíveis.

2 Interpretação automática: breve síntese do estado da arte

2.1 Os rumos das pesquisas

As abordagens de TA atuais variam de sistemas totalmente automáticos a estações de trabalho (workbenches) para tradutores e sistemas de tradução automática assistida (Machine Aided Translation Systems – MAT), nos quais a pós e/ou pré-edição humanas são componentes centrais do sistema. Obviamente, na maioria dos casos, essas ferramentas podem ser aplicadas apenas a traduções escritas, ao passo que um verdadeiro sistema de interpretação (fala para fala) dificilmente pode contar com a pré- ou pós-edição humanas. Consequentemente, a interpretação automática é realizada sob restrições diferentes da tradução automática.

2.2 Sistemas existentes

Com a crescente credibilidade dada às tecnologias de reconhecimento automático de fala e síntese de voz, a interpretação automática tornou-se uma nova proposta de tradução automática, extremamente interessante e desafiadora. Mas o que antes parecia uma extensão da tradução automática para trechos de fala, acabou significando uma mudança de paradigmas para dar conta das demandas provenientes do processamento de fala. Enquanto alguns sistemas tomam como ponto de partida uma representação que se aproxima o máximo possível do texto escrito, outros sistemas concentram-se na extração de informações relevantes dos enunciados. Pode-se dizer que, enquanto aqueles tentam aplicar a tradução automática para a linguagem oral, estes tentam adicionar um componente de tradução ao reconhecimento de fala. Muitos sistemas se encaixam em uma dessas duas categorias.

No que diz respeito aos sistemas que tentam aplicar a tradução automática à fala, deve-se notar que, devido a deficiências no reconhecimento automático de fala e à natureza da linguagem oral, o mapeamento de fala para texto (gramaticalmente escrito) permanece difícil. Diferentemente, os sistemas de reconhecimento automático de fala com um componente de tradução adicionado geralmente estão mais próximos dos sistemas de consulta automática (automatic inquiry systems) ou das interfaces de linguagem natural (content-extraction systems). Dessa forma, os sistemas de reconhecimento automático de fala com um componente de tradução adicional se preocupam mais em entregar um equivalente mais próximo da língua-alvo do que em obter uma tradução exata (que geralmente envolve uma análise muito completa).

Sistemas projetados especificamente para a tradução de fala espontânea atribuem grande importância à extração de informações pragmáticas (como em KOGURE et al., 1990). Em sistemas assim, a informação pragmática é frequentemente representada com base nos conceitos que dizem respeito aos fatos contidos no enunciado, na relação desses conceitos entre si e no elo entre a estrutura conceitual e a intenção do enunciado.

O sistema Janus, desenvolvido na Universidade Carnegie Mellon e na Universidade de Karlsruhe, é um exemplo dessa abordagem baseada em conceitos. O sistema foi projetado para interpretar diálogos de agendamento de reuniões. Nessa época, as línguas-fonte eram, por exemplo, inglês, alemão e espanhol, e as línguas-alvo incluíam o inglês e alemão (conforme descrito em LEVIN et al., 1995; para maiores informações consultar WAIBEL et al., 1995, WOSZCYNA; WAIBEL, 1994; MAYFIELD et al., 1995). As etapas que compõem o sistema são reconhecimento automático de fala, compreensão e geração de enunciados apropriados na língua-alvo. O módulo de reconhecimento automático de fala analisa o trecho de fala inserido no sistema e depois faz um mapeamento do trecho a fim de gerar uma sequência provável de palavras. O resultado dessas etapas é então comparado aos planos discursivos representados na forma de árvores sintáticas. Os atos de fala são determinados por meio de inferências; um ato de fala específico é então selecionado de acordo com a heurística em foco. Esses dados são processados por componentes de geração, desambiguação final e sintetização de voz. Como podemos ver, o uso de conhecimento discursivo é totalmente integrado à arquitetura do sistema.

2.3 Problemas não resolvidos

De um modo geral, os sistemas de interpretação automática não estão preparados para processar trechos de fala fora de um domínio predefinido. Em alguns casos, é difícil gerar uma tradução porque há uma incompatibilidade entre a análise do trecho da fala-fonte e as condições de transferência, ou a análise do trecho de fala-fonte gera inconsistências. Para línguas estruturalmente distantes, não há possibilidade de fornecer uma tradução subespecificada (palavra por palavra, por exemplo), e as ambiguidades devem ser resolvidas. Experimentos com o par de línguas inglês e japonês, por exemplo, mostraram que para fornecer uma tradução adequada em japonês é necessário reconstruir e completar cerca de 70% das elipses do inglês (KAMEI et al., 1994).

Outros problemas surgem se os desenvolvedores de sistemas ambicionam uma análise profunda e um alto grau de equivalência formal entre o texto-fonte e o texto-alvo:

Profundidade da análise: sistemas que empregam uma análise linguística completa tendem a ser muito precisos no processo de tradução, mas se o trecho na língua-fonte não atender aos padrões predefinidos para o sistema, a análise normalmente requer um tempo considerável ou não propõe uma solução.
Exatidão da tradução: sistemas robustos preocupam-se principalmente em extrair o conteúdo de uma mensagem e tendem a negligenciar a forma exata dos textos-fonte e textos-alvo, visto que normalmente não são capazes de traduzir com qualquer grau de precisão. Existem, no entanto, situações e domínios em que a exatidão é indispensável.

3 Um exemplo de solução: o projeto VERBMOBIL

O Projeto VERBMOBIL, financiado pelo Ministério da Educação, Ciência, Pesquisa e Tecnologia da Alemanha (BMBF – Bundesministerium für Bildung und Forschung), é um projeto de longo prazo para a tradução de fala por meio de diálogos de negociação. O VERBMOBIL combina as duas principais tecnologias de processamento de fala e tradução automática. O desenvolvimento de um sistema assim exige levar em consideração fenômenos linguísticos, como a estrutura dos diálogos, fenômenos de desempenho e interpretação humana, de um lado, e, de outro, propriedades do processamento de linguagem natural e sistemas de TA. Características distintivas da abordagem do VERBMOBIL são descritas em Wahlster (1993, p. 3):

reconhecimento automático de trechos de fala espontânea que envolve diálogos presenciais sobre negócios e que se adapta ao usuário;
dispositivo portátil de tradução que pode ser adaptado ao usuário e aos domínios;
cenário de aplicação em três línguas (inglês, alemão, japonês), sendo o inglês a língua dos diálogos, garantindo a transparência do sistema e a aceitação dos usuários.

3.1 Condições prévias

3.1.1 O cenário de aplicação do VERBMOBIL

O cenário de aplicação do VERBMOBIL pode ser descrito conforme o que se segue.

Dois falantes nativos de línguas maternas diferentes estão planejando uma futura reunião ou viagem de negócios e tentam encontrar uma data conveniente. Ambos os falantes têm pelo menos um conhecimento passivo do inglês, escolhido como a língua dos diálogos. Dependendo da competência ativa em inglês, a mensagem inteira ou partes dela são transferidas para o inglês. O banco de dados do VERBMOBIL consiste em agendamentos de reuniões monolíngues (alemão, inglês) e interpretados (alemão-japonês com interpretação de ambos os textos-fonte para inglês e alemão-inglês, em que a tradução é realizada apenas do alemão para o inglês). Dois tipos de diálogos interpretados são registrados:

Tipo A: Diálogos realizados com a ajuda de um intérprete humano;
Tipo B: Simulação de interpretação automática (Experimentos do Wizard-of-Oz), na qual o intérprete humano não pode ser visto pelos usuários, que acreditam que as traduções são realizadas por um sistema de interpretação automática (para detalhes, cf. BADE et al., 1994).

3.1.2 Características dos dados

Os diálogos de agendamento de reuniões do VERBMOBIL representam dados de um domínio limitado. Os pressupostos básicos são (cf. JEKAT-ROMMEL; MALECK, 1994):

Objetivo comum da comunicação: Ambos os usuários têm um objetivo em comum, ou seja, encontrar uma data que seja adequada a ambos. O foco principal recai sobre os conceitos temporais;
Cooperação: Ambos os usuários tentam atingir seu objetivo gradualmente. Eles colaboram entre si;
Simetria: Ambos os usuários têm experiências profissionais e ocupam posições compatíveis (cf. HAHN; MOHNHAUPT, 1992).
Cortesia: Os usuários não se conhecem pessoalmente, portanto, interagem com um certo grau de cortesia.

3.1.3 Arquitetura do sistemaImportar lista

Atualmente, a arquitetura do sistema VERBMOBIL consiste em vários módulos heterogêneos que lidam com vários níveis de análise, desde o processamento do sinal acústico até a síntese de voz. As abordagens metodológicas abrangem uma extensa gama de amostras, desde o reconhecimento de padrões (reconhecimento de fala) até as linguagens formais (avaliação semântica). O funcionamento do sistema é ilustrado na Figura 1 [3] (ver a seguir).

Os módulos para geração e síntese em alemão são designados apenas para fins de esclarecimento: caso o sistema solicite ao usuário que fale mais alto ou repita sua fala ou caso o agendamento não corresponda às informações contidas no calendário.

Existem três vertentes de análise (ver também as seções 3.3.1 e 3.3.2):

Análise completa, que envolve todos os níveis tradicionais de descrição linguística;
Análise parcial, que utiliza um subconjunto de níveis tradicionais, bem como estratégias específicas para o desenvolvimento de uma hipótese relativa ao significado geral de um enunciado e uma tradução hipotética que preserva esse significado;
Possibilidade de o sistema interromper o diálogo se forem necessários esclarecimentos adicionais devido a problemas técnicos ou uma falha na análise.

A seguir, forneceremos um esboço de algumas das características das análises completa e parcial. Além disso, descreveremos as razões que levaram ao desenvolvimento de técnicas e estratégias para análise parcial (RIPPLINGER, 1994). Como já mencionado, a informação pragmática desempenha um papel muito importante e é frequentemente representada em termos de atos de fala ou unidades relacionadas.

Figura 1
A arquitetura do VERBMOBIL.
dos autores.

A próxima seção trata do modo como as descobertas gerais da Teoria dos Atos de Fala são adaptadas às necessidades especiais do VERBMOBIL.

3.2 Fundamentos teóricos

3.2.1 A teoria dos Atos de Fala

Várias abordagens estabeleceram as vantagens do uso de atos de fala para o Processamento de Linguagem Natural (PLN). Austin (1962) e Searle (1969) desenvolveram uma Teoria dos Atos de Fala com base na fenomenologia e na filosofia existencial. Ao considerar a fala como ação, eles se concentraram na função pragmática da linguagem na comunicação, e não em questões estruturais de um sistema linguístico. Os atos de fala, isto é, unidades da linguagem que representam certos tipos de ações, tornaram-se as unidades centrais de análise. Com ênfase na comunicação, ação e situação do discurso, a Teoria dos Atos de Fala adota uma visão bastante diferente das línguas em comparação com as teorias que defendem a sintaxe e a semântica composicionais independentes das condições pragmáticas de uso. O significado de um enunciado não é necessariamente a soma dos significados de seus constituintes, mas sim uma função do uso do enunciado, expresso por certos elementos estruturados de uma certa forma, em um dado contexto. Devido ao seu foco na situação comunicativa, a Teoria dos Atos de Fala pode ser convenientemente aplicada à análise dos diálogos.

Os atos de fala podem ser analisados em termos de seu conteúdo proposicional e de sua função ilocucionária. O conteúdo proposicional de um enunciado, bem como o de um ato de fala, é determinado pelas informações factuais contidas no segmento do texto. A função ilocucionária de um ato de fala é o potencial de ação associado a todo o enunciado ou a uma parte dele. No processamento de linguagem natural, a Teoria dos Atos de fala é uma ferramenta poderosa para identificar as partes relevantes do discurso. Como vimos, extrair e transferir partes centrais do texto-fonte é o objetivo da tradução tanto para a tradução humana como para a tradução automática. De acordo com a Teoria dos Atos de Fala, todos os outros níveis linguísticos podem ser considerados apenas no que diz respeito à sua contribuição para as informações associadas aos atos de fala. Devido à sua base filosófica, a teoria oferece um pano de fundo para a investigação de uma extensa gama de fenômenos discursivos, mas precisa ser adaptada às necessidades de um domínio limitado (ver a seguir).

3.2.2 Atos de diálogo

Para atender aos problemas ora mencionados e fazer uso das características do domínio limitado, a transferência no VERBMOBIL é auxiliada por dois aspectos centrais do texto-fonte:

1. A referência a uma data (anafórica e explícita);
2. A mensagem central do texto-fonte, por exemplo, se a data é proposta ou rejeitada.

No contexto do VERBMOBIL, a função central do texto-fonte é chamada de ato de diálogo. Em contraste com o termo geral atos de fala, atos de diálogo são unidades de análise adaptadas ao domínio “agendamento de reuniões” e ao propósito especial de processar trechos de fala para a IA (SCHMITZ; QUANTZ, 1995).

Alguns exemplos de atos de diálogo:[4]

[Aceitar]: Datas, locais e períodos propostos são aceitos.

Yes a quarter to three would suit me fine. [Sim, quinze para as três seria bom para mim.]

[Rejeitar]: Datas, locais e períodos são rejeitados.

That's not so good. [Esse horário não é bom.]

[pedir/ sugerir]: O parceiro de diálogo é solicitado a propor algo.

When would it suit you? [Quando estaria bom para você?]

A atribuição automática de atos de diálogo é afetada com base em informações microestruturais e macroestruturais. Unidades microestruturais são segmentos do trecho da língua-fonte que são realmente processados; as informações consistem em palavras-chave, deixas, estrutura sintática, conteúdo semântico e informações pragmáticas locais. As informações macroestruturais são derivadas do conhecimento sobre a estrutura do discurso precedente e a estrutura do calendário. Os tamanhos variados de contexto, portanto, devem ser levados em consideração. O reconhecimento e a representação dos atos de diálogo são modelados de acordo com os padrões estabelecidos na função de descrição lógica do sistema FLEX (para maiores detalhes ver SCHMITZ; QUANTZ, 1995).

3.3 Realização da transferência

A transferência é geralmente entendida como um módulo ou um processo que estabelece uma relação entre a língua-fonte e a língua-alvo por meio da atribuição de uma correspondência estrutural entre uma língua-fonte e uma representação na língua-alvo. No VERBMOBIL, existem várias visualizações integradas do processo de transferência.

3.3.1 Análise integral

Na estrutura que emprega uma análise profunda, a transferência preocupa-se em criar duas representações correspondentes para o conteúdo do texto-fonte e do texto-alvo e estabelecer a relação formal entre as duas representações. Esse link formal pode ser estabelecido apenas se o significado do enunciado na língua-fonte puder ser expresso formalmente em termos lógicos.

O formalismo aplicado ao contexto do VERBMOBIL é a difundida abordagem DRT (Discourse Representation Theory, ver KAMP; REYLE, 1992). No VERBMOBIL, essa forma lógica contém muitos recursos da expressão na língua-fonte e é suficientemente subespecificada para deixar espaço para a interpretação de enunciados.

3.3.2 Análise parcial

Paralelamente a essa abordagem, existem várias tentativas de usar apenas uma análise parcial para aumentar a robustez do sistema. Para a transferência neste contexto, as relações de equivalência são predefinidas em termos de representações dos atos de diálogo, e a análise depende muito desse conhecimento discursivo codificado. As informações relativas aos atos de diálogo geralmente são extraídas não por meio de uma análise completa, mas por técnicas de análise parcial, como a identificação de palavras-chave ou o uso de informações prosódicas. A referência a uma data, importante no domínio de agendamento de reuniões, pode ser entregue com a ajuda de uma gramática de datas. As informações obtidas na análise parcial dão suporte à análise integral.

No subprojeto de arquitetura do VERBMOBIL são investigadas formas de combinar análises integrais e parciais. Estratégias que podem ser identificadas na interpretação humana podem levar a novas ideias sobre possíveis combinações desses métodos.

4 Panorama

Os sistemas de TA existentes dão base à tradução no reconhecimento e na representação do texto-fonte (transferência) ou se sustentam em várias bases de conhecimento, geralmente chamadas de interlíngua.

Obviamente, não há chance de se criar uma interlíngua completa porque é impossível isolar o conhecimento acessível a todas as comunidades linguísticas (conhecimento universal). Porém, com relação ao cenário do VERBMOBIL, as transferências que operam em estruturas linguísticas que – devido às características da linguagem oral antes mencionadas – são incompletas, divergem dos padrões gramaticais e são pragmaticamente muito dependentes da língua, devem ser apoiadas por abordagens baseadas no conhecimento que codifica informações pragmáticas em algum tipo de interlíngua.

Dentro de um domínio muito limitado e restrito a um propósito específico, o conhecimento usado para tradução deve se concentrar nas funções comunicativas, mas para uma extensão do domínio ou aplicações mais complexas, é necessária uma reflexão sistemática sobre as funções comunicativas universais.

Supondo que essa informação já estivesse disponível e que o reconhecimento do texto-fonte fosse melhorado através da integração de informações de fontes de conhecimento adicionais (prosódia, estruturas hierárquicas de informação como comentário de tópico, tema-rema etc., além de sugestões extralinguísticas), poder-se-ia imaginar um intérprete automático usando apenas dois tipos de informação:

informações sobre função comunicativa

informações centrais específicas do domínio do enunciado na língua-fonte.

Nesse cenário, o uso de vários módulos que realizam uma análise e representação profundas do texto-fonte pode ser abandonado.

Referências

AUSTIN, J. How to do things with words. Cambridge, MA.: Harvard University Press, 1962.

BADE, U. et al. Wizard-of-Oz-Experimente mit dem Verbmobil-Simulator. (VM-Memo 24). Hamburg: Universität Hamburg, 1994.

DE WAARD, J.; NIDA, E. From one language to another: Functional equivalence in Bible translation. Nashville: Nelson, 1986.

HAHN, W. V. Introduction. In: HAHN, W. v.; JEKAT, S.J.; MALECK, I. (Eds.). Machine translation and machine interpretation (Proceedings of the VERBMOBIL Workshop Oct 1995). Hamburg: Universität Hamburg, Fachbereich Informatik, 1995.

HAHN, W. V.; MOHNHAUPT, C. Szenarien, Anwendungen und Kommunikationsfelder für Verbmobil. (Verbmobil-Vorstudie). Hamburg: Universität Hamburg, 1992.

JEKAT, S.J. et al. Dialogue acts in VERBMOBIL. (VM-Report 65). Hamburg: Universität Hamburg, 1995.

JEKAT-ROMMEL, S.J.; MALECK, I. Das Szenario für den VM-Prototypen: Vorschläge und Sprachdaten. (VM-Memo 44). Hamburg: Universität Hamburg, 1994.

KAMEI, S. et al. A dialogue analysis using information of the previous sentence. Proceedings of the ICSLP, Yokohama, Japan, 1994, p. 931-934.

KAMP, H.; REYLE, U. From discourse to logic. Dordrecht: Kluwer, 1992.

KOGURE, K.; KUME, M.; HITOSHI, I. Illocutionary act based translation of dialogues. Proceedings of the TMI, Austin, Texas, 1990.

KOLLER, W. Einführung in die Ubersetzungswissenschaft. Heidelberg: Quelle und Meyer, 1992.

KUENZLI, A.; MOSER-MERCER, B. Human strategies for translation and interpretation. In: DRESCHLER-FISCHER, L.; PRIBBENOW, S. (Eds.). KI-95 Activities: Workshops, Posters, Demos. Bonn: Gesellschaft fur Informatik e.V, 1995.

LEVIN, L. et al. Using context in machine translation of spoken language. Proceedings of the TMI, Leuven, Belgium, 1995, p. 173-187.

MAYFIELD, L. et al. Parsing real input in JANUS: A concept-based approach to spoken language translation. Proceedings of the TMI, Leuven, Belgium, 1995, p. 196-205.

PRAHL, B. et al. Variable Analysetiefe und Bewertungskriterien in VERBMOBIL: Translationswissenschaftliche Grundlagen. (VM-Report 54). Hildesheim: Universität Hildesheim, 1995.

QUINE, W. Word and object. Cambridge, MA.: The MIT Press, 1960.

RIPPLINGER, B. Concept-based machine translation and interpretation. Proceedings of the conference: Machine translation ten years on. Cranfield, Great Britain, 1994.

SCHMITZ, B.; QUANTZ, J. J. Dialogue acts in automatic dialogue interpreting. Proceedings of the TMI, Leuven, Belgium, 1995, p. 33-47.

SEARLE, J. Speech acts: An essay in the philosophy of language. Cambridge: Cambridge University Press, 1969.

WADENSJÖ, C. Interpreting as interaction. Linköping: Linkoping University, 1992.

WAHLSTER, W. Verbmobil: Translation of face-to-face dialogs. Proceedings of MT Summit IV, Kobe, Japan, 1993.

WAIBEL, A. et al. Natural speech processing in practice: Experiences with the VERBMOBIL/JANUS-2 System. In: HAHN, W. V.; JEKAT, S.J.; MALECK, L. (Eds.). Machine translation and machine interpretation. Proceedings of the VERBMOBIL-Workshop, Out. 1995. Hamburg: Universität Hamburg, Fachbereich Informatik, 1995.

WOSZCZYNA, M.; WAIBEL, A. Inferring linguistic structure in spoken language. Proceedings of the ICSLP, Yokohama, Japan, 1994, p. 847-850.

REFERÊNCIAS (NOTA DOS TRADOTORES)

ESQUEDA, M. D.; FREITAS, F. de S. A intenção discursiva nos sistemas de interpretação automática. Domínios de Lingu@gem, v. 13, n. 2, p. 511-551, 8 jul. 2019. DOI: https://doi.org/10.14393/DL38-v13n2a2019-4. Disponível em: http://www.seer.ufu.br/index.php/dominiosdelinguagem/article/view/45057. Acesso em: 8 maio 2020.

FREITAS, F. de S. O Estado da arte da interpretação automática: do pós-guerra aos apps de tradução automática de fala. 2016. 159 f. Monografia (Bacharelado em Tradução) - Instituto de Letras e Linguística, Universidade Federal de Uberlândia, Uberlândia, 2016.

FREITAS, F. de S.; ESQUEDA, M. D. Interpretação automática ou tradução automática de fala: conceitos, definições e arquitetura de software. Tradterm, São Paulo, v. 29, Julho/2017, p. 104-145. DOI: https://doi.org/10.11606/issn.2317-9511.v29i0p104-145 . Disponível em: http://www.periodicos.usp.br/tradterm/article/view/134416. Acesso em: 8 maio 2020.

FREITAS, F. de S.; ESQUEDA, M. D. Tradução e interpretação automáticas: origens. Curitiba: Editora CRV, 2020. DOI: https://10.24824/978854443937.1

HURTADO ALBIR, A. Enseñar a traducir: metodología en la formación de traductores e intérpretes. Madrid: Edelsa, 1999.

MOLINA, L; HURATDO ALBIR, A. Translation techniques revisited: a dynamic and functionalist approach. Meta: journal des traducteurs/Meta: Translators' Journal, v. 47, n. 4, p. 498-512, 2002. DOI: https://doi.org/10.7202/008033a. Disponível em: https://www.erudit.org/en/journals/meta/2002-v47-n4-meta688/008033ar.pdf. Acesso em: 12 maio 2020.

Notas

1 N. das A.: Este trabalho foi financiado pelo Ministério da Educação, Ciência, Pesquisa e Tecnologia da Alemanha, no âmbito do projeto VERBMOBIL financiado com a Bolsa 01 IV 101 A/O. O conteúdo veiculado pelo estudo é de inteira responsabilidade das autoras.

2 N. das A.: Two men could just be alike in all their dispositions to verbal behavior under all possible sensory stimulations, and yet the meanings or ideas expressed in their identically triggered and identically sounded utterances could diverge radically.

3 N. das A.: We focused here on interactions of the two transfer modules, for the sake of clarity some existing relations between other components are left out. (Enfatizamos aqui as interações dos dois módulos de transferência. Por questões de espaço, algumas relações existentes entre outros componentes não são contempladas.).

4 N. das A.: Ver Jekat et al. (1995).

Informação adicional

John Benjamins Publishing Company. Amsterdam/Philadelphia: https://www.benjamins.com/catalog/intp

Originally published in / Originalmente publicado em: JEKAT, S. J.; KLEIN, A. Machine interpretation. Open problems and some solutions. Interpreting v. 1, n. 1, 1996.

Direitos de tradução para a língua portuguesa do Brasil cedidos gratuitamente pelas autoras e por: Ineke Elskamp; Departamento de Direitos Autorais; John Benjamins Publishing; Klaprozenweg 75G, NL-1033 NN Amsterdam, The Netherlands

Ligação alternative

https://periodicos.ufmg.br/index.php/textolivre/article/view/24392 (html)