Traduction automatique

La traduction automatique désigne la traduction d'un texte (ou d'une conversation audio, en direct ou en différé) entièrement réalisée par un ou plusieurs programmes informatiques, sans qu'un traducteur humain n'ait à intervenir. On la distingue de la traduction assistée par ordinateur où la traduction est en partie manuelle, éventuellement de façon interactive avec la machine.

Malgré ses faiblesses, elle peut rendre des services dans des domaines tels que la veille internationale (y compris la veille technologique) [1], où elle permet de prendre connaissance de façon superficielle, mais rapide, de grandes quantités de textes.

Depuis quelques années, elle connaît un essor considérable sur le Web, avec plusieurs systèmes en ligne pouvant traduire automatiquement et en quelques secondes des pages Web ou des textes de plus en plus longs. C'est une aide très appréciée du grand public car elle permet de déchiffrer — de façon certes encore grossière — le thème d'une page Web dans une langue totalement inconnue et les principaux faits ou éléments d'information qu'elle contient. Pour simplifier la navigation, plusieurs moteurs de recherche comme Google, Altavista ou Yahoo! permettent de l'utiliser systématiquement.

Le processus de traduction

Triangle de Vauquois, modèle pour les fondements de la traduction automatique

Le processus de traduction (au sens humain) peut être découpé en trois phases successives :

  1. compréhension : assimilation du sens véhiculé par un texte, du vouloir dire d'un auteur… ;
  2. déverbalisation : oubli des mots et conservation du sens ; « Opération par laquelle un sujet prend conscience du sens d'un message en perdant conscience des mots et des phrases qui lui ont donné corps » [2] ;
  3. réexpression : reformulation du vouloir dire en langue cible.

En termes informatiques, la compréhension devient l'analyse, la déverbalisation devient le transfert et la réexpression devient la génération. Ces étapes du processus sont modélisées dans le triangle de Vauquois [3]. Ce modèle est utile car pour passer de la source à la cible, il existe plusieurs chemins possibles qui constituent les différentes approches envisagées à ce jour. Plus le degré de conceptualisation est élevé, plus court est le chemin du transfert. Il existe quatre possibilités principales :

  • Le transfert direct: pas de conceptualisation, toute la traduction repose sur le transfert. La traduction par l'exemple et la traduction statistique [4] travaillent à ce niveau. La traduction est vue comme un processus de décodage.
  • Le transfert syntaxique: le niveau du transfert est syntaxique. Généralement, sa représentation est l' arbre syntaxique. L'analyse produit une représentation syntaxique pour la langue source. Le transfert consiste à produire une représentation syntaxique pour la langue cible à partir de ce dernier. Finalement la génération produit la phrase en langue cible. La traduction automatique à base de règles est représentative de cette catégorie. Les règles permettent les différentes transformations.
  • Le transfert sémantique: le niveau du transfert est sémantique. Cette voie est celle qu'empruntent les humains. Les modèles de représentation de la sémantique du langage sont décrits par la pragmatique. La sémantique peut être décrite par une ontologie. Il n'y a que peu d'approches de la traduction automatique représentatives du transfert sémantique [5].
  • L'interlangue: Ce niveau supprime la nécessité de transfert. L' interlangue devient universelle. Et seuls restent les processus d'analyse et de génération. l'interlangue est aussi désignée sous le terme de langue pivot. DLT (voir l'article Traduction de langues distribuée) est une tentative inachevée de cette approche. Le langage UNL est aussi un exemple de langage formel informatique permettant de représenter le sens d'un énoncé. L'approche est séduisante car l'effort consiste, pour une langue donnée, à produire un analyseur et un générateur pour l'interlangue. On bénéficie alors de toutes les traductions de ou vers les langues possédant aussi l'analyseur et le générateur. Cette approche reste difficile et n'a pas connu de succès à large échelle.

Actuellement, les moteurs de traduction sont principalement par règles ou statistiques. Une voie dite hybride émerge [6]. Systran, Google Translate, Reverso et Bing Translator  (en) utilisent des approches hybrides.

Other Languages
العربية: ترجمة آلية
azərbaycanca: Maşın tərcüməsi
беларуская: Машынны пераклад
беларуская (тарашкевіца)‎: Машынны пераклад
български: Машинен превод
Esperanto: Maŝintradukado
Bahasa Indonesia: Terjemahan mesin
íslenska: Vélþýðing
日本語: 機械翻訳
한국어: 기계 번역
latgaļu: Puorvārstivs
Bahasa Melayu: Terjemahan mesin
Nederlands: Computervertaling
norsk nynorsk: Maskinomsetjing
norsk bokmål: Maskinoversettelse
Simple English: Machine translation
slovenčina: Strojový preklad
slovenščina: Strojno prevajanje
українська: Машинний переклад
Tiếng Việt: Dịch tự động
吴语: 机器翻译
中文: 机器翻译
粵語: 機械翻譯