La magie limites de la traduction automatique

Cortés Etxabe, Itziar

Elhuyarreko itzulpengintza-teknologien arduraduna

itzulpen-automatikoaren-magia-eta-mugak
Ed. Stockmonkeys.com/CC-BY

Par définition, la traduction automatique est un système informatique qui traduit d'une langue à l'autre, sans intervention humaine pendant le processus de traduction. Cette traduction, qui se produit automatiquement, peut être utilisée comme moyen de compréhension ou de traduction de textes, ce qui peut être dû à la confusion fréquente entre systèmes de traduction automatique et dictionnaires. Mais les deux ressources ont des différences. Par exemple, les résultats obtenus lors de la recherche dans les dictionnaires ont été élaborés manuellement par des professionnels. En revanche, dans les systèmes de traduction automatique, bien que les données utilisées comme base soient élaborées par des professionnels, la réponse est toujours générée par la machine elle-même, qui est générée automatiquement. Cependant, la principale différence du point de vue des utilisateurs ordinaires est que les systèmes de traduction automatique peuvent traduire des phrases complètes ou des mots.

Parmi les systèmes de traduction automatique les plus connus se trouve Google Translator. Ce système permet de traduire automatiquement jusqu'à 70 langues, dont le basque depuis 2010. Mais pourquoi sortent des traductions curieuses dans ce type de systèmes ?

Lorsque nous voyageons sur Internet, il est assez fréquent de trouver les informations que nous recherchons dans une autre langue et d'utiliser un système de traduction automatique pour comprendre ces informations. Par conséquent, l'utilisateur doit connaître les avantages et les inconvénients de l'utilisation de la traduction automatique. Un tel système ne fournit pas toujours une traduction exacte et est à la disposition de l'utilisateur de quoi faire avec cette traduction obtenue automatiquement. Les résultats obtenus automatiquement ont été vus dans la publicité et dans d'autres affiches.

Voici quelques exemples connus : "Bus, matin et soir", en basque "Autobus matin et soir"; "Combinaison de trains", "Sous-commission de trains"; et "Premier étage", "Premier étage".

En janvier, Google a mélangé les systèmes de traduction automatique de Guardiola e Iniesta avec ses pays d'origine, bien connus dans le monde du football, dans la traduction du catalan en anglais. Mais pourquoi ces types de traductions apparaissent automatiquement?

Les systèmes de traduction automatique peuvent être classés en deux groupes en fonction des techniques utilisées pour leur création : systèmes basés sur des statistiques et systèmes basés sur des règles.

Le Google Translate mentionné ci-dessus est l'un des systèmes de traduction automatique basés sur les statistiques les plus connus. Ces types de systèmes sont basés sur des modèles statistiques qui sont générés à partir de l'utilisation de collections de textes. Par exemple, si nous voulons créer un système entre le basque et l'espagnol, nous devrons nous baser sur une collection de textes du type: chaque phrase en basque devra être traduite en espagnol. A partir de ces collections de textes sont créés des modèles statistiques qui seront le noyau du système de traduction automatique.

Dans l'unité Elhuyar de Langue et Technologie nous avons également ce type de systèmes, et cette année nous implantons un tel système dans le MINHAP (Ministère des finances et des administrations publiques de l'Espagne). Les pages web utiliseront ce système pour traduire de l'espagnol à l'basque et à l'anglais, et examineront les résultats obtenus automatiquement par une révision manuelle.

Au contraire, les systèmes basés sur des règles ont une base linguistique, c'est-à-dire sont basés sur des dictionnaires et des ressources comme les règles liées à la langue. Bien qu'ils offrent habituellement des résultats plus raisonnables que les statistiques, ce type de systèmes présente également des difficultés et des résultats rares. Les mots polysémémiques, par exemple, donnent assez de travail au moment de revenir. Prenons, par exemple, le mot "temps" en espagnol, avec douze acceptions en basque (hiztegiak.elhuyar.org/fr/temps): temps, temps...; il faut apprendre au système de traduction automatique à choisir lequel des acceptions est le plus approprié.

Matxin est un exemple d'un système qui traduit automatiquement de l'espagnol à l'euskera à partir des règles.Le système Matxin (http://matxin.elhuyar.org) a été développé conjointement par Elhuyar Hizkuntza eta Teknologia et le groupe Ixa de l'UPV/EHU et sert à traduire des documents. Cependant, comme mentionné ci-dessus, lorsque nous utilisons la traduction automatique, nous ne devons pas oublier que les résultats générés automatiquement doivent être vérifiés.

Pour voir la différence entre les systèmes de base statistique et linguistique, voici quelques exemples. Par exemple, Google Traslat traduit l'expression "L'homme qui est venu était mon oncle" comme suit: "L'homme est venu mon oncle" et Matxin 2.0: "L'homme qui est venu était mon oncle". D'autre part, Google Translat retourne l'expression "Ils ont dit que demain il fera beau temps" et Matxin 2.0, "Ils ont dit que demain, il fera beau temps".

Quand on parle de traduction automatique, il y a quelqu'un qui nous regarde avec suspicion. Cependant, comprendre le sujet peut changer l'approche de l'utilisation de cette ressource. En disant que la traduction est faite automatiquement, nous ne voulons pas dire que le résultat est une traduction directe, c'est-à-dire une traduction professionnelle. Ce que nous voulons transmettre, c'est qu'il offrira un résultat généré automatiquement, qui transforme un texte d'une langue choisie par nous en une autre. Si vous demandiez un avis sur les systèmes de traduction automatique, nous obtiendrions logiquement des réponses en fonction de l'utilisateur qui utilise le système. Par conséquent, l'utilisation consciente de ce type de ressources est indispensable.

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila