Métal. Système de traduction informatique de Siemens

Sagarna, Andoni

Ingeniaria

La société allemande Siemens est le grand fabricant de tout ce qui concerne l'électricité. Cette activité a poussé, après dix ans de recherche, la décision de développer METAL, le système de traduction informatique le plus avancé sur le marché.

Historique du produit

Comme on le sait, la société allemande Siemens est le grand fabricant de tout ce qui concerne l'électricité. Il fabrique également des centrales téléphoniques. Cette activité a poussé, après dix ans de recherche, la décision de développer METAL, le système de traduction informatique le plus avancé sur le marché. En fait, les 100.000 pages composant la documentation d'un système de téléphonie ne pouvaient pas revenir de l'allemand à l'anglais dans des délais et des coûts raisonnables. Pourquoi pas, alors, répondre en développant un produit? Et pourquoi ne pas partir d'un développement qui avait déjà commencé?

Ils ont ainsi acquis le METAL (Machine Edited Text Aspiring Legibility) qui se préparait à l'Université du Texas. Dix ans plus tard, ce système est capable de revenir de l'allemand à l'anglais.

Avant leur lancement, ils ont bien testé le fonctionnement de METAL, d'abord au siège de Munich de Siemens depuis 1986, puis aux bureaux de traduction de Comex et Schönau und Damels de Zürich, puis à Philips Kommunikations-Industre de Nuremberg, Université de Villingen, Mannesmann Kiense et Hille.

Bien qu'à ce jour METAL offre seulement la possibilité de revenir de l'allemand à l'anglais, les traductions de l'allemand à l'espagnol et de l'anglais à l'allemand pourront commencer à essayer ce printemps.

Procédure de travail

METAL est plus qu'un outil de traduction. Il peut être défini comme un paquet intégré de traductions techniques répétitives de grande masse de texte. Ce logiciel nécessite deux ordinateurs: Un ordinateur SINIX du milieu Siemens qui travaille avec le système d'exploitation Unix pour travailler le format du texte et une machine LISP avec la grammaire et le vocabulaire nécessaires pour effectuer la traduction. Les deux machines sont reliées par un réseau Ethernet. L'utilisateur travaille sur un PC connecté comme terminal de l'ordinateur SINIX.

Ce terminal inclut le texte source, soit depuis un disque, par lecture optique et un OCR (programme de reconnaissance de caractères). Du terminal est envoyé à SINIX le texte pour sa traduction. Une fois la formation terminée, il est envoyé à la machine LISP pour son retour et une fois ce travail terminé, il est passé à SINIX pour effectuer la post-édition. L'extension du nouveau lexique et les réglages grammaticaux effectués dans la traduction automatique sont effectués sur l'écran de la machine LISP.

Il est évident que l'objectif de METAL est non seulement de traduire, mais il répond également aux problèmes d'introduction et de formatage du document. Pour cela, graphiques, tableaux, police, etc. du document original. respecte. Si cela peut être fait de manière rigide, le problème serait simple, mais comme n'importe quel traducteur sait, à son retour changent la longueur et l'ordre des mots.

Pour surmonter cette objection, METAL divise d'abord le format et le texte. METAL supporte le texte élaboré sur des processeurs de texte tels que Word Star ou Word Perfect.

Une fois le format et le texte divisé, le texte est divisé en courtes phrases et envoyé à la machine LISP pour la traduction.

Cette machine, en premier lieu, recherche dans le texte des mots inconnus, qui n'ont pas dans le dictionnaire, et une fois énumérés ceux-ci, l'utilisateur doit coder les nouvelles entrées lexicales selon des critères linguistiques, en utilisant le système de fenêtres auxiliaire que lui offre le programme.

L'analyse préliminaire montre les apparitions des nouveaux mots et leurs contextes. Ainsi, l'utilisateur peut rapidement voir l'utilisation de ces mots. Par ailleurs, c'est aussi un moyen de détecter les écrits erronés, car les mots mal écrits auront normalement une forme inconnue.

METAL utilise trois dictionnaires de base. Il comporte deux dictionnaires monolingues, chacun de 50.000 entrées, l'un en allemand et l'autre en anglais, et un dictionnaire d'équivalence entre les mots des deux langues. Ces dictionnaires sont hiérarchisés : les morphèmes grammaticaux sur eux, le vocabulaire commun sous eux et le vocabulaire technique général ci-dessous. En outre, il existe des dictionnaires techniques (informatique, télécommunications, médecine, etc.) organisé par modules.

L'analyse préliminaire mentionnée crée une série de fichiers de glossaires qui informent sur le retour de chaque terme à travers différents dictionnaires techniques spécialisés.

Il existe aussi un fichier de mots composés qui, après analyse des mots composés inconnus, génère des équivalents provisoires à partir de la signification des composants. On peut dire qu'il réussit dans 70% des cas moyens. Plus le texte est technique, plus ce système a de succès.

Lors de la traduction d'un terme, l'équivalent est recherché d'abord dans les dictionnaires les plus spécialisés et, s'il n'y en a pas, il fait appel aux plus généraux à la recherche. Cependant, l'utilisateur peut modifier cette commande s'il le souhaite.

Les dictionnaires qui ont METAL ne sont pas exactement les mêmes que ceux que nous voyons sous forme de livre. Chaque entrée contient des informations morphologiques et syntaxiques, représentées par des règles de réécriture. Il propose des règles par défaut pour les nouveaux mots.

La traduction est réalisée par la base de données des règles linguistiques qui sont chargées de l'analyse des phrases. Cela recherche des phrases introduites au niveau le plus profond. Puis il va lentement vers la surface, assignant des règles de composant structurel à chaque niveau. En arrivant aux patchs superficiels, il crée une structure arborescente pour toute la prière.

Avant de sélectionner le dernier arbre, utilisez une stratégie de probabilité dans les cas où il y a la possibilité d'appliquer plus d'une règle. Cela demande beaucoup de mémoire: Plus de 120Mb.

Une fois l'arbre obtenu, la machine LISP place les phrases dans une forme de représentation similaire à la grammaire des cas.

À partir de ce niveau d'analyse profonde, le système génère un arbre de sortie dans la langue cible. L'utilisateur a la possibilité de modifier les codes des patchs de celui-ci, si nécessaire.

Le système analyse chacune des phrases et stocke la traduction obtenue dans un fichier de sortie pour la post-édition.

Coût et bénéfice

METAL traduit environ 200 pages en une journée de 8 heures. Cette vitesse peut sembler élevée ou faible, mais si l'on considère la traduction complète (y compris le formatage) on peut dire qu'il est assez rapide, puisque l'employé du poste de post-édition ne peut pas préparer plus de 40 ou 50 pages. Par conséquent, pour formater définitivement le travail réalisé par METAL une nuit par jour suivant, cinq postes de post-édition sont nécessaires. Bien que la traduction soit plus rapide, si vous ne mettez pas plus de personnel et plus de machines dans le processus ultérieur, vous ne rationaliserez pas le travail. Combien coûte tout cela ? Les comptes sont :

SINIX MX 300 avec imprimante laser et périphérique: 2.600.000 pts. et coût d'entretien de la machine 22.000 pts. mensuellement.
Logiciel pour machine SINIX: 208.000 ptas.
Machine LISP: 6.500.000 m.
Logiciel de traduction METAL: 5.850.000 pts. et 60 000 m. coût mensuel de maintenance.

Avec un investissement total de 15.000.000 pesetas et un coût d'entretien mensuel de 82.000 pesetas.

Découvrez si vous devez acheter.

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila