Crean unha nova técnica para corrixir o rumbo de xénero na tradución automática

itzulpen-automatikoan-genero-alborapena-zuzentzeko
Xabier Saralegi Urizar e Ander Curral Naves, investigadores de Orai.

Os investigadores de Orio crearon unha nova técnica para corrixir o rumbo de xénero na tradución automática. O resultado desta investigación será de gran utilidade para corrixir o problema que teñen os tradutores automáticos, en especial os tradutores automáticos que permiten traducir de linguas sen xénero.

O rumbo de xénero é un problema coñecido no ámbito da intelixencia artificial. Como a maioría dos algoritmos aprenden dos exemplos, tamén aprenden os rumbos e estereotipos sociais presentes nos exemplos introdutorios. Por tanto, os sistemas que aprenden con estes algoritmos tenden a repetir este rumbo.

Os sistemas neuronais de tradución automática tamén teñen este problema e levan ás traducións o rumbo de xénero que aparece nos exemplos de adestramento. Por exemplo:

A miña nai é ferreira. A miña nai é ferreiro.
O meu pai é enfermeira. Nire aita é enfermeira.

O uso masivo de sistemas de tradución automática leva o risco de manter e incrementar este tipo de rumbos de xénero. A xestión do problema do rumbo de xénero non é fácil, e moito menos cando a tradución se realiza desde unha lingua sen xénero, como o eúscaro. Orai investigou e desenvolvido unha técnica innovadora para linguas sen xénero.

A técnica proposta combina dous métodos: “Aprendendo sistemas neuronais con rumbo desde exemplos equilibrados, un método para corrixir este rumbo e un método para incorporar de forma explícita a información de xénero ao sistema neuronal nunha lingua sen xénero”, sinalou o investigador de Orai, Ander Curral Naves.

Así mesmo, “a técnica creada é computacionalmente áxil e non é complexa a súa integración en sistemas en produción”, engadiu o responsable de NLP Tecnoloxías de Orai, Xabier Saravia Urizar. “É un paso importante: grazas a esta técnica estamos máis preto da tradución automática sen rumbos de xénero”.

Este traballo foi presentado na Sétima Conferencia de Tradución Automática (Seventh Conference on Machine Translation - WMT22).

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila