Creen una nova tècnica per a corregir el biaix de gènere en la traducció automàtica

itzulpen-automatikoan-genero-alborapena-zuzentzeko
Xabier Saralegi Urizar i Ander Corral Naves, investigadors d'Orai.

Els investigadors d'Orio han creat una nova tècnica per a corregir el biaix de gènere en la traducció automàtica. El resultat d'aquesta recerca serà de gran utilitat per a corregir el problema que tenen els traductors automàtics, especialment els traductors automàtics que permeten traduir de llengües sense gènere.

El biaix de gènere és un problema conegut en l'àmbit de la intel·ligència artificial. Com la majoria dels algorismes aprenen dels exemples, també aprenen els biaixos i estereotips socials presents en els exemples introductoris. Per tant, els sistemes que aprenen amb aquests algorismes tendeixen a repetir aquest biaix.

Els sistemes neuronals de traducció automàtica també tenen aquest problema i porten a les traduccions el biaix de gènere que apareix en els exemples d'entrenament. Per exemple:

La meva mare és ferrera. La meva mare és ferrer.
El meu pare és infermera. Nire aita és infermera.

L'ús massiu de sistemes de traducció automàtica comporta el risc de mantenir i incrementar aquest tipus de biaixos de gènere. La gestió del problema del biaix de gènere no és fàcil, i molt menys quan la traducció es realitza des d'una llengua sense gènere, com el basc. Orai ha investigat i desenvolupat una tècnica innovadora per a llengües sense gènere.

La tècnica proposada combina dos mètodes: “Aprenent sistemes neuronals amb biaix des d'exemples equilibrats, un mètode per a corregir aquest biaix i un mètode per a incorporar de manera explícita la informació de gènere al sistema neuronal en una llengua sense gènere”, ha assenyalat l'investigador d'Orai, Ander Corral Naves.

Així mateix, “la tècnica creada és computacionalment àgil i no és complexa la seva integració en sistemes en producció”, ha afegit el responsable de NLP Tecnologies d'Orai, Xabier Saravia Urizar. “És un pas important: gràcies a aquesta tècnica estem més prop de la traducció automàtica sense biaixos de gènere”.

Aquest treball ha estat presentat en la Setena Conferència de Traducció Automàtica (Seventh Conference on Machine Translation - WMT22).

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila