JJJ8 perdido na selva da lingua

Roa Zubia, Guillermo

Elhuyar Zientzia

Fausto dixo: "Dificilmente atoparás o sal no salón".O robot cociñeiro JJ8 permaneceu en silencio durante dez segundos, pero non volveu á cociña. "Vou facer un esforzo", respondeu.
JJJ8 perdido na selva da lingua
01/11/2009 | Roia Zubia, Guillermo | Elhuyar Zientzia Komunikazioa

Os robots son máquinas, non teñen oído. Paira poder escoitalo necesitan un micrófono, dixitalizan esa onda da voz e descobren a mensaxe do orador. Enxeñeiros e informáticos participaron neste sistema de recoñecemento de voz. O obxectivo non é fácil: a máquina debe comprender a mensaxe con independencia do ton e a dicción do orador.

Paira iso é necesario que a máquina se forme previamente. Son técnicas de intelixencia artificial. Ten que aprender. Non é estraño, o home tamén aprende así. Os nenos tardan anos en coñecer as palabras que se lles din e en atrapar a mensaxe que se lles dá coa fala. Os adultos tamén fan o mesmo cando aprenden un novo idioma. Teñen que "facer orella". E con ese feitizo tampouco termina o que hai que aprender.

O robot JJ8 É difícil atopar sal no salón cando recibe a frase, ten que facer moitas cousas paira comprendela. Xa coñece a sucesión de cinco palabras, pero agora debe aclarar cal é a estrutura da frase. Ten que segmentarse, é dicir, ten que saber que as palabras forman un conxunto intelixente, que a palabra sal é outra, e que a palabra no salón é outra. E debe aclarar por que forman estes conxuntos e non outros.

Ademais, deberá analizalo literalmente. Debe saber que é verbo atopar, sal, etc. E debe identificar as lemas: identificar a lema que se atopa detrás da palabra atopar. É dicir, ten que ser a forma básica das palabras que recibiu paira buscar significado.

A través do mundo humano

(Foto: Guillermo Roia)

De momento, JJ8 non entendeu nada. Sabe que palabras compoñen a frase, como están organizadas e por onde debe partir paira buscar o significado de cada palabra, pero non entendeu nada. Non ten coñecementos nin contexto paira comprender a frase. Pero o seguinte paso é comprender o devandito por Fausto. O cuñado está a piques de mergullarse no mundo da ambigüidade.

Afortunadamente, estas palabras non teñen moito sentido. Ao parecer, o sal é o sal, é dicir, non parece que esa palabra indique outra cousa que non sexa o cloruro sódico. Pero non é do todo certo: pode ser sinónimo de graza ou de vitalidade. Neste caso, JJ8 deberá descartar este significado e aclarar que Fausto refírese ao cloruro sódico.

A forma máis eficaz que inventaron os informáticos paira facelo é o método estatístico. JJJ8 deberá buscar a lema de sal en moitos textos e analizar con que outras palabras aparece habitualmente. É un traballo difícil, que se lle explicará con frecuencia en textos de carácter laboratorio, pero que non lle axuda. Claramente, a mensaxe de Fausto non ten ningunha relación coa química (ou polo menos creo). Con todo, na maioría dos textos que acompañan ao sal e ao descubrimento, o sal será sinónimo de cloruro sódico. Non sempre. Pero se é así na maioría dos casos, deberá tomar una decisión --difícil - a favor desa acepción. Hoxe en día, os informáticos fixeron un bo traballo para que as máquinas tomen este tipo de decisións, e con todo, a estatística non sempre é a mellor maneira de conseguilo (é posible que nalgúns contextos nos que coexistan palabras de sal e atopar o significado do sal sexa a graza ou a vitalidade).

Os informáticos (e os lingüistas) chaman desambiguación ao traballo de elixir o sentido correcto de cada palabra. A máquina é imprescindible paira entender una conversación e, en moitos casos, o principal problema a superar. Pero non é o único problema.

Paira entender a Fausto, JJ8 debería facer una lectura a outro nivel. É difícil atopar o verdadeiro significado da frase Non o atoparás. Con todo, o gajo JJ8 cre que si, que dificilmente a palabra indica que terá que facer un esforzo especial.

Pero a linguaxe do home non é claro e directo. Está infestado de metáforas, ironía, hipérbolas e outros trucos. Moitas veces utiliza una frase paira expresar algo que non significa esa frase. Até logo di que sabendo que non se vai a unir con ninguén. Tes horas? di preguntarse que hora é e non paira confirmar que o outro ten un reloxo que funciona correctamente. Hai moitos outros exemplos.

Resposta

(Foto: Guillermo Roia)

JJJ8 entendeu o que puido e responde en función do que entendeu. Pero este proceso tampouco é fácil. E é que nunha entrevista necesítanse respostas de todo tipo. Ás veces hai que buscar un dato paira responder. Outras veces una explicación completa. Outras veces hai que responder a unha provocación. Hai de todo.

E buscar cada tipo implica una estratexia propia. Novamente atopámonos coa intelixencia artificial: técnicas de resposta a preguntas, procura intelixente, extraccións de información, tradución automática de información en varios idiomas, etc. E, por suposto, tamén son necesarias combinacións destas técnicas.

O traballo do robot está a tomar forma. Pódese dicir que buscando a resposta fixo o máis difícil. Pero non acaba do todo. Debe dar forma de fala a esta resposta. Utilizar técnicas de creación lingüística. Dalgunha maneira é un camiño cara atrás. Recibiu voz, analizou o idioma do devandito, entendeuno, buscou una resposta e agora ten que facer o contrario. Aplica as regras do idioma á resposta e crea un texto apropiado paira falar.

E finalmente, JJ8 debe sintetizar a voz paira dicir o que está nese texto. Quizá sexa o máis fácil. A creación da voz sintética está en gran medida desenvolvida, salvo que se requiran emocións e un ton moi especial.

Por fin! O robot responde. Neste caso, Fausto dille a JJ8 que vaia á cociña. Nada máis. O robot non necesitaba resposta. De volta á cociña, tiña que buscar alí o sal (salero). Pero respondeu e a verdade é que grazas á resposta sabe o que pensou Fausto JJ8.

Fausto non está moi contento porque o robot cociñeiro non lle entende do todo, e iso obrígalle a falar de forma concreta e clara. Pero vendo o difícil que é crear una conversación artificial, Fausto debería estar satisfeito.

Realidade

JJ8 non é real. Nace como exemplo das dificultades que ten capacitar a unha máquina paira falar. Pero os seus robots reais alternativos deben superar dificultades similares en función das súas aplicacións. Poida que non dean os mesmos pasos que o robot JJ8 ou o fagan no mesmo orde. Pero, en todos os casos, a ciencia e a tecnoloxía que hai detrás teñen que ver co procesamiento da linguaxe. As principais dificultades que presentan as máquinas expendedoras de verdade son as de procesamiento da linguaxe humana.

Os investigadores avanzaron neste camiño. Con todo, os expertos coinciden en que aínda falta moito para que as máquinas poidan falar como persoas. A investigación está só nos primeiros pasos, pero o traballo xa realizado é sorprendente; por unha banda, a colaboración entre informáticos e lingüistas mostrou as dificultades da conversación artificial e, por outro, comezou a desenvolver estratexias paira a maioría dos pasos. Non é pouco.

Ponte Roia, Guillermo
Servizos
258
2009
Resultados
019
Robótica
Artigo
Servizos
Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila