AnHitz, experto virtual en ciencia

Kortabitarte Egiguren, Irati

Elhuyar Zientzia

Las tecnologías del habla están en continuo desarrollo informático. La interactividad también está de moda y es posible que en el futuro nuestra relación con los mundos virtuales de los ordenadores sea totalmente diferente. El euskera también ha dado pasos en este campo. Muestra de ello es el personaje virtual AnHitz.
AnHitz, experto virtual en ciencia
01/01/2009 | Kortabitarte Egiguren, Irati | Elhuyar Zientzia Komunikazioa
(Foto: -)

El proyecto AnHitz, desarrollado entre los años 2006 y 2008, es el resultado de la presentación a mediados de noviembre de la demo o AnHitz. AnHitz es un personaje virtual experto en temas científicos. Habla euskera. Es capaz de comprender las preguntas que se le plantean y de responder a las mismas. Es, por tanto, un personaje virtual interactivo, experto en ciencia y euskaldun.

Preguntas del usuario sobre ciencia y tecnología (¿Quién inventó el telescopio?, ¿Cuándo encontraron la penicilina?, ¿Dónde nació Newton?...) pueden hacerlo en euskera al sistema. Asimismo, el sistema ofrece respuestas en euskera. Además de responder a las preguntas, si se realiza una consulta en una sola o en varias palabras, es capaz de buscar los documentos asociados a dicha consulta.

Las consultas a través de una o varias palabras se realizan también en euskera (capa de ozono, capacidad de beber leche en la evolución, ventajas e inconvenientes de las fuentes de energía renovables...), pero también busca documentos en castellano e inglés relacionados con dichas consultas, además de en euskera. El sistema traduce automáticamente al euskera los de castellano, y de momento los de inglés los da en la lengua original, pero en breve también los traducirá al euskera.

Para llevar a cabo esta tarea busca en diferentes sitios de ciencia y tecnología en Internet. Además, si se desea, el sistema lee estos textos en cualquiera de las tres lenguas. Además, haciendo click sobre el título de los textos, el usuario puede acceder a su página web original y a la traducida automáticamente si lo desea. Por supuesto, para conseguirlo, es necesario combinar varias tecnologías.

Mil tecnologías

AnHitz tiene más de un padre y una madre. Y es que es la hija de un proyecto realizado conjuntamente por varias empresas. Su aspecto ha sido donado por el centro de investigación VICOMTech-IK4, aprovechando su tecnología para crear avatares o personajes virtuales. En este caso ha desarrollado un personaje virtual en forma de mujer. Cabe destacar que es tridimensional y que puede expresar emociones. La similitud con la persona real facilita la comunicación.

(Foto: -)

El grupo de investigación de la UPV-EHU Aholkularitza y el centro de investigación Robotiker-Tecnalia han formado en el conocimiento y síntesis de la voz. Gracias a ello, AnHitz es capaz de pronunciar dialectos y palabras con diversas variantes, aunque él habla en euskera unificado. El sistema de respuesta a las preguntas y la capacidad de traducir documentos en Internet de forma automática al euskera se debe al grupo IXA de la UPV. Finalmente, la habilidad para buscar documentos multilingües se debe al trabajo realizado por el grupo de I+D de la Fundación Elhuyar.

En este amplio proyecto, estas instituciones han desarrollado o mejorado siete recursos, trece herramientas y siete aplicaciones en el ámbito del euskera. Subvencionado por el programa de investigación ETORTEK del Gobierno Vasco.

Además, en este proyecto, por primera vez, se han agrupado en una sola aplicación diversas herramientas existentes en el ámbito del euskera. Las tecnologías que se han unido son: Question Answering (respuesta a preguntas), Cross Lingual Information Retrieval (búsqueda multilingüe de información), Machine Translation (traducción automática), Speech Synthesis (síntesis de voz), Automatic speech Recognition (reconocimiento de voz) y Visual Interface (interfaces visuales). Para ver la capacidad de integración de todas estas tecnologías se ha desarrollado una demo, AnHitz.

"La demo está basada en un sistema que nos permita colaborar al máximo en la tecnología lingüística utilizada en el proyecto AnHitz", afirma Igor Leturia, miembro del grupo de I+D de la Fundación Elhuyar y responsable de la demo. Mediante esta demo el usuario y la máquina pueden mantener una conversación.

En la Semana de la Ciencia, la Tecnología y la Innovación los ciudadanos tuvieron la oportunidad de conocer de cerca a AnHitz en las carpas científicas de Donostia y Bilbao. AnHitz recibió numerosas preguntas y consultas de niños, jóvenes y adultos. "La acogida ha sido muy buena y a veces se puede decir que ha sorprendido a la gente, sobre todo a los niños", ha añadido Leturia. "En general, los adultos preguntaban a AnHitz con mucho cuidado y con palabras medidas, tomando conciencia de toda la tecnología que puede haber detrás de todo esto, por decirlo de alguna manera, y los niños, en su desconocimiento, le hacían preguntas con toda naturalidad, todo tipo de preguntas", añade.

Durante la Semana de la Ciencia, la Tecnología y la Innovación, los visitantes que acudieron a la Carpeta de Ciencias de San Sebastián y Bilbao tuvieron la oportunidad de conocer Anhitz.
L. Cancio

Sin embargo, AnHitz es un prototipo. "Por el momento, sólo es un experto en ciencia y tecnología y no responde a todo tipo de preguntas: quién, quién, cuándo y dónde responde mejor a preguntas con encuestadores", ha subrayado Leturia. "Sin embargo, sin duda, esto nos abre nuevas vías. De hecho, es posible que en el futuro se pueda aplicar en otros campos de conocimiento como las oficinas de turismo, realizando búsquedas en otras bases de conocimiento, por supuesto. Asimismo, seguiremos mejorando toda la tecnología que está detrás de AnHitz, y seguiremos facilitando la comunicación entre personas y dispositivos", explica Leturia.

Este es el objetivo del proyecto AnHitz: investigar y desarrollar las tecnologías lingüísticas en euskera necesarias para la interacción entre personas y dispositivos, y gestionar los conocimientos de forma natural, intuitiva y amena. Para lograr un nivel de comunicación satisfactorio y agradable, el uso del lenguaje debe integrarse en todos los ámbitos de la comunicación: la voz, el texto y los materiales multimedia. El personaje virtual AnHitz es sólo una pequeña muestra de ello.

Personas y dispositivos conversando
Para que la conversación entre personas y dispositivos sea posible, por un lado, el dispositivo debe ser capaz de escuchar y descodificar (comprender) lo que el usuario dice textualmente. Por otro lado, también debe ser capaz de codificar (crear frases) la información que se quiere emitir y transmitirla al usuario (mediante palabras).
Como todo esto se hace a través de las palabras, las lenguas adquieren una gran importancia. De hecho, el dispositivo debe entender el idioma utilizado por el usuario y, además, facilitar al usuario la información a traducir en uno u otro idioma. Por ello, los expertos se basan en las tecnologías lingüísticas para resolver los problemas que pueden surgir en relación con el lenguaje en la comunicación persona-dispositivo.
Asimismo, en esta época de la sociedad de la información, hay más textos, información y conocimiento al alcance de todos que nunca, y las herramientas necesarias para tratar adecuadamente toda esa información son imprescindibles. En estas herramientas también son necesarias las tecnologías lingüísticas.
En la actualidad, las aplicaciones sobre tecnologías lingüísticas se pueden clasificar en cinco grupos:
· Ayuda a la edición y comprensión de textos.
(Foto: A. Galarraga)
· Aplicaciones que utilizan y gestionan una gran cantidad de texto.
· Traducción automática
· Interfaces usuario dispositivo.
· Tratamiento del habla.
Los avances en tecnologías lingüísticas son necesarios para que los usuarios puedan comunicarse con los dispositivos con total naturalidad. En ese contexto nació el proyecto AnHitz.
Kortabitarte Egiguren, Irati
Servicios
249
2009
1.
032
Tecnología
Artículo
Servicios
Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila