AnHitz, experto virtual en ciencia

Kortabitarte Egiguren, Irati

Elhuyar Zientzia

As tecnoloxías da fala están en continuo desenvolvemento informático. A interactividade tamén está de moda e é posible que no futuro a nosa relación cos mundos virtuais dos computadores sexa totalmente diferente. O eúscaro tamén deu pasos neste campo. Mostra diso é o personaxe virtual AnHitz.
AnHitz, experto virtual en ciencia
01/01/2009 | Kortabitarte Egiguren, Irati | Elhuyar Zientzia Komunikazioa
(Foto: -)

O proxecto AnHitz, desenvolvido entre os anos 2006 e 2008, é o resultado da presentación a mediados de novembro do demo ou AnHitz. AnHitz é un personaxe virtual experto en temas científicos. Fala eúscaro. É capaz de comprender as preguntas que se lle expoñen e de responder ás mesmas. É, por tanto, un personaxe virtual interactivo, experto en ciencia e euskaldun.

Preguntas do usuario sobre ciencia e tecnoloxía (Quen inventou o telescopio?, Cando atoparon a penicilina?, Onde naceu Newton?...) poden facelo en eúscaro ao sistema. Así mesmo, o sistema ofrece respostas en eúscaro. Ademais de responder as preguntas, se se realiza una consulta nunha soa ou en varias palabras, é capaz de buscar os documentos asociados a devandita consulta.

As consultas a través de una ou varias palabras realízanse tamén en eúscaro (capa de ozono, capacidade de beber leite na evolución, vantaxes e inconvenientes das fontes de enerxía renovables...), pero tamén busca documentos en castelán e inglés relacionados con devanditas consultas, ademais de en eúscaro. O sistema traduce automaticamente ao eúscaro os de castelán, e de momento os de inglés dáos na lingua orixinal, pero en breve tamén os traducirá ao eúscaro.

Paira levar a cabo esta tarefa busca en diferentes sitios de ciencia e tecnoloxía en Internet. Ademais, se se desexa, o sistema le estes textos en calquera das tres linguas. Ademais, facendo click sobre o título dos textos, o usuario pode acceder á súa páxina web orixinal e á traducida automaticamente se o desexa. Por suposto, paira conseguilo, é necesario combinar varias tecnoloxías.

Mil tecnoloxías

AnHitz ten máis dun pai e una nai. E é que é a filla dun proxecto realizado conxuntamente por varias empresas. O seu aspecto foi doado polo centro de investigación VICOMTech-IK4, aproveitando a súa tecnoloxía paira crear avatares ou personaxes virtuais. Neste caso desenvolveu un personaxe virtual en forma de muller. Cabe destacar que é tridimensional e que pode expresar emocións. A similitude coa persoa real facilita a comunicación.

(Foto: -)

O grupo de investigación da UPV-EHU Aholkularitza e o centro de investigación Robotiker-Tecnalia formaron no coñecemento e síntese da voz. Grazas a iso, AnHitz é capaz de pronunciar dialectos e palabras con diversas variantes, aínda que el fala en eúscaro unificado. O sistema de resposta ás preguntas e a capacidade de traducir documentos en Internet de forma automática ao eúscaro débese ao grupo IXA da UPV. Finalmente, a habilidade paira buscar documentos multilingües débese ao traballo realizado polo grupo de I+D da Fundación Elhuyar.

Neste amplo proxecto, estas institucións desenvolveron ou mellorado sete recursos, trece ferramentas e sete aplicacións no ámbito do eúscaro. Subvencionado polo programa de investigación ETORTEK do Goberno Vasco.

Ademais, neste proxecto, por primeira vez, agrupáronse nunha soa aplicación diversas ferramentas existentes no ámbito do eúscaro. As tecnoloxías que se uniron son: Question Answering (resposta a preguntas), Cros Lingual Information Retrieval (procura multilingüe de información), Machine Translation (tradución automática), Speech Synthesis (síntese de voz), Automatic speech Recognition (recoñecemento de voz) e Visual Interface (interfaces visuais). Paira ver a capacidade de integración de todas estas tecnoloxías desenvolveuse una demo, AnHitz.

"O demo está baseada nun sistema que nos permita colaborar ao máximo na tecnoloxía lingüística utilizada no proxecto AnHitz", afirma Igor Leturia, membro do grupo de I+D da Fundación Elhuyar e responsable do demo. Mediante este demo o usuario e a máquina poden manter una conversación.

Na Semana da Ciencia, a Tecnoloxía e a Innovación os cidadáns tiveron a oportunidade de coñecer de cerca a AnHitz nas carpas científicas de Donostia e Bilbao. AnHitz recibiu numerosas preguntas e consultas de nenos, novos e adultos. "A acollida foi moi boa e ás veces pódese dicir que sorprendeu á xente, sobre todo aos nenos", engadiu Leturia. "En xeral, os adultos preguntaban a AnHitz con moito coidado e con palabras medidas, tomando conciencia de toda a tecnoloxía que pode haber detrás de todo isto, por dicilo dalgunha maneira, e os nenos, no seu descoñecemento, facíanlle preguntas con toda naturalidade, todo tipo de preguntas", engade.

Durante a Semana da Ciencia, a Tecnoloxía e a Innovación, os visitantes que acudiron ao Cartafol de Ciencias de San Sebastián e Bilbao tiveron a oportunidade de coñecer Anhitz.
L. Cancio

Con todo, AnHitz é un prototipo. "Polo momento, só é un experto en ciencia e tecnoloxía e non responde a todo tipo de preguntas: quen, quen, cando e onde responde mellor a preguntas con encuestadores", subliñou Leturia. "Con todo, sen dúbida, isto ábrenos novas vías. De feito, é posible que no futuro póidase aplicar noutros campos de coñecemento como as oficinas de turismo, realizando procuras noutras bases de coñecemento, por suposto. Así mesmo, seguiremos mellorando toda a tecnoloxía que está detrás de AnHitz, e seguiremos facilitando a comunicación entre persoas e dispositivos", explica Leturia.

Este é o obxectivo do proxecto AnHitz: investigar e desenvolver as tecnoloxías lingüísticas en eúscaro necesarias paira a interacción entre persoas e dispositivos, e xestionar os coñecementos de forma natural, intuitiva e amena. Paira lograr un nivel de comunicación satisfactorio e agradable, o uso da linguaxe debe integrarse en todos os ámbitos da comunicación: a voz, o texto e os materiais multimedia. O personaxe virtual AnHitz é só una pequena mostra diso.

Persoas e dispositivos conversando
Para que a conversación entre persoas e dispositivos sexa posible, por unha banda, o dispositivo debe ser capaz de escoitar e descodificar (comprender) o que o usuario di textualmente. Doutra banda, tamén debe ser capaz de codificar (crear frases) a información que se quere emitir e transmitila ao usuario (mediante palabras).
Como todo isto faise a través das palabras, as linguas adquiren una gran importancia. De feito, o dispositivo debe entender o idioma utilizado polo usuario e, ademais, facilitar ao usuario a información a traducir nun ou outro idioma. Por iso, os expertos baséanse nas tecnoloxías lingüísticas paira resolver os problemas que poden xurdir en relación coa linguaxe na comunicación acode-dispositivo.
Así mesmo, nesta época da sociedade da información, hai máis textos, información e coñecemento ao alcance de todos que nunca, e as ferramentas necesarias paira tratar adecuadamente toda esa información son imprescindibles. Nestas ferramentas tamén son necesarias as tecnoloxías lingüísticas.
Na actualidade, as aplicacións sobre tecnoloxías lingüísticas pódense clasificar en cinco grupos:
· Axuda á edición e comprensión de textos.
(Foto: A. Galarraga)
· Aplicacións que utilizan e xestionan una gran cantidade de texto.
· Tradución automática
· Interfaces usuario dispositivo.
· Tratamento da fala.
Os avances en tecnoloxías lingüísticas son necesarios para que os usuarios poidan comunicarse cos dispositivos con total naturalidade. Nese contexto naceu o proxecto AnHitz.
Kortabitarte Egiguren, Irati
Servizos
249
2009
1.
032
Tecnoloxía
Artigo
Servizos
Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila