AnHitz, expert virtual en ciència

Kortabitarte Egiguren, Irati

Elhuyar Zientzia

Les tecnologies de la parla estan en continu desenvolupament informàtic. La interactivitat també està de moda i és possible que en el futur la nostra relació amb els mons virtuals dels ordinadors sigui totalment diferent. El basc també ha fet passos en aquest camp. Mostra d'això és el personatge virtual AnHitz.
AnHitz, expert virtual en ciència
01/01/2009 | Kortabitarte Egiguren, Irati | Elhuyar Zientzia Komunikazioa
(Foto: -)

El projecte AnHitz, desenvolupat entre els anys 2006 i 2008, és el resultat de la presentació a mitjan novembre de la demo o AnHitz. AnHitz és un personatge virtual expert en temes científics. Parla basca. És capaç de comprendre les preguntes que se li plantegen i de respondre a aquestes. És, per tant, un personatge virtual interactiu, expert en ciència i euskaldun.

Preguntes de l'usuari sobre ciència i tecnologia (Qui va inventar el telescopi?, Quan van trobar la penicil·lina?, On va néixer Newton?...) poden fer-ho en basc al sistema. Així mateix, el sistema ofereix respostes en basca. A més de respondre a les preguntes, si es realitza una consulta en una sola o en diverses paraules, és capaç de buscar els documents associats a aquesta consulta.

Les consultes a través d'una o diverses paraules es realitzen també en basca (capa d'ozó, capacitat de beure llet en l'evolució, avantatges i inconvenients de les fonts d'energia renovables...), però també busca documents en castellà i anglès relacionats amb aquestes consultes, a més d'en basca. El sistema tradueix automàticament al basc els de castellà, i de moment els d'anglès els dóna en la llengua original, però en breu també els traduirà al basc.

Per a dur a terme aquesta tasca busca en diferents llocs de ciència i tecnologia en Internet. A més, si es desitja, el sistema llegeix aquests textos en qualsevol de les tres llengües. A més, fent clic sobre el títol dels textos, l'usuari pot accedir a la seva pàgina web original i a la traduïda automàticament si ho desitja. Per descomptat, per a aconseguir-ho, és necessari combinar diverses tecnologies.

Mil tecnologies

AnHitz té més d'un pare i una mare. I és que és la filla d'un projecte realitzat conjuntament per diverses empreses. El seu aspecte ha estat donat pel centre de recerca VICOMTech-IK4, aprofitant la seva tecnologia per a crear avatars o personatges virtuals. En aquest cas ha desenvolupat un personatge virtual en forma de dona. Cal destacar que és tridimensional i que pot expressar emocions. La similitud amb la persona real facilita la comunicació.

(Foto: -)

El grup de recerca de la UPV-EHU Aholkularitza i el centre de recerca Robotiker-Tecnalia han format en el coneixement i síntesi de la veu. Gràcies a això, AnHitz és capaç de pronunciar dialectes i paraules amb diverses variants, encara que ell parla en basc unificat. El sistema de resposta a les preguntes i la capacitat de traduir documents en Internet de manera automàtica al basc es deu al grup IXA de la UPV. Finalment, l'habilitat per a buscar documents multilingües es deu al treball realitzat pel grup d'I+D de la Fundació Elhuyar.

En aquest ampli projecte, aquestes institucions han desenvolupat o millorat set recursos, tretze eines i set aplicacions en l'àmbit del basc. Subvencionat pel programa de recerca ETORTEK del Govern Basc.

A més, en aquest projecte, per primera vegada, s'han agrupat en una sola aplicació diverses eines existents en l'àmbit del basc. Les tecnologies que s'han unit són: Question Answering (resposta a preguntes), Cross Lingual Information Retrieval (cerca multilingüe d'informació), Machine Translation (traducció automàtica), Speech Synthesis (síntesi de veu), Automatic speech Recognition (reconeixement de veu) i Visual Interface (interfícies visuals). Per a veure la capacitat d'integració de totes aquestes tecnologies s'ha desenvolupat una demo, AnHitz.

"La demo està basada en un sistema que ens permeti col·laborar al màxim en la tecnologia lingüística utilitzada en el projecte AnHitz", afirma Igor Leturia, membre del grup d'I+D de la Fundació Elhuyar i responsable de la demo. Mitjançant aquesta demo l'usuari i la màquina poden mantenir una conversa.

En la Setmana de la Ciència, la Tecnologia i la Innovació els ciutadans van tenir l'oportunitat de conèixer de prop a AnHitz en les carpes científiques de Donostia i Bilbao. AnHitz va rebre nombroses preguntes i consultes de nens, joves i adults. "L'acolliment ha estat molt bona i a vegades es pot dir que ha sorprès la gent, sobretot als nens", ha afegit Leturia. "En general, els adults preguntaven a AnHitz amb molta cura i amb paraules mesurades, prenent consciència de tota la tecnologia que pot haver-hi darrere de tot això, per dir-ho d'alguna manera, i els nens, en el seu desconeixement, li feien preguntes amb tota naturalitat, tot tipus de preguntes", afegeix.

Durant la Setmana de la Ciència, la Tecnologia i la Innovació, els visitants que van acudir a la Carpeta de Ciències de Sant Sebastià i Bilbao van tenir l'oportunitat de conèixer Anhitz.
L. Cancio

No obstant això, AnHitz és un prototip. "De moment, només és un expert en ciència i tecnologia i no respon a tota mena de preguntes: qui, qui, quan i on respon millor a preguntes amb enquestadors", ha subratllat Leturia. "Tanmateix, sens dubte, això ens obre noves vies. De fet, és possible que en el futur es pugui aplicar en altres camps de coneixement com les oficines de turisme, realitzant cerques en altres bases de coneixement, per descomptat. Així mateix, continuarem millorant tota la tecnologia que està darrere d'AnHitz, i continuarem facilitant la comunicació entre persones i dispositius", explica Leturia.

Aquest és l'objectiu del projecte AnHitz: investigar i desenvolupar les tecnologies lingüístiques en basca necessàries per a la interacció entre persones i dispositius, i gestionar els coneixements de manera natural, intuïtiva i amena. Per a aconseguir un nivell de comunicació satisfactori i agradable, l'ús del llenguatge ha d'integrar-se en tots els àmbits de la comunicació: la veu, el text i els materials multimèdia. El personatge virtual AnHitz és només una petita mostra d'això.

Persones i dispositius conversant
Perquè la conversa entre persones i dispositius sigui possible, d'una banda, el dispositiu ha de ser capaç d'escoltar i descodificar (comprendre) el que l'usuari diu textualment. D'altra banda, també ha de ser capaç de codificar (crear frases) la informació que es vol emetre i transmetre-la a l'usuari (mitjançant paraules).
Com tot això es fa a través de les paraules, les llengües adquireixen una gran importància. De fet, el dispositiu ha d'entendre l'idioma utilitzat per l'usuari i, a més, facilitar a l'usuari la informació a traduir en l'un o l'altre idioma. Per això, els experts es basen en les tecnologies lingüístiques per a resoldre els problemes que poden sorgir en relació amb el llenguatge en la comunicació persona-dispositiu.
Així mateix, en aquesta època de la societat de la informació, hi ha més textos, informació i coneixement a l'abast de tots que mai, i les eines necessàries per a tractar adequadament tota aquesta informació són imprescindibles. En aquestes eines també són necessàries les tecnologies lingüístiques.
En l'actualitat, les aplicacions sobre tecnologies lingüístiques es poden classificar en cinc grups:
· Ajuda a l'edició i comprensió de textos.
(Foto: A. Galarraga)
· Aplicacions que utilitzen i gestionen una gran quantitat de text.
· Traducció automàtica
· Interfícies usuari dispositiu.
· Tractament de la parla.
Els avanços en tecnologies lingüístiques són necessaris perquè els usuaris puguin comunicar-se amb els dispositius amb total naturalitat. En aquest context va néixer el projecte AnHitz.
Kortabitarte Egiguren, Irati
Serveis
249
2009
1.
032
Tecnologia
Article
Serveis
Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila