AnHitz, zientzia-aditu birtuala

Kortabitarte Egiguren, Irati

Elhuyar Zientzia

Hizketaren teknologiak etengabe ari dira garatzen informatikaren arloan. Interaktibitatea ere puri-purian dago, eta baliteke etorkizunean ordenagailuen mundu birtualekin dugun harremana erabat ezberdina izatea. Euskarak ere egin ditu urratsak arlo horretan. AnHitz pertsonaia birtuala da horren erakusgarri.
AnHitz, zientzia-aditu birtuala
2009/01/01 | Kortabitarte Egiguren, Irati | Elhuyar Zientziaren Komunikazioa
(Argazkia: -)

2006tik 2008ra garatu den AnHitz proiektuaren emaitza da azaroaren erdialdean aurkeztu zuten AnHitz demoa edo prototipoa. AnHitz pertsonaia birtual bat da, zientzia-kontuetan aditua, gainera. Euskaraz hitz egiten du. Egiten zaizkion galderak ulertzeko gauza da, eta galderei erantzuteko ere bai. Hortaz, pertsonaia birtual interaktiboa da, zientzian aditua eta euskalduna.

Erabiltzaileak zientzia eta teknologiari buruzko galderak (Nork asmatu zuen teleskopioa?, Noiz aurkitu zuten penizilina?, Non jaio zen Newton?...) egin diezazkioke sistemari, euskaraz. Era berean, sistemak euskaraz ematen ditu erantzunak. Galderei erantzuteaz gain, hitz bakar edo anitzeko kontsulta bat egiten bazaio, gai da kontsulta horri dagozkion dokumentuak bilatzeko.

Hitz bakar edo anitzeko kontsultak ere euskaraz egiten zaizkio (ozono-geruza, esnea edateko gaitasuna eboluzioan, energia-iturri berriztagarrien alde onak eta txarrak...), baina kontsulta horiekin zerikusia duten gaztelaniazko eta ingelesezko dokumentuak ere bilatzen ditu, euskarazkoez gain. Gaztelaniazkoak automatikoki itzultzen ditu euskarara sistemak, eta ingelesezkoak jatorrizko hizkuntzan ematen ditu oraingoz, baina laster horiek ere itzuliko ditu euskarara.

Zeregin hori betetzeko, Interneteko zientzia eta teknologiako hainbat gunetan egiten du bilaketa. Gainera, nahi izanez gero, testu horiek irakurri egiten ditu sistemak, hiru hizkuntza horietako edozeinetan. Horrez gainera, testuen izenburuan klik eginez gero, haien jatorrizko web gunera sar daiteke erabiltzailea, eta automatikoki itzulitakora ere bai, hala nahi badu. Hori guztia lortzeko, jakina, beharrezkoa da teknologia bat baino gehiago uztartzea.

Hamaika teknologia

Aita eta ama bat baino gehiago ditu AnHitz-ek. Izan ere, hainbat enpresak elkarlanean egin duten proiektu baten alaba da. Itxura VICOMTech-IK4 ikerketa-zentroak eman dio, avatarrak edo pertsonaia birtualak sortzeko duen teknologiaz baliatuta. Kasu honetan, emakumezko-itxurako pertsonaia birtual bat garatu du. Aipatzekoa da hiru dimentsiokoa dela, eta emozioak adieraz ditzakeela. Pertsona errealaren antza izateak komunikazioa errazten du.

(Argazkia: -)

EHUko Aholab taldeak eta Robotiker-Tecnalia ikerketa-zentroak, berriz, ahotsaren ezagutzan eta sintesian trebatu dute. Horri esker, AnHitz gai da euskalkiak eta hitzak ahoskatzeko hainbat aldaera ezagutzeko, berak euskara batuan hitz egiten badu ere. Galderei erantzuteko sistema eta Interneteko dokumentuak euskarara modu automatikoan itzultzeko gaitasuna EHUko IXA taldeari zor dizkio. Azkenik, dokumentu eleaniztunak bilatzeko abilezia Elhuyar Fundazioaren I+G taldeak egindako lanaren ondorio da.

Proiektu zabal honetan, erakunde horiek zazpi baliabide, hamahiru tresna eta zazpi aplikazio garatu edo hobetu dituzte euskararen alorrean. Eusko Jaurlaritzaren ETORTEK ikerketa-programaren diru-laguntza jaso du.

Gainera, proiektu honetan, lehenengo aldiz, euskararen alorrean dauden hainbat erreminta aplikazio bakarrean bildu dituzte. Hain zuzen, teknologia hauek uztartu dituzte: Question Answering (galderak erantzutea), Cross Lingual Information Retrieval (informazio-bilaketa eleaniztuna), Machine Translation (itzulpen automatikoa), Speech Synthesis (ahotsaren sintesia), Automatic speech Recognition (ahotsaren ezagutza) eta Visual Interface (ikus-interfazeak). Teknologia horien guztien integrazioaren ahalmena ikusteko, demo bat garatu dute; AnHitz, hain zuzen ere.

"AnHitz proiektuan erabilitako hizkuntza-teknologia ahalik eta gehienak elkarlanean aritzeko aukera emango digun sistema batean oinarrituta dago demoa" dio Igor Leturia Elhuyar Fundazioko I+G taldeko kideak eta demoaren arduradunak. Demo horren bidez, erabiltzaileak eta makinak elkarrizketa bat izan dezakete.

Zientziaren, Teknologiaren eta Berrikuntzaren Asteko Donostiako eta Bilboko zientzia-karpetan AnHitz gertutik ezagutzeko aukera izan zuten herritarrek. Haur, gazte nahiz helduek egindako makina bat galdera eta kontsulta jaso zituen AnHitzek. "Harrera oso ona izan du, eta zenbaitetan jendearengan, haurrengan batez ere, harridura ere sortu duela esan liteke" gehitu du Leturiak. "Oro har, helduek kontu handiz eta hitzak neurtuta egiten zizkioten galderak AnHitzi, horren guztiaren atzean egon litekeen teknologia guztiaz jabetuta, nolabait esateko; haurrek, berriz, beren ezjakintasunean, naturaltasun osoz egiten zizkioten galderak, galdera-mota guztiak" gehitu du.

Zientziaren, Teknologiaren eta Berrikuntzaren Astean, Anhitz ezagutzeko aukera izan zuten Donostiako eta Bilboko zientzia-karpetan izan ziren bisitariek.
L. Cancio

Nolanahi ere, AnHitz prototipo bat da. "Oraingoz, zientzia- eta teknologia-gaietan baino ez da aditua, eta ez die galdera-mota guztiei erantzuten: nork, nor, noiz edo non galdetzaileekin egindako galderei erantzuten die ondoen" azpimarratu du Leturiak. "Hala ere, zalantzarik gabe, hainbat bide berri irekitzen dizkigu honek. Izan ere, litekeena da etorkizunean beste zenbait ezagutza-eremutan ere, turismo-bulegoetan esaterako, aplikatu ahal izatea, bilaketak beste ezagutza-base batzuetan eginez, noski. Halaber, AnHitz-en atzean dagoen teknologia guztia hobetzen jarraituko dugu, eta pertsonen eta gailuen arteko komunikazioa errazten jarraituko dugu" dio Leturiak.

Hain zuzen ere, horixe da AnHitz proiektuaren helburua: pertsonak eta gailuak elkarrekintzan aritzeko behar diren euskarazko hizkuntza-teknologiak ikertzea eta garatzea, eta ezagutzak modu naturalean, intuitiboan eta atseginean kudeatzea. Komunikazio-maila ona eta atsegina lortzeko, hizkuntzaren erabilera komunikazioaren alor guztietan sartu behar da: ahotsean, testuan eta baita multimedia-materialetan ere. AnHitz pertsonaia birtuala horren erakusgarri txiki bat besterik ez da.

Pertsonak eta gailuak elkarrekin hizketan
Pertsonen eta gailuen arteko elkarrizketa posible izateko, batetik, erabiltzaileak hitzez dioena entzun eta deskodifikatzeko (ulertzeko) gai izan behar du gailuak. Bestetik, emititu nahi den informazioa birkodifikatu (esaldiak sortu) eta erabiltzaileari helarazteko (hitzen bidez esateko) gai ere izan behar du.
Hori guztia hitzen bidez egiten denez, hizkuntzek berebiziko garrantzia hartzen dute. Izan ere, erabiltzaileak erabiltzen duen hizkuntza ulertu behar du gailuak, eta horrez gain, bueltatu beharreko informazioa ere hizkuntza batean edo bestean eman behar dio erabiltzaileari gailuak. Horregatik, pertsonen eta gailuen arteko komunikazioan hizkuntzarekin lotuta sor daitezkeen arazoak konpondu ahal izateko, hizkuntza-teknologiak hartzen dituzte oinarri adituek.
Halaber, informazioaren gizartearen garai honetan, inoiz baino testu, informazio eta jakintza gehiago dago guztion eskura, eta informazio hori guztia egoki tratatzeko tresnak ezinbestekoak dira. Tresna horietan ere beharrezkoak dira hizkuntza-teknologiak.
Gaur egun, hizkuntza-teknologien inguruan dauden aplikazioak bost taldetan sailka daitezke:
· Testuak editatu eta ulertzeko laguntza.
(Argazkia: A. Galarraga)
· Testu-kantitate handia erabiltzen den eta kudeatzen duten aplikazioak.
· Itzulpen automatikoa
· Erabiltzaile-gailu interfazeak.
· Hizketaren tratamendua.
Hizkuntza-teknologietan, aurrerapenak beharrezkoak dira erabiltzaileak gailuekin naturaltasun osoz komunikatu ahal izateko. Ikertzaile ugarik dihardute lan horretan, eta testuinguru horretan jaio zen AnHitz proiektua.
Kortabitarte Egiguren, Irati
3
249
2009
1
032
Teknologia
Artikulua
29
Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila