ElkarOla: Hizkuntza-teknologiak lurralde adimendun, industrial, inklusibo eta eleaniztun baten zerbitzura

Leturia Azkarate, Igor

Informatikaria eta ikertzailea

Elhuyar Hizkuntza eta Teknologia

Euskal Herrian hizkuntza- eta hizketa-teknologien ikerketan eta garapenean dihardugun erakunde esanguratsuenen 15 urteko elkarlanaren azken emaitza da ElkarOla proiektua. Egindako lanaren erakusgarri, hiru demo landu dira, hiru arlo estrategikotan teknologia horiek egin dezaketenaren erakusgarri.
elkarola-hizkuntza-teknologiak-lurralde-adimendun-
Fabrikazio aurreratuaren arlorako egin den demoa. Errealitate areagotuko telelaguntza-sistema bat da, aditu baten eta langile baten artean erabiltzeko. Arg. Igor Leturia

2015ean eta 2016an aurrera eramandako ikerketa estrategikoko proiektu bat da ElkarOla, hizkuntza- eta hizketa-teknologien alorrean. Teknologia horien adibide batzuk dira itzulpengintzarako tresnak, informazioaren kudeaketa (bilatzaileak, informazio-erauzketa, sentimenduen analisia), hizkuntza-baliabideak (hiztegiak, corpusak, zuzentzaileak) eta hizketarako tresnak (hizketaren ezagutza, hizketaren sorkuntza). Proiektuak bereziki euskararako landu ditu teknologiok, baina baita bertako eta inguruetako beste hizkuntza batzuetarako ere. 

ElhuyarrekEHUko Ixa eta Aholab ikerketa-taldeek, Vicomtech-IK4 teknologia-zentroak eta Tecnalia Research & Innovation fundazioak eraman dugu aurrera, Elhuyarren koordinaziopean.

15 urte daramatzagu bost erakundeok elkarlanean euskararentzako hizkuntza- eta hizketa-teknologiak ikertzen eta garatzen. Proiektu honen aurretik, beste lau egin ditugu: Hizking21 (2002-2004), AnHitz (2006-2008), BerbaTek (2009-2011) eta Ber2Tek (2012-2014). Aurreko horiek hizkuntzen industriara bideratuta zeuden, ElkarOlak, ordea, RIS3 Euskadiko arloetan jartzen du enfasia.

RIS3 Espezializazio Adimenduneko Estrategia Europatik bultzatutako eskualde mailako estrategia bat da, berrikuntza eta garapena helburu dituena. Estrategia horretan, eskualde bakoitzak, bere produkzio-ahalmenak eta potentzialtasunak kontuan izanda, arlo estrategiko batzuk definitzen ditu, eta haietan kontzentratzen ditu baliabideak eta inbertsioak. EAEren kasuan, RIS3 Euskadik hiru lehentasun finkatzen ditu: fabrikazio aurreratua, energia, eta biozientziak eta osasuna.

Hizkuntza- eta hizketa-teknologiak lehentasun horien artean ez badaude ere, horietan guztietan aplikazioa duen zehar-lerro garrantzitsu bat dira. Hala, ElkarOlan, oinarrizko ikerketaz gain, aipatutako RIS3ko arloetarako ikerketa aplikatua ere egin da, eta, transferentzia teknologikoaren bitartez, zenbait tresna eta aplikazio merkaturatu eta gizarteratu dira.

Lehentasunezko arloetarako demoak

Biozientzia eta osasunaren arloko demoa osasun-arloko termino eta erlazioen bilatzaile bat da. Arg. Igor Leturia

Proiektuaren azken emaitza gisa, hiru demo garatu ditugu, RIS3ko arlo horietan teknologia hauek eta partzuergoko erakundeen arteko elkarlanak egin dezaketen ekarpenaren erakusgarri.

Fabrikazio aurreratuaren arlorako egindako demoa errealitate areagotuko telelaguntza-sistema bat da, aditu baten eta langile baten artean erabiltzeko. Demo horrek erakusten du zertan lagundu dezaketen hizkuntza- eta hizketa-teknologiek ingurune industrial zaratatsu batean. Langileak smartglass batzuk jantziko ditu eskuak lanerako libre izan nahi baditu, edo tableta bat izango du eskura. Adituak urrunetik lagunduko dio, beste tableta baten edo ordenagailu baten bidez. Adituak denbora errealean jasoko du langileak esaten duena eta bere tableta edo betaurrekoekin ikusten duena. Hala, adituak ahoz emango dizkio argibideak langileari, baina, langilea makinek eragindako ingurune zaratatsuan egon daitekeenez, sistemak automatikoki transkribatu (hizketa-ezagutza bidez) eta itzuliko (itzulpen automatiko bidez) ditu argibideok, idatziz irits dakizkion langileari. Testu hori bere gailuan erakutsiko zaio langileari, denbora errealean, ikusten ari denaren gainean, eta testuak pausoz pauso gidatuko du langilea bere langintzan. Horrez gain, aplikazioak errealitate areagotuan erakutsiko dizkio langileari adituak urrunetik emandako argibideak, gezien eta antzekoen bidez.

Biozientziak eta osasuna arloko demoa osasun-arloko termino eta erlazioen bilatzaile bat da. Medikuntza-entitateen (gaixotasunak eta sendagaiak) eta beren arteko erlazioen bilatzaile baten lehen prototipo honek medikuntza-gaien inguruko gaztelaniazko artikulu zientifikoen laburpenen corpus baten gainean funtzionatzen du. Corpus hori eskuz etiketatu da, sendagaien erreakzio kaltegarrien detekzio automatikoko sistema bat entrenatu eta ebaluatzeko. Etiketatutako entitateen artean daude, batetik, sendagai generikoak, sendagai-markak eta substantziak; bestetik, gaixotasunak eta sintomak. Etiketatutako erlazioen artean, berriz, kausak (zein kausak sortzen duen zein gaixotasun) eta tratamenduak (zein sendagairekin tratatzen den zein gaixotasun) daude. Bilatzailean, entitateen edo erlazioen araberako bilaketak egin daitezke, eta, ondoren, dokumentu bakoitzean detektatutako entitate eta erlazioak grafikoki ikusi.

Bezeroen arreta-zerbitzurako elkarrizketa-agente baten demoa. Arg. Igor Leturia

Azkenik, lurraldearen arloko demo bat izateko, bezeroen arreta-zerbitzurako elkarrizketa-agente bat garatu dugu. Bezeroen arreta-zerbitzuak elementu gakoa dira zenbait sektoretan kalitateko zerbitzua eskaintzeko, baina zerbitzu horietako askok balio gutxiko ataza edo fase errepikakorrak dituzte (erabiltzailea identifikatzea, formularioak betetzea, kontsulta sinpleak...). Elkarrizketa-sistemen teknologiek, lengoaia naturalaren prozesamenduarekin eta adimen artifizialarekin batera, aukera ematen dute halako atazak automatizatzeko, teknikariek denbora modu eraginkorragoan erabil dezaten. Demoa web-interfaze batean integratutako elkarrizketa-sistema bat da, non lengoaia naturalaren prozesamendurako teknikak eta sailkapen-algoritmo estatistikoak erabiltzen baitira erabiltzailea identifikatzeko eta erabiltzaileak deskribatutako gertakaria zein sailetara bideratu behar den asmatzeko. Sistemaren erantzunak testu bidez zein hizketa-sintesi bidez ematen dira, eta aginduak ere idatziz zein ahoz eman dakizkioke.

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila