ElkarOla: Tecnologies lingüístiques al servei d'un territori intel·ligent, industrial, inclusiu i multilingüe

Leturia Azkarate, Igor

Informatikaria eta ikertzailea

Elhuyar Hizkuntza eta Teknologia

El projecte ElkarOla és el resultat final de 15 anys de col·laboració entre les organitzacions més representatives del País Basc en la recerca i desenvolupament de tecnologies lingüístiques i de la parla. Com a mostra del treball realitzat, s'han treballat tres donem que reflecteixen el que aquestes tecnologies poden fer en tres àmbits estratègics.
elkarola-hizkuntza-teknologiak-lurralde-adimendun-
Demo per a l'àrea de fabricació avançada. Es tracta d'un sistema de teleassistència de realitat augmentada per al seu ús entre un expert i un empleat. Ed. Igor Leturia

ElkarOla és un projecte de recerca estratègica desenvolupat en 2015 i 2016 en l'àmbit de les tecnologies lingüístiques i de la parla. Exemples d'aquestes tecnologies són les eines per a la traducció, la gestió de la informació (cercadors, extracció d'informació, anàlisi de sentiments), els recursos lingüístics (diccionaris, corpus, correctors) i les eines per a la parla (coneixement de la parla, creació de la parla). El projecte ha treballat especialment per al basc, però també per a altres llengües locals i pròximes.

Elhuyar, els grups de recerca de la UPV-EHU Ixa i Aholab, el centre tecnològic Vicomtech-IK4 i la fundació Tecnalia Research & Innovation, en coordinació amb Elhuyar.

Cinc institucions portem 15 anys col·laborant en la recerca i desenvolupament de tecnologies lingüístiques i de parla per al basc. Amb caràcter previ a aquest projecte s'han realitzat altres quatre:Hizking21 (2002-2004), AnHitz (2006-2008), BerbaTek (2009-2011) i Ber2Tek (2012-2014). Mentre que els anteriors estaven orientats a la indústria de les llengües, ElkarOla posa èmfasis en les àrees de RIS3 Euskadi.

L'Estratègia d'Especialització Intel·ligent RIS3 és una estratègia regional impulsada des d'Europa, orientada a la innovació i el desenvolupament. En aquesta estratègia, cada regió, tenint en compte les seves capacitats productives i potencialitats, defineix i concentra recursos i inversions en àrees estratègiques. En el cas de la CAPV, RIS3 Euskadi estableix tres prioritats: fabricació avançada, energia, biociències i salut.

Encara que les tecnologies lingüístiques i de parla no es troben entre aquestes prioritats, són una important línia transversal amb aplicació en totes elles. En aquest sentit, ElkarOla, a més de la recerca bàsica, també s'ha dut a terme la recerca aplicada en les àrees esmentades del RIS3 i, a través de la transferència tecnològica, s'han comercialitzat i socialitzat diverses eines i aplicacions.

Donem per a àrees prioritàries

La demo en biociència i salut és un cercador de termes i relacions sanitàries. Ed. Igor Leturia

Com a resultat final del projecte, hem desenvolupat tres donem que reflecteixen la possible contribució d'aquestes tecnologies i de la col·laboració entre les entitats del consorci en aquestes àrees del RIS3.

La demo per al camp de la fabricació avançada és un sistema de teleassistència de realitat augmentada per al seu ús entre un expert i un operari. Aquesta demo demostra en què poden contribuir les tecnologies lingüístiques i de parla en un entorn industrial sorollós. Si l'operari vol tenir les mans lliures per a treballar, es posarà uns smartglass o tindrà a la seva disposició una tauleta. L'expert l'ajudarà de manera remota a través d'una altra tauleta o ordinador. L'expert rebrà en temps real el que l'empleat indiqui i el que vegi amb la seva tauleta o ulleres. Així, l'expert informarà verbalment el treballador, però atès que el treballador pot trobar-se en un entorn sorollós provocat per les màquines, el sistema transcriu automàticament (mitjançant coneixement de parla) i tradueix (mitjançant traducció automàtica) aquestes instruccions perquè arribi per escrit al treballador. Aquest text serà mostrat a l'empleat en el seu dispositiu, en temps real, sobre el que està veient i guiat pas a pas en la seva tasca. A més, l'aplicació mostrarà al treballador en realitat augmentada les instruccions a distància, mitjançant fletxes i similars.

La demo biociències i salut és un cercador de termes i relacions sanitàries.Aquest primer prototip d'un cercador de relacions entre entitats mèdiques (malalties i medicaments) i les mateixes funciona sobre un corpus d'extractes d'articles científics en castellà sobre temes mèdics. Aquest corpus ha estat etiquetat manualment per a entrenar i avaluar un sistema de detecció automàtica de reaccions adverses a medicaments. Entre les entitats etiquetades es troben, d'una banda, els medicaments genèrics, les marques de medicaments i les substàncies i, per un altre, les malalties i els símptomes. Entre les relacions etiquetades es troben les causes (quina causa produeix la malaltia) i els tractaments (amb quin medicament es tracta o la malaltia). En el cercador es poden realitzar cerques per entitats o relacions i veure gràficament les entitats i relacions detectades en cada document.

Demo d'un agent de diàleg per al servei d'atenció al client. Ed. Igor Leturia

Finalment, per a disposar d'una demo territorial hem desenvolupat un agent de diàleg per al servei d'atenció al client. Els serveis d'atenció al client són un element clau per a oferir un servei de qualitat en alguns sectors, però molts d'aquests serveis compten amb tasques o fases repetitives de baix valor (identificació d'usuari, emplenament de formularis, consultes senzilles…). Les tecnologies dels sistemes de diàleg, juntament amb el processament del llenguatge natural i la intel·ligència artificial, permeten automatitzar aquest tipus de tasques perquè els tècnics puguin utilitzar el temps de forma més eficient. La demo és un sistema de diàleg integrat en una interfície web en el qual s'utilitzen tècniques de processament del llenguatge natural i algorismes estadístics de classificació per a identificar a l'usuari i a quin departament s'ha de transferir l'esdeveniment descrit per l'usuari. Les respostes del sistema es donen tant per text com per síntesi de parla i es poden donar ordres tant escrites com verbals.