ElkarOla: Tecnologías lingüísticas al servicio de un territorio inteligente, industrial, inclusivo y multilingüe

Leturia Azkarate, Igor

Informatikaria eta ikertzailea

Elhuyar Hizkuntza eta Teknologia

El proyecto ElkarOla es el resultado final de 15 años de colaboración entre las organizaciones más representativas del País Vasco en la investigación y desarrollo de tecnologías lingüísticas y del habla. Como muestra del trabajo realizado, se han trabajado tres demos que reflejan lo que estas tecnologías pueden hacer en tres ámbitos estratégicos.
elkarola-hizkuntza-teknologiak-lurralde-adimendun-
Demo para el área de fabricación avanzada. Se trata de un sistema de teleasistencia de realidad aumentada para su uso entre un experto y un empleado. Ed. Igor Leturia

ElkarOla es un proyecto de investigación estratégica desarrollado en 2015 y 2016 en el ámbito de las tecnologías lingüísticas y del habla. Ejemplos de estas tecnologías son las herramientas para la traducción, la gestión de la información (buscadores, extracción de información, análisis de sentimientos), los recursos lingüísticos (diccionarios, corpus, correctores) y las herramientas para el habla (conocimiento del habla, creación del habla). El proyecto ha trabajado especialmente para el euskera, pero también para otras lenguas locales y cercanas.

Elhuyar, los grupos de investigación de la UPV-EHU Ixa y Aholab, el centro tecnológico Vicomtech-IK4 y la fundación Tecnalia Research & Innovation, en coordinación con Elhuyar.

Cinco instituciones llevamos 15 años colaborando en la investigación y desarrollo de tecnologías lingüísticas y de habla para el euskera. Con carácter previo a este proyecto se han realizado otros cuatro:Hizking21 (2002-2004), AnHitz (2006-2008), BerbaTek (2009-2011) y Ber2Tek (2012-2014). Mientras que los anteriores estaban orientados a la industria de las lenguas, ElkarOla pone énfasis en las áreas de RIS3 Euskadi.

La Estrategia de Especialización Inteligente RIS3 es una estrategia regional impulsada desde Europa, orientada a la innovación y el desarrollo. En esta estrategia, cada región, teniendo en cuenta sus capacidades productivas y potencialidades, define y concentra recursos e inversiones en áreas estratégicas. En el caso de la CAPV, RIS3 Euskadi establece tres prioridades: fabricación avanzada, energía, biociencias y salud.

Aunque las tecnologías lingüísticas y de habla no se encuentran entre estas prioridades, son una importante línea transversal con aplicación en todas ellas. En este sentido, ElkarOla, además de la investigación básica, también se ha llevado a cabo la investigación aplicada en las áreas mencionadas del RIS3 y, a través de la transferencia tecnológica, se han comercializado y socializado diversas herramientas y aplicaciones.

Demos para áreas prioritarias

La demo en biociencia y salud es un buscador de términos y relaciones sanitarias. Ed. Igor Leturia

Como resultado final del proyecto, hemos desarrollado tres demos que reflejan la posible contribución de estas tecnologías y de la colaboración entre las entidades del consorcio en estas áreas del RIS3.

La demo para el campo de la fabricación avanzada es un sistema de teleasistencia de realidad aumentada para su uso entre un experto y un operario. Esta demo demuestra en qué pueden contribuir las tecnologías lingüísticas y de habla en un entorno industrial ruidoso. Si el operario quiere tener las manos libres para trabajar, se pondrá unos smartglass o tendrá a su disposición una tablet. El experto le ayudará de forma remota a través de otra tablet u ordenador. El experto recibirá en tiempo real lo que el empleado indique y lo que vea con su tablet o gafas. Así, el experto informará verbalmente al trabajador, pero dado que el trabajador puede encontrarse en un entorno ruidoso provocado por las máquinas, el sistema transcribe automáticamente (mediante conocimiento de habla) y traduce (mediante traducción automática) estas instrucciones para que llegue por escrito al trabajador. Este texto será mostrado al empleado en su dispositivo, en tiempo real, sobre lo que está viendo y guiado paso a paso en su tarea. Además, la aplicación mostrará al trabajador en realidad aumentada las instrucciones a distancia, mediante flechas y similares.

La demo biociencias y salud es un buscador de términos y relaciones sanitarias.Este primer prototipo de un buscador de relaciones entre entidades médicas (enfermedades y medicamentos) y las mismas funciona sobre un corpus de extractos de artículos científicos en castellano sobre temas médicos. Este corpus ha sido etiquetado manualmente para entrenar y evaluar un sistema de detección automática de reacciones adversas a medicamentos. Entre las entidades etiquetadas se encuentran, por un lado, los medicamentos genéricos, las marcas de medicamentos y las sustancias y, por otro, las enfermedades y los síntomas. Entre las relaciones etiquetadas se encuentran las causas (qué causa produce la enfermedad) y los tratamientos (con qué medicamento se trata o la enfermedad). En el buscador se pueden realizar búsquedas por entidades o relaciones y ver gráficamente las entidades y relaciones detectadas en cada documento.

Demo de un agente de diálogo para el servicio de atención al cliente. Ed. Igor Leturia

Por último, para disponer de una demo territorial hemos desarrollado un agente de diálogo para el servicio de atención al cliente. Los servicios de atención al cliente son un elemento clave para ofrecer un servicio de calidad en algunos sectores, pero muchos de estos servicios cuentan con tareas o fases repetitivas de bajo valor (identificación de usuario, cumplimentación de formularios, consultas sencillas…). Las tecnologías de los sistemas de diálogo, junto con el procesamiento del lenguaje natural y la inteligencia artificial, permiten automatizar este tipo de tareas para que los técnicos puedan utilizar el tiempo de forma más eficiente. La demo es un sistema de diálogo integrado en una interfaz web en el que se utilizan técnicas de procesamiento del lenguaje natural y algoritmos estadísticos de clasificación para identificar al usuario y a qué departamento se debe transferir el evento descrito por el usuario. Las respuestas del sistema se dan tanto por texto como por síntesis de habla y se pueden dar órdenes tanto escritas como verbales.

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila