Tecnologies de parla d'Elhuyar al servei de la inclusió

Leturia Azkarate, Igor

Informatikaria eta ikertzailea

Elhuyar Hizkuntza eta Teknologia

La tecnologia en general, i més concretament les Tics, poden contribuir de manera important a la inclusió de persones amb diversitat funcional, com la combinació de la web i les línies Braille ha posat a la disposició dels cecs una ingent quantitat de lectura i coneixement, molt més abundant (a causa del cost d'impressió) del que es pot posar a través dels llibres Braille. I es pot dir que les tecnologies de la parla poden ser especialment útils per a fer accessibles moltes coses a totes les persones. En els últims anys, en Elhuyar treballem amb les tecnologies de la parla, desenvolupant serveis i productes basats en la síntesi i el coneixement de la parla, molts d'ells orientats a la inclusió i a l'accés universal.
elhuyarren-hizketa-teknologiak-inklusioaren-zerbit
El recorregut Harria Hitz d'Usurbil és inclusiu gràcies al projecte Bidaia. ED. : NOAU!.

Les tecnologies de la parla són aquelles que són desenvolupades i utilitzades per màquines i ordinadors per a crear i comprendre la parla humana. Es divideixen en dues tecnologies principals: la creació o síntesi de la parla (que les màquines siguin capaces de parlar), anomenada TTS o Text-To-Speech; i el coneixement de la parla (que les màquines siguin capaces d'entendre el que se'ls diu), també expressat mitjançant les sigles ASR o Automatic Speech Recognition. En la Fundació Elhuyar portem un temps treballant amb ells, especialment per al basc, i hem desenvolupat diverses eines per a ajudar al fet que totes les persones tinguin una plena inclusió en molts àmbits.

Quant a la síntesi de la parla en basca, el grup de recerca de la Universitat del País Basc/Euskal Herriko Unibertsitatea Aholkularitza és el referent principal. Porten anys treballant en la creació lingüística del basc, i el seu sistema CanalTTS és el que obté el millor resultat en basc. En Elhuyar hem desenvolupat diverses solucions i eines per a l'accessibilitat, basades en el sistema | TTS.

Eines d'escolta en lloc de llegir webs i documents

Una d'elles permet escoltar les pàgines web en lloc de llegir-les. Fa cinc anys us informem d'aquest producte en aquesta mateixa secció. En aquella època us contem que la revista Elhuyar estava instal·lada en les pàgines web i Zientzia.eus, però des de llavors l'hem posat en altres llocs: en eitb.eus, en diversos apartats de la web de la UPV/EHU, en la web Sara.com... Aquesta eina ens permet llegir el contingut d'aquestes webs, convertint el text de les mateixes en una parla, per la qual cosa és molt interessant per a cecs o discapacitats visuals, així com per a qualsevol persona, per a fer més accessible el contingut de les pantalles petites dels mòbils. No obstant això, té altres usos que van més enllà de l'accessibilitat: caminant pel carrer o conduint amb cotxe, per a escoltar el contingut amb els auriculars sense haver de fixar-se en la pantalla, anar amb tren o autobús, apropiar-se dels continguts, sense molèsties de la triki-traqua, etc. Aquesta eina, que apareix com a reproductor de barres, permet seleccionar entre dues veus (home o dona) i ajustar la velocitat de lectura.

La Fundació Wikimedia vol fer el mateix en un dels seus projectes més coneguts, Wikipedia: implantar la tecnologia perquè totes les persones puguin accedir al seu contingut sense obstacles. Per a això, va posar en marxa fa un parell d'anys el projecte Wikispeech, que té com a objectiu crear un reproductor de barres per a llegir articles de Wikipedia a través de TTS. Aquest projecte està bastant avançat i s'espera la seva posada en marxa en breu. Al principi es va desenvolupar en unes poques llengües (anglès, àrab, suec i noruec), però en Elhuyar, per encàrrec d'EWKE, l'Associació Cultural Basca de Wikispeech, hem realitzat ja la síntesi en basca (ja esmentada 2015-TTS) per a la seva integració en Wikispeech. Per tant, quan Wikipedia implanta i presenta Wikispeech, el basc estarà entre les poques llengües inicials.

El Lector Digital és un altre dels instruments que hem treballat per a la inclusió a través de la síntesi de parla, per al Berritzegune Nagusia del Departament d'Educació del Govern Basc. L'Escola Inclusiva Local o PCPI necessitava una solució per a ajudar als nens amb dislèxia en el seu procés d'aprenentatge i educació. La dislèxia, d'origen neurològic, és una alteració que afecta les competències lingüístiques relacionades amb la lectura i l'escriptura. Les eines basades en la TTS són molt útils per a ajudar a les persones que tenen aquest problema, i moltes d'elles existien, però no existien en basc. Així, els nens que utilitzaven aquestes eines havien d'escoltar textos en basc amb la TTS en castellà, la qual cosa els causava problemes: accents i entonacions errònies, pronunciacions inapropiades de les consonants g, z, x, tz, ts i tx...

L'eina desenvolupada és un additiu que funciona en els navegadors web Lector Digital , Firefox i Chrome, que ens llegeix les pàgines web que obrim en el navegador, els documents PDF o els documents de text (incloent els documents de Google Docs, tan utilitzats en el món educatiu). També es pot triar una de les dues veus i ajustar la velocitat, però també marca la paraula que està llegint i la llegeix literalment, que també ajuda en els casos més aguts de dislèxia.

Viatges: museus, edificis públics i itineraris turístics i culturals a l'abast de tots

Recentment hem dissenyat i posat en marxa el producte Bidaia. Amb Bidaide, qualsevol persona pot utilitzar i gaudir lliurement dels recursos turístics i culturals (museus, rutes turístiques i culturals...), així com dels edificis públics. Té tres components principals: tecnologies lingüístiques i de parla per a la creació i gestió de continguts, assessorament en accessibilitat i una aplicació per a telèfons mòbils.

L'eina Lector Digital llegeix pàgines web, documents PDF o documents de text. Molt útil per a nens amb dislèxia.

Quant a la gestió de continguts, com ja s'ha indicat, s'utilitzen tecnologies lingüístiques i de parla per a afavorir l'accessibilitat. L'accessibilitat té a veure, entre altres coses, amb les opcions lingüístiques, ja que si hi ha un recorregut, una web o qualsevol altra cosa en una o poques llengües, no és accessible per als quals no saben aquestes llengües. Per això, per a poder realitzar un recorregut o un edifici el més accessible possible, les explicacions o orientacions i orientacions dels centres d'interès dels mateixos han d'estar en el major nombre possible de llengües.

Bidaide posa a la disposició del gestor una plataforma web per a la gestió dels textos de les explicacions i permet tenir contingut en diversos idiomes i utilitzar la traducció automàtica. No obstant això, si els continguts i explicacions estan en format text, no són accessibles per a persones cegues o amb deficiència visual. Per això, la plataforma web de gestió de continguts gestiona àudios en diferents idiomes i, si ho desitja, poden crear-se de manera automàtica, utilitzant la síntesi de la parla d'Elhuyar.

En l'àmbit de la consultoria d'accessibilitat es requereix la col·laboració d'una empresa especialitzada en aquesta. D'una banda, proposen o realitzen les adaptacions necessàries perquè el recorregut o edifici sigui accessible. D'altra banda, afegeix informació addicional opcional d'accessibilitat a les explicacions dels punts crítics dels punts d'interès i del recorregut, com a barreres arquitectòniques, fortes pendents, descripcions de mostres, notes per al contacte amb les escultures, etc. A més, si ho desitgen, escriuen textos expositius seguint les directrius de la lectura fàcil per a persones amb discapacitats cognitives o dificultats de comprensió del llenguatge. Finalment, quan tot està llest, realitzen proves d'accessibilitat amb usuaris amb diferents característiques i diversitat funcional.

Quant a l'aplicació de telèfon mòbil, una vegada instal·lada en el telèfon, és la pròpia aplicació la que s'encarrega d'informar cada tipus d'usuari en funció de les seves característiques: exposició de textos explicatius o reproducció d'àudios, informació addicional d'accessibilitat, etc. La pròpia aplicació és accessible, conjugada amb les implantacions d'accessibilitat de l'usuari, amb contrastos de colors i pictogrames… I, finalment, guia a les persones amb deficiència visual o ceguesa al llarg del recorregut, explicant-les en els llocs més importants: girar a l'esquerra, seguir altres 30 metres cap endavant... Per a això s'utilitza la tecnologia GPS en les rutes exteriors i en les rutes interiors es col·loquen unes balises en els punts clau que emeten el senyal Bluetooth i que poden detectar quan els mòbils estan a prop.

El projecte Bidaia, per tant, és totalment pioner, ja que pretén garantir l'accés a totes les persones a la cultura, al turisme i als serveis públics, respectant i reconeixent la diversitat humana. La nostra intenció és obrir-la al màxim perquè es converteixi en el major nombre possible d'espais accessibles i inclusius. Recentment hem implantat la ruta Harria Hitz d'Usurbil. El recorregut Harria Hitz té com a objectiu donar a conèixer el paper d'Usurbil en la recuperació de la cultura basca contemporània a través d'una sèrie d'elements que es poden veure en el nucli urbà. En aquest cas, els set punts del recorregut s'han exposat en sis idiomes; els de català i gallec han estat creats directament per traducció automàtica; tots els àudios han estat creats per TTS i les explicacions estan escrites seguint les directrius d'una lectura senzilla.

El coneixement de la parla com a via d'accessibilitat

Més enllà de la creació de la parla, és clar que el coneixement de la parla o l'ASR pot aportar molt a la inclusió de totes les persones. Per exemple, pot ajudar persones amb discapacitat física o motora a treballar amb ordinadors, comprenent i executant ordres de parla: “obre el navegador”, “guarda l'arxiu”... Cal no oblidar que quan cal escriure textos llargs, el coneixement de la parla permet no utilitzar el teclat sinó un sistema de dictat. D'altra banda, en l'actualitat, a través dels telèfons mòbils i els altaveus intel·ligents s'aconsegueix la interacció mitjançant la parla, que cada vegada són més els que utilitzen per comoditat, però per a molta gent amb diversitat funcional és l'única manera d'utilitzar aquests dispositius, que és imprescindible. També pot ser de gran utilitat perquè persones sordes o amb deficiència auditiva tinguin accés al contingut audiovisual, ja que els subtítols poden crear-se automàticament a través de l'ASR. D'aquesta manera, pot facilitar el procés de creació de subtítols als creadors de continguts i, en els casos en els quals el creador no els ofereixi, crear automàticament l'usuari directament, que, sense ser perfectes, pot ser suficient (i millor que res) per a entendre el contingut.

Ja existeixen eines i serveis d'aquest tipus que tots coneixem: El sistema operatiu Windows es pot controlar des de fa temps mitjançant la parla; en Youtube també es poden activar subtítols automàtics si no s'entén l'idioma del vídeo... Però desgraciadament no funcionen en basc. En Elhuyar treballem també en el coneixement del basc, amb la finalitat d'oferir les eines esmentades en basca com més aviat millor. Esperem que en un article posterior puguem esperar una mica aviat i us informarem d'aquesta mena de solucions.

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila