Les technologies de la parole sont celles qui sont développées et utilisées par des machines et des ordinateurs pour créer et comprendre la parole humaine. Elles se divisent en deux technologies principales : la création ou synthèse de la parole (que les machines soient capables de parler), appelée TTS ou Text-To-Speech ; et la connaissance de la parole (que les machines soient capables de comprendre ce qui leur est dit), également exprimée par l'acronyme ASR ou Automatic Speech Recognition. À la Fondation Elhuyar, nous travaillons avec eux depuis longtemps, en particulier pour le basque, et nous avons développé différents outils pour aider tous les gens à avoir une pleine inclusion dans de nombreux domaines.
Quant à la synthèse de la parole en basque, le groupe de recherche de l'Université du Pays Basque/Euskal Herriko Unibertsitatea Aholkularitza est la référence principale. Ils travaillent depuis des années dans la création linguistique de l'euskera, et leur système Canal TTS est celui qui obtient le meilleur résultat en euskera. Chez Elhuyar, nous avons développé diverses solutions et outils d'accessibilité, basés sur le système TTS.
L'une d'elles permet d'écouter les pages web au lieu de les lire. Il y a cinq ans, nous vous informons de ce produit dans cette même section. A cette époque, nous vous racontons que le magazine Elhuyar était installé sur les pages web et Zientzia.eus, mais depuis lors nous l'avons mis sur d'autres sites: en eitb.eus, dans plusieurs sections du web de l'UPV/EHU, sur le web Sara.com... Cet outil nous permet de lire le contenu de ces sites, en convertissant le texte de ceux-ci en une parole, il est donc très intéressant pour aveugles ou malvoyants, ainsi que pour n'importe qui, pour rendre plus accessible le contenu des petits écrans mobiles. Cependant, il a d'autres utilisations qui vont au-delà de l'accessibilité: marcher dans la rue ou conduire en voiture, pour écouter le contenu avec les écouteurs sans avoir à se fixer sur l'écran, aller en train ou en bus, s'approprier le contenu, sans tracas de la triki-traqua, etc. Cet outil, qui apparaît comme un lecteur à barres, permet de sélectionner entre deux voix (homme ou femme) et d'ajuster la vitesse de lecture.
La Fondation Wikimedia veut faire de même dans l'un de ses projets les plus connus, Wikipedia : mettre en place la technologie pour que tous puissent accéder à son contenu sans entrave. Pour ce faire, il a lancé il ya quelques années le projet Wikispeech, qui vise à créer un lecteur à barres pour lire des articles Wikipedia via TTS. Ce projet est assez avancé et devrait être lancé prochainement. Il a d'abord été développé en quelques langues (anglais, arabe, suédois et norvégien), mais à Elhuyar, à la demande de l'EWKE, l'Association Culturelle Basque de Wikispeech, nous avons déjà réalisé la synthèse en basque (déjà mentionnée 2015-TTS) pour son intégration à Wikispeech. Ainsi, lorsque Wikipedia implante et présente Wikispeech, l'euskera sera parmi les rares langues initiales.
Le Lecteur Numérique est un autre instrument que nous avons travaillé pour l'inclusion à travers la synthèse de la parole, pour le Berritzegune Nagusia du Département d'Education du Gouvernement Basque. L'École Inclusive Locale ou PCPI avait besoin d'une solution pour aider les enfants handicapés dans leur processus d'apprentissage et d'éducation. La dyslexie, d'origine neurologique, est une altération qui affecte les compétences linguistiques liées à la lecture et l'écriture. Les outils basés sur la TTS sont très utiles pour aider les gens qui ont ce problème, et beaucoup d'entre eux existaient, mais ils n'existaient pas en basque. Ainsi, les enfants qui utilisaient ces outils devaient écouter des textes en basque avec la TTS en espagnol, ce qui leur causait des problèmes : accents et intonations erronés, prononciations inappropriées des consonnes g, z, x, tz, ts et tx...
L'outil développé est un additif qui fonctionne dans les navigateurs Web Digital Reader , Firefox et Chrome, qui nous lit les pages Web que nous ouvrons dans le navigateur, les documents PDF ou les documents texte (y compris les documents Google Docs, si utilisés dans le monde de l'éducation). Vous pouvez également choisir l'une des deux voix et régler la vitesse, mais il marque également le mot que vous lisez et lire littéralement, qui contribue également dans les cas les plus aigus de dyslexie.
Nous avons récemment conçu et lancé le produit Bidaia. Avec Bidaide, n'importe qui peut utiliser et profiter librement des ressources touristiques et culturelles (musées, itinéraires touristiques et culturels...), ainsi que des bâtiments publics. Il a trois composantes principales: technologies linguistiques et parlant pour la création et la gestion de contenu, conseil en accessibilité et une application pour téléphones mobiles.
En ce qui concerne la gestion de contenu, comme déjà indiqué, des technologies linguistiques et parlantes sont utilisées pour favoriser l'accessibilité. L'accessibilité concerne, entre autres, les options linguistiques, car s'il y a un parcours, un site web ou autre chose dans une ou quelques langues, elle n'est pas accessible à ceux qui ne connaissent pas ces langues. C'est pourquoi, pour pouvoir réaliser un parcours ou un bâtiment le plus accessible possible, les explications ou orientations et orientations des centres d'intérêt de ceux-ci doivent être dans le plus grand nombre possible de langues.
Bidaide met à disposition du gérant une plateforme web pour la gestion des textes des explications et permet d'avoir du contenu en plusieurs langues et d'utiliser la traduction automatique. Cependant, si le contenu et les explications sont en format texte, ils ne sont pas accessibles aux aveugles ou malvoyants. C'est pourquoi la plateforme web de gestion de contenu gère des audios dans différentes langues et, si vous le souhaitez, peut être créée automatiquement, en utilisant la synthèse de la parole d'Elhuyar.
Dans le domaine de la consultation d'accessibilité est nécessaire la collaboration d'une entreprise spécialisée dans celui-ci. D'une part, ils proposent ou réalisent les adaptations nécessaires pour rendre le parcours ou le bâtiment accessible. En outre, il ajoute des informations supplémentaires facultatives d'accessibilité aux explications des points critiques des points d'intérêt et du parcours, comme les barrières architecturales, les fortes pentes, les descriptions d'échantillons, les notes de contact avec les sculptures, etc. De plus, s'ils le souhaitent, ils écrivent des textes d'exposition suivant les directives de lecture facile pour les personnes handicapées cognitives ou les difficultés de compréhension du langage. Enfin, quand tout est prêt, ils effectuent des tests d'accessibilité avec des utilisateurs avec différentes caractéristiques et diversité fonctionnelle.
En ce qui concerne l'application de téléphone mobile, une fois installée sur le téléphone, c'est l'application elle-même qui est chargée d'informer chaque type d'utilisateur en fonction de ses caractéristiques : exposition de textes explicatifs ou lecture d'audios, informations supplémentaires d'accessibilité, etc. L'application elle-même est accessible, conjuguée avec les implantations d'accessibilité de l'utilisateur, avec des contrastes de couleurs et pictogrammes… Et, enfin, guide les personnes avec déficience visuelle ou cécité le long du parcours, en les expliquant dans les lieux les plus importants : tourner à gauche, suivre encore 30 mètres en avant... Pour cela, la technologie GPS est utilisée sur les routes extérieures et sur les routes intérieures, des balises sont placées aux points clés qui émettent le signal Bluetooth et qui peuvent détecter lorsque les téléphones mobiles sont proches.
Le projet Bidaia est donc totalement pionnier, puisqu'il vise à garantir l'accès à toutes les personnes à la culture, au tourisme et aux services publics, en respectant et en reconnaissant la diversité humaine. Notre intention est de l'ouvrir au maximum pour devenir le plus grand nombre possible d'espaces accessibles et inclusifs. Nous avons récemment implanté la route Harria Hitz d'Usurbil. Le parcours Harria Hitz a pour objectif de faire connaître le rôle d'Usurbil dans la récupération de la culture basque contemporaine à travers une série d'éléments qui peuvent être vus dans le noyau urbain. Dans ce cas, les sept points du parcours ont été exposés en six langues ; ceux du catalan et du galicien ont été créés directement par traduction automatique ; tous les audios ont été créés par TTS et les explications sont écrites suivant les directives d'une lecture simple.
Au-delà de la création de la parole, il est clair que la connaissance de la parole ou l'ASR peut apporter beaucoup à l'inclusion de toutes les personnes. Par exemple, il peut aider les personnes handicapées physiques ou motrices à travailler avec des ordinateurs, comprenant et exécutant des ordres de parole : “ouvre le navigateur”, “sauve le fichier”... Il ne faut pas oublier que quand il faut écrire de longs textes, la connaissance de la parole permet de ne pas utiliser le clavier mais un système de dictée. D'autre part, à l'heure actuelle, à travers les téléphones mobiles et les haut-parleurs intelligents, vous obtenez l'interaction par la parole, qui sont de plus en plus ceux qui utilisent pour le confort, mais pour beaucoup de gens avec la diversité fonctionnelle est la seule façon d'utiliser ces dispositifs, qui est indispensable. Il peut également être très utile pour les personnes sourdes ou malentendantes d'avoir accès au contenu audiovisuel, car les sous-titres peuvent être créés automatiquement via l'ASR. De cette façon, vous pouvez faciliter le processus de création de sous-titres aux créateurs de contenu et, dans les cas où le créateur ne les offre pas, créer automatiquement l'utilisateur directement, qui, sans être parfait, peut être suffisant (et mieux que tout) pour comprendre le contenu.
Il existe déjà des outils et services de ce type que nous connaissons tous: Le système d'exploitation Windows peut être contrôlé depuis longtemps par la parole; Youtube peut également activer des sous-titres automatiques si la langue de la vidéo n'est pas comprise... Mais malheureusement, ils ne fonctionnent pas en basque. Chez Elhuyar nous travaillons aussi à la connaissance de l'euskera, afin d'offrir les outils mentionnés en euskera dans les plus brefs délais. Nous espérons que dans un article ultérieur nous pourrons attendre un peu tôt et vous informer de ce type de solutions.