Posez la question !

Lopez-Gazpio, Iñigo

EHUko IXA Taldeko ikertzailea

bota-galdera
Ed. Andrei Kovalev (Follow)/350RF

Vous souvenez-vous des petits quand le professeur termine un sujet "à voir, posez vos questions!" Quand dit-il ? Au même moment commençait le jeu de cachette: l'épaule de l'ancien compagnon, derrière la table, derrière la porte de la classe... tout mouvement d'échappement nous servait pour ne pas rencontrer le regard du professeur. Nous apportons à tous ces timides une bonne nouvelle, car à partir d'aujourd'hui l'ordinateur supportera les baisers pour nous.

Dans les lignes suivantes, nous allons exposer les débuts du système qui, à partir d'un corpus, générera au niveau de la phrase des questions automatiquement et massivement (ces systèmes sont connus comme QG (Question Generator). Pour cela, comme nous le faisons dans la cuisine pour préparer un plat délicieux, dans l'élaboration de questions, il faudra également suivre quelques étapes concrètes. En fait, les étapes à suivre pour créer automatiquement des questions et, par exemple, pour faire une pizza sont très similaires. Le processus que nous allons suivre pour lancer toute cette question se compose de quatre étapes à suivre séquentiellement:

1. Traitement du corpus d'entrée

Première étape, visant à traiter --analyser linguistiquement - le corpus d'entrée. Par conséquent, dans cette section, nous essaierons d'obtenir le maximum d'informations à partir du corpus d'entrée. Bien que cette recherche d'information se répète dans plusieurs domaines du traitement du langage, c'est une tâche fondamentale si nous voulons aller de l'avant avec un bon sens. Pour aborder cette section avec envie, il faudra utiliser différentes ressources linguistiques, comme analyseurs syntaxiques, analyseurs morphologiques, analyseurs sémantiques, létharisateurs, tokenisateurs, etc. Ainsi, nous pourrons identifier des verbes – joués et non joués –, noms, adjectifs, adverbes… dans les phrases originales, en plus des mots et leurs syntagmes nominaux, cas déclinatifs de syntagme nominale, compositions syntagmatiques entre verbes – verbes simples, composés, auxiliaires… --et l'identification des dépendances syntaxiques des mots des phrases.

Même lorsque nous nous consacrons à la cuisine, sans nous en rendre compte, nous faisons une analyse similaire à cette initialisation : nous préparons des informations et des outils. D'abord nous prenons le manuel dont nous avons besoin pour préparer le plat, puis nous lisons les ingrédients dont nous avons besoin, les énumérons et les recherchons, puis nous plaçons les outils dont nous avons besoin sur la table de la cuisine pour faire les étapes de la recette sans entraves.

2. Sélection des résultats des questions

Une fois que nous avons énuméré les plats de la recette - mieux que nous soyons dans notre réfrigérateur que dans le magasin!-, la prochaine étape est d'aller pour eux. Tomate et jambon au réfrigérateur, fromage à la table de la cuisine, eau à la fontaine, farine sur le rayon, sel dans le placard... Cependant, au lieu d'utiliser les tomates du potager de votre grand-père, nous utiliserons la sauce tomate de la veille, qui était très sucrée et qui reste très bien.

Dans cette deuxième étape de la question-créateur que nous développons, comme nous l'avons fait dans la cuisine, l'objectif est d'aller chercher les meilleurs résultats des questions. Dans cette section, vous devez également utiliser les ressources naturelles de traitement de la langue, car nous devons sélectionner les meilleurs parmi les composants que nous avons classés ci-dessus. Cette sélection peut être faite à travers différentes sources d'information, telles que les réseaux sémantiques, les dictionnaires vivants et inanimés, bases de données d'articles, nouvelles, institutions, personnages illustres, etc. Ainsi, parmi tous les mots et syntagmes, nous choisissons ceux qui nous donnent plus d'informations et auront donc plus de chance que les questions que nous allons générer soient intéressantes.

3. Sélection de sondeurs

Il manque peu pour terminer, nous avons commencé à chauffer le four et nous sommes déjà en mesure de sentir le plat que nous préparons. Nous avons les composants au-dessus de la table, les outils dont nous avons besoin. Par conséquent, le moment est venu de se tacher les mains, car nous devons préparer chacun des ingrédients: former la pâte de farine, éplucher et gratter le fromage, enlever les graines à la tomate, enlever celles de la distribution en plastique au jambon...

De même, les travaux à effectuer dans le processus de génération de questions sont similaires. En fait, nous avons analysé le corpus et identifié les résultats des questions, de sorte que pour être en mesure d'aller de l'avant, nous devons tacher les mains, même virtuellement, parce qu'il faut préparer les types de questions que nous allons générer. Le choix du type de question, avec l'interrogatif, est une tâche liée au travail effectué dans les phases précédentes. Ainsi, si nous avons réussi à identifier les dates dans le corpus d'entrée, il serait logique de créer une question de type temporel en utilisant pour cela une question “quand” ou de ce type. Si, au contraire, nous avons réussi à identifier des personnages illustres, il serait logique que nous soyons une question associée à un personnage, auquel cas on utiliserait l’interrogatif « qui ». Nous travaillerons comme expliqué jusqu'à ce que le type de question ait été défini pour tous les candidats identifiés dans la phase précédente.

4ème Construction de questions

Nous avons tout préparé, il ne reste que la droite finale, c'est-à-dire unifier tout le travail accompli, mais nous devons faire attention parce qu'une erreur de dernière minute peut endommager tout le travail accompli. Après avoir passé en revue tous les ingrédients que nous avons préparés, nous avons commencé à travailler: la tomate est étalée sur la pâte à pizza, le fromage et le jambon sont dispersés au-dessus et le plat est mis dans le four. Maintenant, il suffit d'attendre une vingtaine de minutes, pendant ce temps, nous préparons des assiettes, des couverts et des verres jusqu'à ce que l'alarme du four nous avertisse qu'il est temps de retirer la nourriture.

Dans la dernière étape du système de générateur de questions, nous devrons également effectuer des tâches similaires. C'est-à-dire, nous devons saisir la phrase originale et construire la question à partir de quelques modèles et des règles. En outre, il faudra effectuer d'autres adaptations, comme la suppression des connecteurs, l'adéquation des marques de ponctuation, l'adaptation des cas et des marques de verbes, etc., mais non seulement cela, mais on peut aussi faire d'autres choses qui nous arrivent, puisque tout travail qui vise à améliorer les questions sera accueilli, comme la résolution d'anaphores et l'exclusion d'information étrangère aux questions --résumer des phrases, aléa--.

Conclusions

Comme vous l'avez vu, la mise en place d'un système de génération massive de questions nécessite quatre étapes: traiter le corpus d'entrée, sélectionner les résultats des questions, sélectionner les questionnaires et enfin construire les questions. Aussi facile que faire une pizza!

Ed. Créé à partir des images du site http://openclipart.org. Dans le domaine public

Le système question-créatif que nous avons développé - qui est un système très basique de QG- et d'autres systèmes capables de générer automatiquement des exercices sont des ressources étroitement liées au domaine de l'enseignement-apprentissage, car ils réduisent considérablement le temps de préparation du matériel par les enseignants. En général, les systèmes automatiques de création d'exercices sont généralement intégrés dans des plateformes e-learning plus grandes, ce qui permet d'avoir beaucoup d'utilisateurs qui participent et apprennent en échange d'une petite charge de travail.

Pour finir, tous les timides que nous avons mentionnés au début savent déjà que vos embarras peuvent disparaître aussi facilement que faire une pizza (même si vous avez besoin de plus de vingt minutes), alors sortez de vos cachettes et posez vos questions !

Bibliographie Bibliographie

Site officiel de Wikipedia, http://www.wikipedia.org.
Zone de l'application Eihera du groupe IXA http://ixa.si.ehu.es/Ixa/Produkzioak/1273220198
Zone d'application Eulia du groupe IXA http://ixa.si.ehu.es/Ixa/Produkzioak/1274694158
Zone de l'application Ixati du groupe IXA http://ixa.si.ehu.es/Ixa/Produkzioak/1273220525
Aldabe, I.; López de Lacalle, M.; Maritxalar, M.; Martinez, E.; Uria, L.: Source : An Automatic Question Generator Based on Corpora and NLP Techniques. UPV/EHU.
Yao, X.; Bouma, G.; Zhang, Y. Semantics-based Question Generation and Implementation. Johns Hopkins University, University of Groning. Saarland University.
Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila