¿Os acordáis de pequeños cuando el profesor termine un tema "a ver, echad vuestras preguntas!" ¿cuando dice? En ese mismo momento comenzaba el juego de escondite: el hombro del anterior compañero, detrás de la mesa, detrás de la puerta de la clase... cualquier movimiento de escape nos servía para no encontrarnos con la mirada del profesor. A todos estos tímidos les traemos una buena noticia, ya que a partir de hoy la computadora soportará los besos por nosotros.
En las siguientes líneas vamos a exponer los inicios del sistema que, partiendo de un corpus, generará a nivel de frase preguntas de forma automática y masiva (estos sistemas se conocen como QG (Question Generator). Para ello, al igual que hacemos en la cocina para preparar un delicioso plato, en la elaboración de preguntas también será necesario seguir unos pasos concretos. De hecho, los pasos a seguir para crear automáticamente preguntas y, por ejemplo, para hacer una pizza son muy similares. El proceso que seguiremos para poner en marcha toda esta cuestión consta de cuatro pasos a seguir de forma secuencial:
Primer paso, orientado a procesar --analizar lingüísticamente - el corpus de entrada. Por tanto, en este apartado trataremos de obtener la máxima información a partir del corpus de entrada. Si bien esta búsqueda de información se repite en varios ámbitos del procesamiento del lenguaje, es una tarea fundamental si queremos seguir adelante con sentido común. Para abordar este apartado con ganas, será necesario utilizar diferentes recursos lingüísticos, como analizadores sintácticos, analizadores morfológicos, analizadores semánticos, lematizadores, tokenizadores, etc. Así, seremos capaces de identificar verbos --jugados y no juegos-, nombres, adjetivos, adverbios... en las frases originales, además de palabras y sus sintagmas nominales, casos declinativos de sintagma nominal, composiciones sintagmáticas entre verbos --verbos simples, compuestos, auxiliares... --y la identificación de las dependencias sintácticas de las palabras de las frases.
Incluso cuando nos dedicamos a la cocina, sin darnos cuenta, hacemos un análisis similar a ese inicialización: preparamos información y herramientas. Primero cogemos el manual que necesitamos para preparar el plato, después leemos los ingredientes que necesitamos, los enumeramos y los buscamos, y luego colocamos los útiles que necesitamos sobre la mesa de la cocina para realizar los pasos de la receta sin trabas.
Una vez que hemos enumerado los platos de la receta -¡mejor que estemos en nuestra nevera que en la tienda!-, el siguiente paso es ir a por ellos. Tomate y jamón en la nevera, queso en la mesa de la cocina, agua en la fuente, harina en la balda, sal en el armario... ; no obstante, en lugar de utilizar los tomates de la huerta de su abuelo, utilizaremos la salsa de tomate del día anterior, que estaba muy dulce y que seguro que se queda muy bien.
En este segundo paso del pregunta-creador que estamos desarrollando, al igual que hemos hecho en la cocina, el objetivo es ir buscando los mejores resultados de las preguntas. En este apartado también es necesario utilizar los recursos de procesamiento natural del lenguaje, ya que debemos seleccionar los mejores de entre los componentes que hemos clasificado anteriormente. Esta selección se puede realizar a través de diferentes fuentes de información, como redes semánticas, diccionarios de vivos e inanimados, bases de datos de artículos, noticias, instituciones, personajes ilustres, etc. Así, entre todas las palabras y sintagmas, elegiremos aquellas que nos den más información y, por tanto, tendrán más posibilidades de que las preguntas que vayamos a generar sean interesantes.
Falta poco para terminar, empezamos a calentar el horno y ya somos capaces de oler el plato que estamos preparando. Tenemos los componentes encima de la mesa, los útiles que necesitamos. Por lo tanto, ha llegado el momento de mancharse las manos, ya que tenemos que preparar cada uno de los ingredientes: formar la masa de harina, pelar y raspar el queso, quitar las semillas al tomate, quitar las de reparto de plástico al jamón...
Asimismo, los trabajos a realizar en el proceso de generación de preguntas son similares. De hecho, hemos analizado el corpus e identificado los resultados de las preguntas, por lo que para poder seguir adelante necesitamos manchar las manos, aunque sea de forma virtual, porque hay que preparar los tipos de preguntas que generaremos. La elección del tipo de pregunta, junto con el interrogativo, es una tarea relacionada con el trabajo realizado en fases anteriores. Así, si hemos conseguido identificar fechas en el corpus de entrada, sería lógico crear una pregunta de tipo temporal utilizando para ello un interrogativo “cuándo” o de este tipo. Si, por el contrario, hemos conseguido identificar a personajes ilustres, sería lógico que constituyéramos una pregunta asociada a un personaje, en cuyo caso se utilizara el interrogativo “quién”. Trabajaremos como se ha explicado hasta que se haya definido el tipo de pregunta para todos los candidatos identificados en la fase anterior.
Tenemos todo preparado, sólo queda la recta final, es decir, unificar todo el trabajo realizado, pero tenemos que tener cuidado porque un error de última hora puede dañar todo el trabajo realizado. Después de repasar todos los ingredientes que hemos preparado, empezamos a trabajar: se extiende el tomate sobre la masa de pizza, se esparce el queso y el jamón por encima y se mete el plato en el horno. Ahora sólo tenemos que esperar unos veinte minutos, mientras tanto, preparamos platos, cubiertos y vasos hasta que la alarma del horno nos advierta que ha llegado la hora de sacar el alimento.
En el último paso del sistema de generador de preguntas también tendremos que realizar tareas similares. Es decir, tenemos que coger la frase original y construir la pregunta a partir de unos patrones y unas reglas. Además, habrá que realizar otras adaptaciones, como la eliminación de conectores, la adecuación de marcas de puntuación, la adaptación de casos y marcas de verbos, etc., pero no sólo eso, sino que también se pueden hacer otras cosas que se nos ocurran, ya que todo trabajo que tenga como objetivo mejorar las preguntas será bienvenido, como la resolución de anáforas y la exclusión de información ajena a las preguntas --resumir frases, alegia--.
Como habéis visto, la puesta en marcha de un sistema de generación masiva de preguntas requiere cuatro pasos: procesar el corpus de entrada, seleccionar los resultados de las preguntas, seleccionar los cuestionarios y finalmente construir las preguntas. ¡Tan fácil como hacer una pizza!
El sistema pregunta-creativo que hemos desarrollado -que es un sistema muy básico de QG- y otros sistemas capaces de generar ejercicios de forma automática son recursos estrechamente relacionados con el ámbito de la enseñanza-aprendizaje, ya que reducen considerablemente el tiempo de preparación del material por parte del profesorado. En general, los sistemas automáticos de creación de ejercicios suelen estar integrados en plataformas de e-learning de mayor tamaño, lo que permite disponer de un montón de usuarios que participan y aprenden a cambio de una pequeña carga de trabajo.
Para terminar, a todos los tímidos que hemos mencionado al principio ya sabéis que vuestras vergüenzas pueden desaparecer tan fácilmente como hacer una pizza (aunque necesitéis algo más de veinte minutos), así que salid de vuestros escondites y echad vuestras preguntas !