En este artículo vamos a dar a conocer un trabajo entre Inteligencia Artificial, Lingüística Computacional y Psicolingüística. El trabajo se enmarca en dos proyectos de investigación financiados por el Vicerrectorado de Investigación de la UPV/EHU en los años 1994 y 1995. Los proyectos se llevaron a cabo gracias a la colaboración entre el grupo IXA que trabaja en el departamento de Lenguajes y Sistemas Informáticos de la UPV/EHU y el euskaltegi ILAZKI. El título de los proyectos es el siguiente: Sistema Inteligente de Investigación del Proceso de Aprendizaje de la Segunda Lengua.
El objetivo a largo plazo de estos proyectos era crear un sistema inteligente de análisis del proceso de aprendizaje de la lengua. El sistema serviría para analizar la representación de la intermodalidad del alumno (competencia gramatical) y su proceso de recogida.
En la actualidad, tras cinco años de los proyectos mencionados, hemos diseñado un entorno para investigar el proceso de aprendizaje de la segunda lengua (H2). Consta de tres sistemas diferentes:
Aunque el objetivo a largo plazo era ambicioso, en los dos proyectos mencionados se definieron objetivos a corto plazo que nos llevarían a ello. A continuación se explica brevemente lo que hicimos en aquellos proyectos concretos.
El objetivo fue analizar algunas de las estructuras lingüísticas de la intermodalidad de alumnos de los niveles 9-10, 10-11 y EGA del euskaltegi ILAZKI. Para ello, a lo largo del curso se seleccionaron 15 alumnos diferentes con un mínimo seguimiento en el euskaltegi. Después, elegimos algunas estructuras lingüísticas. A continuación se trabajaron los diferentes usos de estas estructuras en los trabajos escritos por los alumnos. Y por último, se trataron las razones que tenían los alumnos para utilizar estas estructuras. Entre los criterios que nos marcamos se encuentran las estrategias de aprendizaje de cada alumno.
A pesar de que este estudio fue realizado de forma manual por dos profesores, también contaron con un apoyo semiautomático. Elegimos las estructuras lingüísticas en base a los siguientes criterios: primero hicimos un listado de las estructuras lingüísticas que el profesorado consideraba problemáticas en los tres niveles mencionados –cuando decimos problemáticas, tanto las que son "errores" con respecto a H2, como las poco asimiladas a esas categorías (por ejemplo, y utilizamos la conjunción con demasiada frecuencia, aunque -aunque y en lugar de las suyas-); y luego nos centramos en algún subconjunto de lo que actualmente tiene la informática.
Junto a ello, implementamos una base de datos para recoger el trabajo del profesorado. Además, comenzamos a organizar un corpus de textos de los alumnos. A través del corpus, se analizaron las estructuras lingüísticas que utilizan los alumnos en cada curso y se trabajaron las herramientas informáticas para extraer los porcentajes (automáticamente en unos casos y semi-automáticamente en otros).