En aquest article donarem a conèixer un treball entre Intel·ligència Artificial, Lingüística Computacional i Psicolingüística. El treball s'emmarca en dos projectes de recerca finançats pel Vicerectorat de Recerca de la UPV/EHU en els anys 1994 i 1995. Els projectes es van dur a terme gràcies a la col·laboració entre el grup IXA que treballa en el departament de Llenguatges i Sistemes Informàtics de la UPV/EHU i l'euskaltegi ILAZKI. El títol dels projectes és el següent: Sistema Intel·ligent de Recerca del Procés d'Aprenentatge de la Segona Llengua.
L'objectiu a llarg termini d'aquests projectes era crear un sistema intel·ligent d'anàlisi del procés d'aprenentatge de la llengua. El sistema serviria per a analitzar la representació de la intermodalitat de l'alumne (competència gramatical) i el seu procés de recollida.
En l'actualitat, després de cinc anys dels projectes esmentats, hem dissenyat un entorn per a investigar el procés d'aprenentatge de la segona llengua (H2). Consta de tres sistemes diferents:
Encara que l'objectiu a llarg termini era ambiciós, en els dos projectes esmentats es van definir objectius a curt termini que ens portarien a això. A continuació s'explica breument el que vam fer en aquells projectes concrets.
L'objectiu va ser analitzar algunes de les estructures lingüístiques de la intermodalitat d'alumnes dels nivells 9-10, 10-11 i EGA de l'euskaltegi ILAZKI. Per a això, al llarg del curs es van seleccionar 15 alumnes diferents amb un mínim seguiment en l'euskaltegi. Després, triem algunes estructures lingüístiques. A continuació es van treballar els diferents usos d'aquestes estructures en els treballs escrits pels alumnes. I finalment, es van tractar les raons que tenien els alumnes per a utilitzar aquestes estructures. Entre els criteris que ens marquem es troben les estratègies d'aprenentatge de cada alumne.
A pesar que aquest estudi va ser realitzat de manera manual per dos professors, també van comptar amb un suport semiautomàtic. Triem les estructures lingüístiques sobre la base dels següents criteris: primer vam fer un llistat de les estructures lingüístiques que el professorat considerava problemàtiques en els tres nivells esmentats –quan diem problemàtiques, tant les que són "errors" respecte a H2, com les poc assimilades a aquestes categories (per exemple, i utilitzem la conjunció amb massa freqüència, encara que -encara que i en lloc de les seves-); i després ens centrem en algun subconjunt del que actualment té la informàtica.
Al costat d'això, implementem una base de dades per a recollir el treball del professorat. A més, comencem a organitzar un corpus de textos dels alumnes. A través del corpus, es van analitzar les estructures lingüístiques que utilitzen els alumnes en cada curs i es van treballar les eines informàtiques per a extreure els percentatges (automàticament en uns casos i semi-automàticament en uns altres).