Neste artigo imos dar a coñecer un traballo entre Intelixencia Artificial, Lingüística Computacional e Psicolingüística. O traballo enmárcase en dous proxectos de investigación financiados polo Vicerreitorado de Investigación da UPV/EHU nos anos 1994 e 1995. Os proxectos levaron a cabo grazas á colaboración entre o grupo IXA que traballa no departamento de Linguaxes e Sistemas Informáticos da UPV/EHU e o euskaltegi ILAZKI. O título dos proxectos é o seguinte: Sistema Intelixente de Investigación do Proceso de Aprendizaxe da Segunda Lingua.
O obxectivo a longo prazo destes proxectos era crear un sistema intelixente de análise do proceso de aprendizaxe da lingua. O sistema serviría paira analizar a representación da intermodalidad do alumno (competencia gramatical) e o seu proceso de recollida.
Na actualidade, tras cinco anos dos proxectos mencionados, deseñamos unha contorna paira investigar o proceso de aprendizaxe da segunda lingua (H2). Consta de tres sistemas diferentes:
Aínda que o obxectivo a longo prazo era ambicioso, nos dous proxectos mencionados definíronse obxectivos a curto prazo que nos levarían a iso. A continuación explícase brevemente o que fixemos naqueles proxectos concretos.
O obxectivo foi analizar algunhas das estruturas lingüísticas da intermodalidad de alumnos dos niveis 9-10, 10-11 e EGA do euskaltegi ILAZKI. Paira iso, ao longo do curso seleccionáronse 15 alumnos diferentes cun mínimo seguimento no euskaltegi. Despois, eliximos algunhas estruturas lingüísticas. A continuación traballáronse os diferentes usos destas estruturas nos traballos escritos polos alumnos. E por último, tratáronse as razóns que tiñan os alumnos paira utilizar estas estruturas. Entre os criterios que nos marcamos atópanse as estratexias de aprendizaxe de cada alumno.
A pesar de que este estudo foi realizado de forma manual por dous profesores, tamén contaron cun apoio semiautomático. Eliximos as estruturas lingüísticas en base aos seguintes criterios: primeiro fixemos unha listaxe das estruturas lingüísticas que o profesorado consideraba problemáticas nos tres niveis mencionados –cando dicimos problemáticas, tanto as que son "erros" con respecto a H2, como as pouco asimiladas a esas categorías (por exemplo, e utilizamos a conxunción con demasiada frecuencia, aínda que -aínda que e en lugar das súas-); e logo centrámonos nalgún subconjunto do que actualmente ten a informática.
Xunto a iso, implementamos unha base de datos paira recoller o traballo do profesorado. Ademais, comezamos a organizar un corpus de textos dos alumnos. A través do corpus, analizáronse as estruturas lingüísticas que utilizan os alumnos en cada curso e traballáronse as ferramentas informáticas paira extraer as porcentaxes (automaticamente nuns casos e semi-automaticamente noutros).