D'où vient l'instinct grammatical et syntaxique ? De nos parents ou de nos gènes ? De nos parents, bien sûr, disaient les avioristes dans les premières décennies de ce siècle.
Noam Chomsky, linguiste américain, avait cependant des idées différentes et attaqua en 1950 l'aviorisme. Selon lui, toutes les langues, malgré des variations sommaires, ont un ensemble commun de règles grammaticales que les enfants ne peuvent acquérir qu'en écoutant leurs parents. Nous portons dans nos gènes des éléments fondamentaux du langage.
Aujourd'hui, après des décennies, sa théorie est en discussion par l'influence d'une génération de chercheurs. En simulant par ordinateur le traitement de l'information complexe dans le cerveau, ces chercheurs commencent à enquêter sur ce qui est derrière les règles de Chomsky. Et le message qui vient de certains aspects est clair: la théorie de la linguistique moderne peut arriver à décliner.
Pour comprendre le débat, il faut analyser en détail les idées de Chomsky. Ses règles comprennent tous les aspects du langage, de la syntaxe (noms, verbes, etc.). du mode de combinaison à la phonologie (jusqu'au mode de fusion des phonèmes et des sons de la langue).
Pourquoi la théorie de Chomsky a eu tellement reconnaissance ? La raison principale est que cette théorie explique la “production” de la langue; en d'autres termes, la capacité de comprendre et de produire des phrases que nous n'avons jamais complétées avant. Chomsky a insisté sur le fait que la personne qui a acquis un répertoire fini de règles du langage peut comprendre et créer un nombre infini de phrases.
Le défi inverse vient d'une école de pensée dans la neuroscience, le conexionisme. Selon cela, les fonctions mentales, l'apprentissage et la connaissance, par exemple, ont leur racine dans la façon dont les neurones sont interconnectés et communiqués dans le cerveau. Cette école a également déclenché la mentalité de relation entre intelligence et cerveau. Le débat, accompagné de réseaux neuronaux simulés par ordinateur, est arrivé aujourd'hui dans le monde de la linguistique. L'idée principale est que le cerveau traite l'information en utilisant des réseaux neuronaux.
Les cellules nerveuses qui sont «parlées» entre elles fonctionnent en transmettant des impulsions électriques à travers les «câbles» appelés axons. Bien que le cerveau soit divisé en zones, chacune d'elles traite l'information de manière similaire. C'est au moins la théorie. Si l'on considère l'anatomie, il semble que la plupart des réseaux cérébraux sont très compacts. Un neurone reçoit des signaux de centaines de milliers de neurones. Cela peut affecter le niveau de votre activité électrique et, par conséquent, les signaux qui passent à d'autres neurones.
Un des principes de base du conexionisme est que beaucoup des réseaux neuronaux cérébraux, ou la plupart, souffrent de petits changements liés à la formation. Pour la neurophysiologie ces changements se produisent dans les synapses neuronales. L'expérience que nous incorporons en excitant certains sous-ensembles neuronaux plus souvent que d'autres peut renforcer sélectivement certaines synapses, rendant l'apparition de certains modèles d'activité électrique plus probable que d'autres. Ces modèles peuvent être la base de l'apprentissage et de la mémoire.
Les conexionistes travaillent à la création de réseaux neuronaux artificiels et très simplifiés qui fonctionnent de la même manière que le cerveau réel fonctionne. Actuellement, ces réseaux ne sont qu’une petite partie de la «taille» du cerveau réel, et ils sont très simplifiés en comparant les caractéristiques des neurones artificiels avec celles réelles. Cependant, l'étude des réseaux neuronaux artificiels a commencé à suggérer des alternatives pour beaucoup de théories psychologiques.
Comment cette approche peut-elle nous aider à comprendre les processus linguistiques ? Vers 1985, deux psychologues de l'université californienne peuvent répondre à un réseau neuronal formé par Rumelhart et McClelland. Ils ont seulement analysé une petite partie de la langue.
L'explication de Chomsky reconnaît que dans le cas de l'anglais, nous avons un ensemble de règles pour appliquer inconsciemment le présent et créer le passé. En anglais, ils sont formés en ajoutant “-ed” aux verbes réguliers et 180 autres dans les verbes en appliquant les soi-disant “règles d’exception”. Cette division des verbes en réguliers et irréguliers est l'idée principale dans la théorie de Chomsky. Sans tenir compte de ces deux groupes normatifs, il serait impossible aux enfants de créer des temps verbaux du passé. Le réseau de Rumelhart et McClelland est capable de construire des passages de verbes réguliers et irréguliers sans utiliser ces règles et sans avoir à traiter différemment des verbes réguliers et irréguliers.
Il convient de noter la simplicité du réseau: Il consiste à connecter 460 unités d’entrée en parallèle avec 460 unités de sortie. Chacune de ces unités (le neurone du réseau) peut être connectée ou non. Les racines verbales peuvent être programmées en unités input. Ils envoient des signaux aux lecteurs output via des connexions dans lesquelles les formes de passage sont codées. Chaque unité de sortie reçoit des signaux provenant de nombreux inputs, certains d'entre eux activent et inhibent. La combinaison de tous ces inputs « décidera » si un disque output est activé ou non.
Comment un mécanisme de ces caractéristiques peut-il apprendre la grammaire ? Rumelhart et McClelland ont découvert que le filet peut être formé pour compléter les passages du verbe. Cette formation consiste à montrer au réseau les formes présentes et passées d'un certain nombre de verbes. Après avoir présenté un mot, le réseau doit trouver la bonne façon de passer. Le manque de correspondance entre la sortie du réseau et la forme correcte du verbe fournira la base pour la formation du réseau, en apprenant l'algorithme appelé «expansion en arrière de l'erreur».
Cet algorithme a deux niveaux. Tout d'abord, on programme comme exemple un verbe dans les unités input, à partir desquelles des signaux sont envoyés aux unités output. Deuxièmement, on compare le temps verbal du passage fourni par les unités output avec la forme correcte donnée par un «professeur». Les poids entre les connexions changent de façon à ce que la sortie soit plus proche d'être correcte lorsque l'entrée est à nouveau présentée.
McClelland et Rumelhart considèrent que ce processus d'enseignement imite les réactions que reçoivent les enfants en apprenant leur passé.
Le problème avec la théorie de Chomsky est que le réseau n'emploie pas des normes linguistiques. En apprenant les formes verbales, il compare ses connexions selon les corrélations qu'il détecte entre les formes input et output. Par exemple, la corrélation entre les terminaisons `-ow' et `-ew' assure que les lecteurs input avec `-ow' sont en liaison étroite avec les lecteurs output qui représentent `-ew'.
Même s'il n'y a pas de règles et que le traitement des verbes réguliers et irréguliers est le même, après une longue période de temps le réseau peut donner la forme correcte du passé. La menace la plus sérieuse contre Chomsky découle du traitement correct des verbes irréguliers non familiers. Après avoir formé pour “wept” “weep”, “clung” pour “cling”, etc. peut donner.
Un débat intense a eu lieu entre chercheurs comme Steven Pinker et membres de l'Institut technologique du Massachusetts. Pour eux, un système fondé sur des règles est encore nécessaire pour apprendre certaines caractéristiques des formes du passé. Ils ont proposé un modèle d’apprentissage «hybride». Dans ce système, les réseaux neuronaux se limitent à recueillir des informations sur les verbes irréguliers et les verbes réguliers sont traités avec des règles spéciales.
Pinker préfère ce système hybride pour de nombreuses raisons. Premièrement, il dit que le modèle des réseaux neuronaux est inapproprié parce qu'il exclut la signification des verbes. Par exemple, le passage du verbe « lie » dans des expressions comme « dire quelque chose de faux » est « lied », mais prenant « lie » dans le sens « se coucher » est « lay ». Le modèle traiterait les deux formes de même, puisque la phonologie est la même dans les deux cas.
Deuxièmement, Pinker affirme que les gens traitent différemment verbes réguliers et irréguliers comme dans le système hybride. Par exemple, Pinker a découvert que la fréquence à laquelle un verbe apparaît dans le langage affecte le temps nécessaire pour créer la forme du passé, mais seulement si le verbe est irrégulier. Par conséquent, les formes de verbes irréguliers simples comme “go” se produisent beaucoup plus vite que les verbes comme “shrink”, mais il n'y a pas de différences de ce type entre verbes réguliers. Les conexionnistes étudient s'ils trouvent des réseaux neuronaux plus sophistiqués pour voir si les découvertes de Pinker peuvent être imposées sans recourir aux règles linguistiques.
Si on réussissait sur ce chemin, on renforcerait l'approche contraire à la théorie qui défend que nous avons un éventail de normes dans le cerveau. Le débat est la dernière manifestation de l'ancien débat entre les empiriques, l'approche que toute la connaissance a été appris, et les rationalistes, qui disent que nous avons déjà une partie de notre connaissance à la naissance.
La théorie de Chomsky sur la spontanéité de la langue a été assumée par le rationalisme. En définitive, même si l'enfant écoute un nombre limité de phrases, il acquiert la capacité de créer des phrases grammaticalement correctes infinies. Un psychologue dirait qu'il y a pauvreté de stimulation. Les enfants savent, par exemple, que beaucoup de verbes peuvent devenir passifs en anglais. Il semble que, généralisant, l'application de la règle à tous les verbes serait raisonnable. Ceci, naturellement, donnerait des expressions non grammaticales. Mais il n'y a pas de raisons évidentes pour que les enfants n'apprennent pas cette règle générale. Si certaines constructions linguistiques peuvent être généralisées, pourquoi pas toutes ?
La réponse de Chomsky à cette question est que les enfants nouveau-nés ont leurs propres mécanismes qui les conduisent à apprendre la grammaire correctement. Autrement dit, dans l'acquisition du langage, il existe certains composants génétiques. La meilleure façon de le prouver est de trouver des gens avec des altérations linguistiques. C'est pourquoi de nombreux linguistes sont intéressés à analyser les altérations linguistiques d'une famille londonienne (16 sur 30) sur l'héritage. Ils peuvent comprendre le langage et produire des mots sans problèmes, mais ils font des erreurs.
Cette altération linguistique héréditaire suggère qu'elle peut être associée à un gène simple. Les généticiens doivent identifier ce gène, mais la recherche étant en première phase, la plupart des chercheurs craignent de tirer des conclusions.
Parmi les sceptiques se distinguent les disciples de conexionisme. Comme nous l'avons vu précédemment, ce qu'ils défendent est la théorie que les enfants apprennent de la langue pure, et les font inconsciemment en adaptant les connexions des réseaux neuronaux dans leurs cerveaux. Une autre expérience dans ce domaine a été réalisée par un chercheur en langues de l'université californienne, Jeffrey Elman, qui a développé un réseau neuronal différent.
Le réseau construit par Elman peut apprendre une syntaxe simple. Contrairement aux réseaux de Rumelhart et McClelland, celle formée par Elman peut apprendre les relations entre modèles inputs consécutifs. Apprenez la séquence continue de mots (séparée par de brèves interruptions) et composez des phrases grammaticales comme « John feeds dogs ». Lorsque chaque mot est présenté, le réseau tente de savoir quel sera le mot suivant comme output. Vous pouvez “rappeler” les mots qui précèdent la phrase, puisque la représentation interne de ces mots, qui sont des unités qui sont activées dans des modèles spéciaux, sont continuellement remis à la circulation. Réciter les mots “anciens” affecte l’interprétation que fait le réseau de tout mot “nouveau”.
Dans une expérience, le mot suivant que le réseau pouvait inventer était le nom ou le verbe et ensuite choisir une des sélections restreintes qu'il avait à sa disposition. Une fois cela fait, il pouvait changer le poids de ses connexions pour améliorer la connexion possible entre le mot prédit et le mot correct.
Comme la formation avançait, le réseau était de mieux en mieux pour prédire la catégorie du mot suivant, indiquant qu'il avait appris la relation entre des noms singuliers et des verbes singuliers.
Il a également appris des détails grammaticaux. Elman a étudié que les noms et les verbes étaient classés en catégories grammaticales. Il a même classé les verbes en transitifs et intransigeants. Le réseau n'a reçu aucune information directe sur ces catégories. Je déduis par induction en tenant compte des statistiques de l'entrée.
Ce que le réseau d'Elman met en évidence, c'est que la connaissance grammaticale de l'enfant au lieu d'être basée sur des règles, pourrait être basée uniquement sur l'information stylistique sur la relation entre différents types de mots.
D'une part, la discussion entre Chomsky et les adeptes et les utilisateurs de réseaux neuronaux de l'autre est encore en cours. Sans doute, dans la mesure où les réseaux neuronaux construits sont plus proches de la réalité, le débat sera également plus élaboré et précis. Mais déjà le conexionisme pousse certains linguistes à repenser des idées sur l'acquisition de la langue.