Sans doute, le sujet de ces dernières années dans le monde de la science est la génétique. L'avancée de la découverte du génome a rendu l'influence de la génétique extensible dans tous les domaines. La recherche qui le démontre est celle que nous avons entre les mains, l'informatique et la génétique.
Pedro Larrañaga et Iñaki Inza, de la Faculté d'Informatique de San Sebastián, nous ont fait connaître une recherche en bioinformatique. Actuellement, les puces informatiques de gènes permettent d'obtenir la valeur numérique de chaque gène. En appliquant la puce indiquée à un groupe de patients, la base de données obtenue peut être considérée comme une carte de couleurs. Ainsi, l'intensité et la couleur de chacune des positions de cette carte codent l'information d'un gène d'un patient. Grâce à ces bases de données et à l'application de techniques statistiques, il est prévu de détecter quels gènes peuvent causer une maladie particulière.
Contrairement à ce qui a été fait jusqu'ici, tous les gènes trouvés dans les bases de données ont été analysés conjointement. À ce jour, tous les gènes étaient étudiés dans la base de données, mais sans tenir compte de la perspective globale, c'est-à-dire sans tenir compte des interactions entre les gènes. Maintenant, grâce aux progrès de l'informatique, il est possible d'analyser un certain nombre de gènes dans leur intégralité.
Pedro et Iñaki ont travaillé avec des bases de données de 2.000 à 7.000 gènes d'environ 65 personnes. L'étude de toutes les combinaisons supposerait un travail énorme, de sorte que les méthodes de simplification, heuristique sont utilisées. L'application de l'heuristique n'est pas seulement inévitable, car il a été prouvé que les résultats obtenus ces dernières années par la discrimination des gènes sont meilleurs. Ainsi, il a été démontré que les modèles de probabilité de prédiction d'une maladie présentent un taux d'invention plus élevé. La clé est dans l'approche correcte de ces modèles heuristiques, car il faut prévoir lesquels des milliers de gènes doivent être écartés.
Le travail a porté sur trois cas: la séparation de deux types de leucémie, la détection de cancer du côlon ou non et la classification de neuf types de cancer. Pour analyser les trois bases de données, quatre modèles heuristiques ont été utilisés et les résultats obtenus correspondent à ceux d'autres recherches.
La principale conclusion est que les causes du cancer, de la leucémie et de toute maladie en général sont très rares: entre 2.000 et 7.000 gènes, par exemple. En outre, le taux d'invention des modèles heuristiques obtenus varie d'environ 90%. Ce taux d'invention est validé, c'est-à-dire que l'application de ces modèles heuristiques à n'importe quelle base de données supposerait approximativement ce taux d'invention.
Notez toujours que les bases de données ne contiennent pas toutes les informations, car il n'y a pas de valeurs numériques de tous les gènes ou échantillons de tous les patients. Nous sommes donc face à une méthode informatique à long développement.