Sens dubte, el tema dels últims anys en el món de la ciència és la genètica. L'avanç que ha suposat el descobriment del genoma ha fet extensible la influència de la genètica en tots els àmbits. La recerca que ho demostra és la que tenim entre mans, la informàtica i la genètica.
Pedro Larrañaga i Iñaki Inza, de la Facultat d'Informàtica de Sant Sebastià, ens han donat a conèixer una recerca en bioinformática. Actualment els xips informàtics de gens permeten obtenir el valor numèric de cada gen. Aplicant el xip indicat a un grup de pacients, la base de dades obtinguda es pot veure com un mapa de colors. Així, la intensitat i el color de cadascuna de les posicions d'aquest mapa codifica la informació d'un gen d'un pacient. A través d'aquestes bases de dades i de l'aplicació de tècniques estadístiques, es pretén detectar quins gens poden causar una malaltia concreta.
En contra del que es feia fins ara, tots els gens que es troben en les bases de dades han estat analitzats conjuntament. Fins avui s'estudiaven tots els gens que hi havia en la base de dades, però sense tenir en compte la perspectiva global, és a dir, sense tenir en compte les interaccions entre els gens. Ara, gràcies als avanços de la informàtica, és possible analitzar un nombre de gens íntegrament.
Pedro i Iñaki han treballat amb bases de dades d'entre 2.000 i 7.000 gens d'unes 65 persones. L'estudi de totes les combinacions suposaria un treball enorme, per la qual cosa s'utilitzen mètodes de simplificació, heurística. L'aplicació de l'heurística no és només inevitable, ja que s'ha comprovat que els resultats obtinguts en els últims anys a través de la discriminació de gens són millors. D'aquesta manera, s'ha demostrat que els models de probabilitat de predicció d'una malaltia presenten una taxa d'invenció més elevada. La clau està en el correcte plantejament d'aquests models heurístics, ja que cal preveure quins dels milers de gens han de ser descartats.
El treball realitzat s'ha centrat en tres casos: la separació de dos tipus de leucèmia, la detecció de càncer de còlon o no i la classificació de nou tipus de càncer. Per a analitzar les tres bases de dades s'han utilitzat quatre models heurístics i els resultats obtinguts coincideixen amb els d'altres recerques.
La principal conclusió és que les causes del càncer, la leucèmia i qualsevol malaltia en general són molt escasses: entre 2.000 i 7.000 gens, per exemple. A més, la taxa d'invenció dels models heurístics obtinguts oscil·la entorn del 90%. Aquesta taxa d'invenció està validada, és a dir, l'aplicació d'aquests models heurístics a qualsevol base de dades suposaria aproximadament aquesta taxa d'invenció.
Sempre cal tenir en compte que en les bases de dades encara no està tota la informació, ja que no hi ha valors numèrics de tots els gens ni mostres de tots els pacients. Estem, per tant, davant un mètode informàtic de llarg desenvolupament.