Informática al servicio de la genética

Andonegi Beristain, Garazi

Elhuyar Zientziaren Komunikazioa

Sin duda, el tema de los últimos años en el mundo de la ciencia es la genética. El avance que ha supuesto el descubrimiento del genoma ha hecho extensible la influencia de la genética en todos los ámbitos. La investigación que lo demuestra es la que tenemos entre manos, la informática y la genética.

Pedro Larrañaga y Iñaki Inza, de la Facultad de Informática de San Sebastián, nos han dado a conocer una investigación en bioinformática. Actualmente los chips informáticos de genes permiten obtener el valor numérico de cada gen. Aplicando el chip indicado a un grupo de pacientes, la base de datos obtenida se puede ver como un mapa de colores. Así, la intensidad y el color de cada una de las posiciones de este mapa codifica la información de un gen de un paciente. A través de estas bases de datos y de la aplicación de técnicas estadísticas, se pretende detectar qué genes pueden causar una enfermedad concreta.

Visión global

Mediante chips génicos se puede obtener el valor numérico de cada gen de un paciente.

En contra de lo que se hacía hasta ahora, todos los genes que se encuentran en las bases de datos han sido analizados conjuntamente. Hasta la fecha se estudiaban todos los genes que había en la base de datos, pero sin tener en cuenta la perspectiva global, es decir, sin tener en cuenta las interacciones entre los genes. Ahora, gracias a los avances de la informática, es posible analizar un número de genes en su totalidad.

Pedro e Iñaki han trabajado con bases de datos de entre 2.000 y 7.000 genes de unas 65 personas. El estudio de todas las combinaciones supondría un trabajo enorme, por lo que se utilizan métodos de simplificación, heurística. La aplicación de la heurística no es sólo inevitable, ya que se ha comprobado que los resultados obtenidos en los últimos años a través de la discriminación de genes son mejores. De este modo, se ha demostrado que los modelos de probabilidad de predicción de una enfermedad presentan una tasa de invención más elevada. La clave está en el correcto planteamiento de estos modelos heurísticos, ya que hay que prever cuáles de los miles de genes deben ser descartados.

Casos prácticos

El trabajo realizado se ha centrado en tres casos: la separación de dos tipos de leucemia, la detección de cáncer de colon o no y la clasificación de nueve tipos de cáncer. Para analizar las tres bases de datos se han utilizado cuatro modelos heurísticos y los resultados obtenidos coinciden con los de otras investigaciones.

La principal conclusión es que las causas del cáncer, la leucemia y cualquier enfermedad en general son muy escasas: entre 2.000 y 7.000 genes, por ejemplo. Además, la tasa de invención de los modelos heurísticos obtenidos oscila en torno al 90%. Esta tasa de invención está validada, es decir, la aplicación de estos modelos heurísticos a cualquier base de datos supondría aproximadamente dicha tasa de invención.

Siempre hay que tener en cuenta que en las bases de datos todavía no está toda la información, ya que no hay valores numéricos de todos los genes ni muestras de todos los pacientes. Estamos, por tanto, ante un método informático de largo desarrollo.

  • Título del proyecto: Aplicación de los
    procedimientos de clasificación en la declaración genética.
  • Objetivo:Aplicación de
    métodos computacionales en biología molecular.
  • Director: Pedro
    Larrañaga.
  • Grupo de
    trabajo: Iñaki Inza, Basilio Sierra, Rosa Blanco.
  • Departamento: Ciencias
    de la Computación e Inteligencia Artificial.
  • Facultad: Informática.
  • Financiación
    Ministerio de Ciencia y Tecnología, Gobierno Vasco y UPV.
Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila