El pasado 13 de febrero, las revistas científicas más prestigiosas del mundo, Nature y Science, publicaron un número especial para presentar dos borradores del genoma humano. Se presentaron la organización del Proyecto Internacional de Genoma Humano y la empresa privada Celera Genomics, respectivamente. La víspera se organizaron charlas de presentación en cinco ciudades del mundo para dar a conocer a la prensa la secuenciación.
La trayectoria de este gigantesco trabajo se ha mencionado en numerosas ocasiones. En 1990 se puso en marcha el proyecto público con una estrategia acorde a la tecnología existente. Esperaban que el trabajo terminara en unos quince años. A medida que se desarrollaron las nuevas tecnologías, aumentó la necesidad de recurrir a metodologías más rápidas. Así, el plazo de lectura de la secuencia completa se redujo hasta el año 2003 como máximo.
En 1998, un trabajador del proyecto público, inventando una metodología aún más rápida, creó con el mismo objetivo la empresa privada Celera Genomics. Tras probar el nuevo método con el genoma de otros organismos (tras secuenciar el genoma de la mosca Drosophila melanogaster), comienza la secuenciación del genoma humano. En junio de 2000 ambas entidades anunciaron su colaboración.
Cada entidad ha presentado su borrador. Son, pues, dos bocetos del mismo genoma. Se han publicado dos números para el número de genes anunciados y el tamaño del genoma. Este resultado es el resultado de utilizar dos aproximaciones diferentes. En general, se han obtenido resultados cualitativos similares, pero hay que tener en cuenta que ambas técnicas no son comparables.
La estrategia seleccionada por el proyecto público se basa en un mapa previamente elaborado. Una vez completado el primer mapa, buscar la secuencia. Esta técnica, aunque lenta, ha obtenido buenos resultados. Es una metodología mediante clones.
Muchas copias del genoma se dividen por enzimas de restricción. Estas enzimas cortan el ADN en lugares concretos. Para evitar la formación de fragmentos excesivamente pequeños de genoma se corta la reacción. El resultado de este primer paso es dividir unos 150.000 pares de bases en partes. Estas partes se integran en los cromosomas artificiales de bacterias (Bacterial Artificial Chromosomes, BAC). Así, cuando la bacteria se reproduce, se generan numerosas copias de este fragmento de ADN, los clones.
Estos clones son tratados con endonukleas de restricción para obtener fragmentos pequeños. Aclarando lo repetido en estos fragmentos, se forma el "mapa físico" del genoma inicial. A partir de ahí todos los BAC se fragmentan y cada parte se secuencian. El mapa permite conocer la secuencia del genoma.
La metodología utilizada por Celera Genomics no incluye mapas previos. Desde la molécula inicial de ADN se preparan pequeños clones para iniciar el análisis de la secuencia. Este camino es mucho más rápido, pero cuando la mayor parte del trabajo ya está hecho es mucho más difícil llenar los huecos que faltan, ya que no está asegurado que se han seleccionado todas las partes iniciales para analizar la secuencia.
En los bocetos se ven grandes fragmentos de ADN que no codifican las proteínas. De hecho, el legado genético de los parásitos es enorme. A todos los que no son genes se les ha llamado “ADN basura”, pero hay que reconocer que esas largas cadenas de ADN pueden tener alguna función que no se conoce.
Por otro lado, en la prensa se ha dado mucha importancia a que el número de genes sea inferior al esperado. Según el proyecto público hay unos 31.000 genes y los de Celera unos 39.000. Pero antes de dar por bueno cualquier número hay que fijarse en la forma de contar.
Ambas organizaciones han utilizado programas informáticos que buscan genes. Estos programas han convertido las secuencias de los genes ya identificados en bases. No obstante, cuando ya se ha aplicado esta metodología, se ha detectado un error experimental por lo que al resultado del recuento informático se le ha añadido un factor de corrección. Así, por ejemplo, los proyectos públicos han "detectado" cerca de 24.500 genes y han reconocido que hay otros 6.800 que no se han encontrado. En total serían aproximadamente 31.000 genes. Tras cálculos similares, la empresa Celera Genomics ha publicado cerca de 39.000.
Se constata que estos números no son provisionales. Según los científicos alemanes Peer Bork y Richard Copley, redactados en la revista Nature, estas cifras pueden variar mucho. Además, el número de genes no es la única característica propia de una especie. Los vertebrados no han tenido que desarrollar genes específicos para convertirse en vertebrados. La función de cada gen y las complejidades de réplica también tienen que ver con la capacidad de la naturaleza de generar biodiversidad. El número de genes que codifica el genoma del ratón con el nuestro no tiene por qué ser representativo.
En general, un gen codifica una proteína. Así se ha aprobado hasta la fecha. Pero poco a poco los bioquímicos también están investigando otras alternativas. Y es que los genes humanos no son continuos. En la molécula de ADN se cortan las partes que codificará la proteína y se continúa en otro lugar. Las secuencias entre intervalos se denominan intrones. La función de Introies todavía no la entendemos. Sin embargo, también se transcriben, por lo que el ARN mensajero debe "aguantar" antes de salir al citoplasma.
Cuanto mayor es el número de introyectos que tiene un gen, más posibilidades hay de crear diferentes mensajeros ARN. Poco sabemos de ello, pero se ha demostrado que puede estar relacionada con la complejidad y diversidad de las proteínas. El genoma humano tiene una alta frecuencia de introi, superior a cualquier otro genoma que conocemos. Esto significa que la diversidad de mensajeros ARN también es muy grande.
Probablemente, las introies también intervienen en la regulación y activación de los genes. Esto se confirma mediante el estudio de la interacción entre genes alejados de la cadena de ADN y, por tanto, de la posición y organización tridimensional de los ácidos nucleicos dentro del núcleo. Recientemente se ha publicado una curiosa investigación relacionada con la estructura del motor molecular que los virus utilizan para introducir el ADN dentro del almacenamiento proteico. El estudio del funcionamiento de esta molécula podría clarificar la topología de acumulación de ADN. Muchas de las líneas de investigación relacionadas con el genoma quedan abiertas.
Está claro que para el futuro primero habrá que definir la secuencia. Los asistentes también afirman que la tecnología utilizada está limitada. Entre otras cosas, el análisis de la componente heterocrómica del genoma se ha negado desde el principio, ya que en la solución utilizada este componente no es estable. Los genetistas, sin embargo, han supuesto una parte con pocos genes, pero eso también está a punto de verse. No obstante, existe la posibilidad de empezar a trabajar con el borrador para los científicos y, aunque sólo sea para satisfacer la propia curiosidad, también para mirar el borrador publicado por el proyecto público en la web http://genome.cse.ucsc.edu.