Giza genoma. Non gaude?

Roa Zubia, Guillermo

Elhuyar Zientzia

2000 urteko zientziaren ekarpen nagusitzat giza genomaren sekuentziazioa hartu da. Baina, dagoeneko, lan horren bukaera hiru aldiz iragarri da, hots, 2000ko apirilean, ekainean eta aurtengo otsailean. Letra txikia irakurtzen dakienarentzat argi dago genomaren sekuentziazioa ez dela bukatu. Orduan, zergatik azaltzen da maiz komunikabideetan? Zertarako balio du? Ikerketa horrekiko, non gaude?

Joan den otsailaren 13an, munduko zientzia-aldizkari ospetsuenek, Nature-k eta Science-k, giza genomaren bi zirriborro aurkezteko zenbaki berezi bana argitaratu zuten. Nazioarteko Giza Genomaren Proiektuaren erakundearena eta Celera Genomics enpresa pribatuarena aurkeztu zituzten, hurrenez hurren. Bezperan, munduko bost hiritan aurkezpen-hitzaldiak antolatu ziren prentsari sekuentziazioaren berri emateko.

Lan erraldoi horren ibilbidea askotan aipatu da. 1990. urtean proiektu publikoa martxan jarri zen orduan zegoen teknologiaren araberako estrategiarekin. Lana hamabost bat urteetan bukatzea espero zuten. Teknologia berriak garatu ziren heinean, metodologia azkarragoetara jotzeko beharra handitu zen. Horrela, sekuentzia osoa irakurtzeko epea, gehienez, 2003. urtera arte laburtu zen.

1998. urtean proiektu publikoan aritutako langile batek, metodologia oraindik azkarragoa asmatuta, helburu berarekin Celera Genomics enpresa pribatua sortu zuen. Beste organismoen genomarekin metodo berria probatu ondoren (Drosophila melanogaster euliaren genoma sekuentziatu ondoren), giza genomaren sekuentziazioari ekin zion. 2000. urteko ekainean, bi erakundeek elkarren ondoan lan egingo zutela iragarri zuten.

Mapa orokorra

Erakunde bakoitzak bere zirriborroa aurkeztu du. Genoma beraren bi zirriborro dira, beraz. Hortaz, iragarritako gene-kopuruarentzat eta genomaren tamainarentzat bi zenbaki plazaratu dira. Emaitza hori bi hurbilketa ezberdin erabili izanaren ondorioa da. Oro har, emaitza kualitatibo antzekoak lortu dituzte, baina bi teknikak konparagarriak ez direla kontuan hartu beharra dago.

Proiektu publikoak hautatutako estrategia aldez aurretik osatutako mapa batean oinarrituta dago. Lehenengo mapa osatu eta gero sekuentzia bilatu. Teknika horrek, mantsoa izan arren, emaitza onak eskuratu ditu. Klonen bidezko metodologia da.

Scientific American aldizkariko 2000ko uztaileko azala.

Genomaren kopia asko errestrikzio-entzimen bitartez zatitu egiten dira. Entzima horiek ADNa toki zehatzetan ebakitzen dituzte. Genoma-puska txikiegiak egin ez ditzaten, erreakzioa eten egiten da. Lehen urrats horren emaitza 150.000 bat base-pare zatitan banatzea izaten da. Zati horiek bakterioen kromosoma artifizialetan (Bacterial Artificial Chromosomes, BAC) txertatu egiten dira. Horrela, bakteria ugaltzen denean, ADN zati horren kopia ugari sortzen dira, klonak alegia.

Klon horiek errestrikzio-endonukleasekin tratatzen dira zati txikiak lortzeko. Puska horietan errepikatuta dagoena argituz gero, hasierako genomaren "mapa fisikoa" osatzen da. Handik aurrera, BAC guztiak zatikatu eta zati bakoitza sekuentziatu egiten da. Mapa erabilita genomaren sekuentzia jakin daiteke.

Celera Genomics enpresak erabili duen metodologian ez da aldez aurretik maparik egiten. Hasierako ADN molekulatik klon txikiak prestatzen dira sekuentziaren analisiarekin hasteko. Bide hori askoz azkarragoa da, baina lan gehiena eginda dagoenean falta diren hutsuneak betetzea askoz zailagoa da, ez baitago ziurtatua hasierako zati guzti-guztiak aukeratu direla sekuentzia analizatzeko.

Genomaren egitura

Zirriborroetan proteinak kodetzen ez duen ADN puska handiak ikusten dira. Izan ere, parasitoek utzitako ondare genetikoa erraldoia da. Geneak ez diren horiei guztiei "ADN zaborra" deitu zaio, baina ADN kate luze horiek ezagutzen ez den funtzioren bat izan dezaketela aitortu behar da.

Beste aldetik, prentsan, gene-kopurua uste zena baino txikiagoa izateari garrantzi handia eman zaio. Proiektu publikoaren arabera 31.000 gene inguru daude eta Celera-koen arabera, berriz, 39.000. Baina edozein zenbaki ontzat eman baino lehen kontaketa egiteko moduari begirada bat eman behar zaio.

Bi erakundeek geneak bilatzen saiatzen diren programa informatikoak erabili dituzte. Programa horiek jadanik identifikatutako geneek dituzten sekuentziak oinarri bihurtu dituzte. Hala eta guztiz ere, metodologia hori lehendik aplikatu denean, errore esperimentala dutela ikusi da eta, horregatik, kontaketa informatikoaren emaitzari zuzenketa-faktore bat gehitu zaio. Horrela, adibidez, proiektu publikokoek 24.500 gene inguru "detektatu" dituzte eta aurkitu gabeko beste 6.800 daudela onartu dute. Guztira, gutxi gorabehera, 31.000 gene izango lirateke. Antzeko kalkuluak egin ondoren, Celera Genomics enpresakoek 39.000 inguru daudela plazaratu dute.

ADNaren antolaketa zelula barruan.
HGP

Zenbaki horiek behin-behinekoak ez direla begibistan dago. Nature aldizkarian idatzi duten Peer Bork eta Richard Copley zientzialari alemanen arabera, kopuru horiek asko alda daitezke. Gainera, gene-kopurua ez da espezie batek duen berezko ezaugarri bakarra. Izan ere, ornodunek ez dute gene espezifikorik garatu behar izan ornodun bihurtzeko. Gene bakoitzaren funtzioak eta erreplikazio-konplexutasunek ere badute zerikusirik naturak bioaniztasuna sortzeko duen ahalmenarekin. Saguaren genomak eta gureak kodetzen dituen gene-kopurua ez du zertan adierazgarria izan.

Ideia zaharrak eta zalantza berriak

Oro har, gene batek proteina bat kodetzen du. Hala onartu da orain arte. Baina pixkanaka beste aukera batzuk ere ikertzen ari dira biokimikariak. Izan ere, giza geneak ez dira jarraituak izaten. ADN molekulan proteinak kodetuko duen zatiak eten egiten dira eta beste toki batean du jarraipena. Tarteen arteko sekuentziei introi deitzen zaie. Introien funtzioa ez dugu oraindik ulertzen. Dena dela, horiek ere transkribatzen dira eta, horregatik, ARN mezularia "gordinak", zitoplasmara atera baino lehen, "heldu" egin behar du.

Gene batek zenbat eta introi-kopuru handiago izan, hainbat eta aukera gehiago dago ARN mezulari ezberdinak sortzeko. Horretaz ezer gutxi dakigu, baina proteinen konplexutasunarekin eta aniztasunarekin zerikusia izan dezakeela plazaratu da. Giza genomak introi-maiztasun handia du, ezagutzen dugun beste edozein genomak baino handiagoa. Horrek esan nahi du ARN mezularien aniztasuna ere oso handia dela.

Seguru asko, introiek geneen erregulazioan eta aktibazioan ere parte hartzen dute. Halakorik baieztatzeko, ADN katean urruti dauden geneen arteko elkarrekintza ere ikertu beharko da eta, beraz, nukleoaren barruan azido nukleikoek duten jarrera eta antolamendu tridimentsionala. Horrekin zerikusia duen ikerketa bitxia argitaratu zen duela gutxi, hots, birusek gordekin proteikoaren barruan ADNa sartzeko erabiltzen duten motor molekularraren egiturarena. Molekula horren funtzionamenduaren azterketak ADNaren metaketa-topologia argi lezake. Irekita gelditzen dira, beraz, genomarekin zerikusia duten ikerketa-lerro asko.

P53, ADNari lotzen zaion proteina bat.

Argi dago geroari begira lehenik sekuentzia zehaztu egin beharko dela. Horretan jardun direnek ere esaten dute erabilitako teknologiak muga dituela. Besteak beste, genomaren osagai heterokromikoaren analisiari hasieratik uko egin zaio, erabiltzen diren disoluzioan osagai hori ez delako egonkorra. Genetistek, ordea, gene gutxi dituen zatia dela suposatu dute, baina hori ere ikustear dago. Dena dela, zientzialarientzat zirriborroarekin lanean hasteko aukera dago eta, norberaren ikusmina asetzeko besterik ez bada ere, http://genome.cse.ucsc.edu web gunean proiektu publikoak argitaratutako zirriborroari so egiteko ere bai.

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila