Garena egiten gaituena, egiten duguna idazteko

CAF-Elhuyar 2023 saria (Dibulgazio-artikulu orokorra)

Gizakiok betidanik izan dugu hurrengo belaunaldiei ezagutza transmititzeko grina berezi bat, eta horrek informazioa gordetzeko zenbait modu deskubritu edota garatzera bultzatu gaitu. Gaurdaino dakigunaren arabera, horren lehen ebidentziak duela 40.000 urte inguruko labar-artean ditugu. Aurrerago, hizkuntzen sorrerarekin batera, lehen idatzizko testuak sortu genituen. Halaber, paperaren aurkikuntzak eta inprentaren garapenak ekarri zuten liburuak informazio-iturri gisa nagusitzea urte luzez.

Paradigma-aldaketa ordea, XX. mende erdialdean gertatu zen, elektronika digitalaren sorrerarekin batera. Izan ere, transistorearen eta mikrotxiparen garapenei esker, besteak beste, datuen biltegiratze digitala jaio zen.

Zer da datuen biltegiratze digitala?

Datuen biltegiratze digitala informazio digitala baliabide elektronikoen bidez biltegiratzean datza. Orobat, informazio digitala sistema bitarraren bidez (0ak eta 1ak baliatuz) adierazten den informazioa da. 0 eta 1 balioek egoerak adierazten dituzte. Esaterako, 0a “itzalita” egoerari dagokio, eta 1a “piztuta” egoerari; edo 0a tentsio elektriko konkretu bati, eta 1a beste tentsio bati. Nolanahi ere, bi egoera errepresentatzen dituzte. Sistema bitarrean, egoera-unitate horietako bakoitzari bit esaten zaio, eta 8 bit, bata bestearen segidan idatzita, byte bat eraikitzen da. Hortik abiatuta, eta milaka byte-ren bidez, testua, irudiak, bideoak, audioak eta bestelako informazio digitala eraikitzen da.

Datuen biltegiratze digitalari esker, informazio-kantitate handiak espazio fisiko txikian gordetzeaz gain, behin baino gehiagotan irakur eta edita daitezke [1]. Zinta magnetikoa, disketea, CDa, DVDa eta USBa dira azken hamarkadetan informazio digitala biltegiratzeko nagusitu diren sistema esanguratsuenetako batzuk. Medio fisiko horiek, ordea, biziraupen mugatua izateaz gain, ez dute informazioa partekatzea errazten. Horren harira, gaur egun datuak biltegiratzeko nagusitzen den sistema honako hau dugu: hodeia. Erosoa, azkarra, irisgarria, segurua, mugagabea eta jasangarria, ezta?

Spoiler: Hodeia ez da existitzen

Bada, ez. Google, Amazon Web Services (AWS), Microsoft eta horrelako beste enpresa batzuek kudeatzen dituzten datu-zentroek osatzen dute “hodeia”. Hortaz, azpiegitura horien konplexutasuna laburbiltzeko erabiltzen den metafora bat baino ez da hodeia [2].

Une batez, begiratu diezaiogun 2022. urtean egun bakoitzeko sortu dugun datu-kantitateari: 8,5 milioi bilaketa Googlen, 720.000 ordu YouTuben, 93 milioi argazki Instagramen, 867 milioi txio Twitterren eta 333 mila milioi mezu elektroniko, besteak beste. Hortaz, 94 zettabyte inguru sortu eta kontsumitu ditugu azken urtean (1 zettabyte = 1 E + 21 byte). Alegia, bit bakoitza euro bateko txanpona balitz eta 1 zettabyte osatu arteko txanponak pilatuko bagenitu, 1.970 argi-urteko distantzia osatuko genuke; Alpha Centauri eguzki-sistematik gertuen dagoen izar-sistemara 225 joan-etorri egiteko bestekoa.

Hori horrela izanik, datu-zentro horiek 10.000 m2 inguruko azaleretan, zutabe eta lerro ugaritan, antolatzen diren zerbitzarien biltegi erraldoiak izatera iritsi dira. Zerbitzari horiek, jakina, hotz-sistema bat behar dute gainberotzeak saihesteko. Hori gutxi ez eta, “hodeia” une oro erabilgarri egon dadin eta sare elektrikoan gerta daitezkeen akatsen eragina hauteman ez dadin, gune horietan dieselez elikatzen diren sorgailuak egoten dira. Beraz, horrelako gune batek, urte batean, 50.000 etxebizitzek erabiltzen duten energiaren baliokidea kontsumitzen du. Datuak digitalki biltegiratzeko joera hazkorra ikusita, mende honen amaierarako, ekoizpen digital horri eusteko beharko den energia planeta osoko egungo energia-kontsumoa gainditzera iritsiko litzateke [3].

Alternatibarik?

Gauza bat garbi dago: hau ez da bidea. Norabidez aldatu behar dugu. Alternatiba bat aurkitu, edo batzuk. Ez da erreza, ez, baina galde diezaiogun biziraupenaz guk baino gehiago dakien norbaiti, hots, guk baino esperientzia handiagoa duen norbaiti. Galde diezaiogun naturari.

Nola lortu du naturak belaunaldiz belaunaldi gizakia gizaki edota zuhaitza zuhaitz egiten duena oroitzea? Nola aldatu gaitu eta du gure ingurua naturak, garai eta leku konkretu bakoitzean, ezaugarri bereizgarriak izan ditzagun? Funtsean, molekula bakar batekin: DNA (azido desoxirribonukleikoa) [4].

DNAz ari garenean, bizia bera datorkigu burura, baina ez informazioa edota ordenagailuak. Bada, DNA bera organismo batean informazioa gorde eta transmititzeko 4 letrako kodea da. Molekula hori lau nukleotidoz (adenina (A), timina (T), guanina (G) eta zitosina (C)) osatutako kate-bikoitzeko helizea da.

Informazio digitala DNA bihurtzeko, lehenik eta behin, datuak kodetu behar dira (ikusi 1. irudia). Hori egiteko zenbait modu daude, algoritmo bat idazteko zenbait lengoaia dauden antzera. Aukera bat honako hau egitea da: sistema bitarreko 00 adierazteko, adenina erabiltzea, 01 guanina, 10 zitosina eta 11 timina [5]. Prozesu horren bidez, kate bakarreko DNA-sekuentzia eraiki daiteke % 99ko eraginkortasunarekin. Zergatik ez % 100eko eraginkortasunarekin? Bada, DNAren sintesi-prozesuan badirelako saihestu ezin daitezkeen akats batzuk, eta, beraz, nukleotido bakoitzak gehienez gorde dezakeen informazioa, 2 bit-ekoa izan beharrean, 1,8 bit-ekoa da. Aipatzekoa da, akastuna den % 1 horrek arazoak eragin ditzakeela datuak biltegiratzean. Horregatik, kate bakarra sortu beharrean, kopia ugari sortzen dira, informazioa bere osotasunean ondo gordetzen dela bermatzeko.

1. Irudia: Sistema bitarretik DNAra datuak kodetzeko prozesua. Arg. Judith Zubia Aranburu

Jarraian, sintetizatutako DNA hori biltegiratu behar da. Zenbait biltegiratze-sistema garatu diren arren, esan liteke bi estrategia daudela. Aukera bat DNA izoztu eta bere horretan gordetzea litzateke. Molekula hori egonkor mantendu daiteke milioika urtez baldintza horietan. Beste aukera bat DNA enkapsulatu eta beste material batean txertatzea da. Estrategia hori “DNA-of-Things” edo “Gauzen DNA” deritzon ideian oinarritzen da, eta, funtsean, informazioa DNAra kodetu eta eguneroko objektuetan gordetzean datza. Horren adibide bat 2019an Suitza eta Israelgo ikerlari batzuek egindako lana da [6]. Haiek fitxategi digital bat DNAra kodetu eta beirazko partikula batzuetan enkapsulatu zuten. Ondoren, partikula horiek polikaprolaktona (PCL) polimeroarekin nahastu eta, 3Dko inpresioaren bidez, objektu batean txertatu zituzten. Hortaz, inprimatutako objektuak berak fitxategi horretan biltegiratutako informazioa bere baitan izatea lortu zuten. Horrez gain, inprimatutako objektu horren edozein ataletatik DNA erauzi, eta PCR (Polymerase Chain Reaction) bidez anplifikatu zuten, eta, hala, frogatu zuten fitxategi hori objektu berrietan gorde zitekeela (ikusi 2. irudia).

2. Irudia: DNA bidez informazio digitala biltegiratzeko prozesua. Arg. Judith Zubia Aranburu

Errealitatea edo zientzia fikzioa?

Datuak gordetzeko DNA erabiltzea arrotza egiten bazaigu ere, ideia honek gero eta gutxiago du zientzia fikziotik. Izan ere, gizakiok mende honetarako ditugun erronkekin oso ondo lerrokatzen den estrategia da.

Informazioa DNA bidez biltegiratzea gaur egun darabilzkigun sistemak baino energetikoki eraginkorragoa eta jasangarriagoa da (ikusi 3. irudia), ondo enkapsulatutako DNAk mendeak iraun baititzake giro-tenperaturan. Gainera, ez du mantentze-lanik behar, eta horrela gordetako fitxategiak erraz kopiatu eta erreplika daitezke.

3. Irudia: Zenbait biltegiratze-sistemaren biziraupena, gaitasuna eta kostua. Arg. Meiser et. al.-etik [7] egokitua.

Hori gutxi ez eta biltegiratze-sistema honek dentsitate handia du, DNA bidez gordetzen den informazioak oso bolumen txikia okupatzen baitu. Izan ere, DNA-gramo bakar batean, 215 petabyte sar daitezke (1 petabyte = 1 E + 15 byte)  [8]. Aurreikuspenen arabera, mundu mailan 169 zettabyte-ko informazioa sortuko dugu 2025. urterako. DNA bidez biltegiratuz gero, kikara bat baino ez luke beteko.

Hala ere, esan beharra dago gaur egun oraindik DNA bidez datuak biltegiratzea garestia dela, eta gutxienez pare bat hamarkada pasatu beharko direla DNAren sintesi eta erauzketarako sistemen prezioak jaitsi eta modu orokortu batean erabiltzen hasi arte [9].

Horrez gain, biltegiratutako fitxategiak abiadura egokian berreskuratzeak erronka bat izaten jarraitzen du. Izan ere, DNA gordetzeko erabilitako kapsula bakoitzak bertako edukiari dagokion DNA-kode bat du etiketa gisa. Hortaz, fitxategi konkretu bat hautatu eta ateratzeko, gainontzekoak bere horretan utziz, DNA-etiketa horri dagokion abiarazlea gehitu behar zaio. Gaur egungo teknologiarekin, prozesu hori oso luzea da. Baliteke, hasiera batean behintzat, DNA bidez datuak biltegiratzea “biltegiratze hotza” deritzona egiteko baino ez erabiltzea. Hau da, datu ez-aktiboak edo oso gutxitan erabiltzen direnak gordetzeko soilik erabiltzea [10].

Begirada bat etorkizunari

Eta orain imajinatu. Imajinatu honelako etorkizun bat. Imajinatu betaurreko berri batzuk erosi eta haien graduazioari, materialari eta fabrikazio-prozesuari buruzko informazio guztia betaurrekoetan bertan egotea. Imajinatu erosketak egitera joan eta janari bakoitzaren prezioa produktuak berak izatea, barra-koderik gabe. DNA biodegradagarria da; beraz, barrura. Imajinatu garena egiten gaituen hori egiten duguna idazteko erabiltzea.

Baina imajinatu, baita ere, zer suposa lezakeen horrek segurtasun eta datuen babeserako. Zein ondorio ekar litzake teknologia hori zuzen ez erabiltzeak? Zer egitera irits gaitezke? Zein da zientzialari eta ingeniarien ardura teknologia horren garapenean? Paradigma-aldaketa suposatu duten aurrerapen teknologiko eta zientifiko guztiek bezala, honek ere dilema etikoak sortu ez ezik, beste hainbat gai ere zalantzan jarriko ditu.

Datorrenean datorrela eta datorren bezala datorrela, behintzat, ez gaitzala ustekabean harrapatu.

 

BIBLIOGRAFIA

[1] A. Siddiqa, A. Karim and A. Gani, “Big data storage technologies: a survey,” Frontiers of Information Technology & Electronic Engineering, vol. 18, pp. 1040-1070, 2017.

[2] I. Odun-Ayo, O. Ajayi, B. Akanle and R. Ahuja, “An Overview of Data Storage in Cloud Computing,” International Conference on Next Generation Computing and Information Systems (ICNGCIS), pp. 29-34, 2017.

[3] A. A. Khan and M. Zakarya, “Energy, performance and cost efficient cloud datacentres: A survey,” Computer Science Review, vol. 40, 2021.

[4] L. Ceze, J. Nivala and K. Strauss, “Molecular digital data storage using DNA,” Nature Reviews Genetics, vol. 20, pp. 456-466, 2019.

[5] Y. Erlich and D. Zielinski, “DNA Fountain enables a robust and efficient storage architecture,” Science, vol. 355, pp. 950-954, 2017.

[6] J. Koch, S. Gantenbein, K. Masania, W. J. Stark, Y. Erlich and R. N. Grass, “A DNA-of-things storage architecture to create materials with embedded memory,” Nature Biotechnology, vol. 38, pp. 39-43, 2019.

[7] L. C. Meiser, B. H. Nguyen, Y.-J. Chen, J. Nivala, K. Strauss, L. Ceze and R. N. Grass, “Synthetic DNA applications in information technology,” Nature Communications, vol. 13, no. 352, 2022.

[8] R. Heckel, “An archive written in DNA,” Nature Biotechnology, vol. 36, pp. 236-237, 2018.

[9] G. M. Church, Y. Gao and S. Kosuri, “Next-Generation Digital Information Storage in DNA,” Science, vol. 337, p. 1628, 2018.

[10] K. Matange, J. M. Tuck and A. J. Keung, “DNA stability: a central design consideration for DNA data storage systems,” Nature Communications, vol. 12, no. 1358, 2021.

 

Idatzi zuk zeuk Gai librean atalean

Gai librean aritzeko, bidali zure artikulua aldizkaria@elhuyar.eus helbidera
Hauek dira Gai librean atalean Idazteko arauak

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila