L'ésser humà sempre ha tingut una especial passió per transmetre coneixement a les generacions futures, la qual cosa ens ha portat a descobrir i/o desenvolupar algunes maneres de guardar informació. Fins al moment se sap que les seves primeres evidències es troben entre els penya-segats de fa 40.000 anys. Més endavant, amb la creació de les llengües, elaborem els primers textos escrits. Així mateix, el descobriment del paper i el desenvolupament de la impremta, van fer que durant anys els llibres apareguessin com a font d'informació.
Canvi de perfil, no obstant això, XX. es va produir a mitjan segle XX, coincidint amb l'aparició de l'electrònica digital. De fet, els desenvolupaments del transistor i del microxip van permetre, entre altres coses, el naixement de l'emmagatzematge digital de dades.
L'emmagatzematge digital de dades consisteix a emmagatzemar informació digital per mitjans electrònics. Així mateix, la informació digital és aquella que s'expressa a través del sistema binari (utilitzant els 0 i 1). Els valors 0 i 1 representen situacions. Per exemple, el 0 correspon a l'estat “apagat” i l'1 a l'estat “encès”, o el 0 a una tensió elèctrica concreta i l'1 a una altra tensió. En qualsevol cas, representen dues situacions. En el sistema binari, cadascuna d'aquestes unitats d'estat rep el nom de bit i es construeix un byte amb 8 bits consecutius. A partir d'ella, i a través de milers de bytes, es construeix text, imatges, vídeos, àudios i una altra informació digital.
L'emmagatzematge digital de dades permet guardar grans quantitats d'informació en un espai físic reduït, així com llegir i editar diverses vegades
Doncs no. El “núvol” està format per centres de dades gestionades per empreses com Google, Amazon Web Services (AWS), Microsoft, etc. Per tant, el núvol és una metàfora que s'utilitza per a resumir la complexitat d'aquestes infraestructures
Fixem-nos un moment en la quantitat de dades generada per dia l'any 2022: 8,5 milions de cerques en Google, 720.000 hores en YouTube, 93 milions de fotos en Instagram, 867 milions en Txio Usant i 333 mil milions de correus electrònics, entre altres. Així, hem generat i consumit prop de 94 cettabytes en l'últim any (1 zettabyte = 1 E + 21 bytes). És a dir, si cada bit fos una moneda d'un euro i acumuléssim monedes fins a formar 1 cettabyte, estaríem conformant una distància de 1.970 anys de llum, suficient perquè Alpha Centauri sol pogués arribar fins a 225 raigs més pròxims al sistema hissar.
En aquest sentit, aquests centres de dades han arribat a constituir uns gegantescos magatzems de servidors que s'organitzen en unes superfícies d'uns 10.000 m², en nombroses columnes i línies. Aquests servidors necessiten, per descomptat, un sistema de fred per a evitar sobreescalfaments. Per si això fos poc, i perquè el “núvol” estigui operatiu en tot moment i no s'apreciï la influència de fallades en la xarxa elèctrica, en aquestes zones hi ha generadors que s'alimenten de dièsel. Així, una zona d'aquest tipus consumeix en un any una energia equivalent a la utilitzada per 50.000 habitatges. Davant la tendència creixent d'emmagatzematge digital de dades, l'energia necessària per a mantenir aquesta producció digital arribaria a superar el consum energètic actual de tot el planeta a la fi d'aquest segle.
Una cosa és clara, això no és el camí. Hem de canviar de direcció. Trobar una alternativa o vàries. No és fàcil, no, però preguntem a algú que sap més de la supervivència que nosaltres, a algú que té més experiència que nosaltres. Preguntem a la naturalesa.
Com ha aconseguit la naturalesa recordar de generació en generació a l'ésser humà o a l'arbre? Com ha canviat i té la naturalesa el nostre entorn perquè en cada època i lloc concret tinguem unes característiques diferencials? Bàsicament, amb una sola molècula: ADN (àcid desoxiribonucleic)
Quan parlem d'ADN ens ve a la ment la pròpia vida, però no la informació ni els ordinadors. Doncs bé, el mateix ADN és un codi de 4 lletres per a guardar i transmetre informació en un organisme. Aquesta molècula és una hèlix de doble cadena formada per quatre nucleòtids (adenina (A), timina (T), guanina (G) i citosina (C).
Per a convertir la informació digital en ADN, el primer que cal fer és codificar les dades (veure 1. Imatge). Existeixen diverses maneres de fer-ho, de manera similar a com existeixen diversos llenguatges per a escriure un algorisme. Una opció és utilitzar l'adenina per a expressar 00 del sistema binari, 01 guanina, 10 citosina i 11 timina.
A continuació s'emmagatzemarà l'ADN sintetitzat. Encara que s'han desenvolupat diversos sistemes d'emmagatzematge, es poden considerar dues estratègies. Una alternativa seria congelar i mantenir l'ADN. Aquesta molècula pot mantenir-se estable durant milions d'anys en aquestes condicions. Una altra possibilitat és encapsular l'ADN i integrar-lo en un altre material. Aquesta estratègia es basa en la idea de “DNA-of-Things” o “ADN de les coses” i consisteix bàsicament a codificar la informació a l'ADN i emmagatzemar-la en els objectes quotidians. Un exemple és el treball realitzat en 2019 per investigadors de Suïssa i Israel.
Encara que l'ús de l'ADN per a emmagatzemar dades ens resulta estrany, aquesta idea cada vegada té menys de ciència-ficció. És una estratègia que s'alinea molt bé amb els reptes que tenim els humans per a aquest segle.
L'emmagatzematge d'informació per ADN és energèticament més eficient i sostenible que els sistemes actuals (veure 3). Imatge), perquè l'ADN ben encapsulat pot trigar segles en temperatura. A més, no necessita fer tasques d'escriptura, i els fitxers així desats poden copiar-se i replicar-se fàcilment.
Per si això fos poc, aquest sistema d'emmagatzematge és molt dens, ja que el volum ocupat per la informació emmagatzemada mitjançant ADN és molt reduït. En un sol gram d'ADN es poden ficar 215 petabytes (1 petabyte = 1 E + 15 bytes)
No obstant això, cal assenyalar que l'emmagatzematge de dades per ADN continua sent car, i que haurà de transcórrer almenys un parell de dècades des que els sistemes de síntesis i extracció de l'ADN baixin els preus i comencin a utilitzar-se de forma generalitzada
A més, la recuperació a la velocitat adequada dels fitxers emmagatzemats continua sent un repte. De fet, cada càpsula utilitzada per a emmagatzemar l'ADN porta un codi d'ADN que correspon al seu contingut com a etiqueta. Per tant, per a seleccionar i extreure un fitxer concret, mantenint la resta, cal afegir l'iniciador corresponent a aquesta etiqueta d'ADN. Amb la tecnologia actual, aquest procés és molt llarg. L'emmagatzematge de dades per ADN pot, en principi, utilitzar-se exclusivament per a la realització del denominat “emmagatzematge fred”. És a dir, utilitzar únicament per a emmagatzemar dades inactives o molt poc utilitzats
I ara imagina't. Imagineu un futur com aquest. Imagineu que compreu unes noves ulleres i que tota la informació sobre la seva graduació, material i procés de fabricació estigui en aquestes. Imagineu que anessin a fer la compra i que el preu de cada menjar fos el producte, sense el codi. L'ADN és biodegradable i, per tant, cap a dins. Utilitzar el que ens hem imaginat per a escriure el que fem.
Però imagineu també què podria suposar això per a la seguretat i la protecció de dades. Quines conseqüències tindria l'ús incorrecte d'aquesta tecnologia? Què podem arribar a fer? Quina és la responsabilitat dels científics i enginyers en el desenvolupament d'aquesta tecnologia? Com tots els avanços tecnològics i científics que han dut a terme un canvi de missió, aquest no sols generarà dilemes ètics sinó que qüestionarà altres temes.
Que quan ve ve ve i ve com ve, almenys que no ens sorprengui.
[1] A. Siddiqa, A. Karim and A. Gani, “Big data storage technologies: a survey,” Frontiers of Information Technology & Electronic Engineering, vol. 18, pàg. 1040-1070, 2017.
[2] I. Via, O. Ajayi, B. Akanle and R. Ahuja, “An Overview of Data Storage in Cloud Computing,” International Conference on Next Generation Computing and Information Systems (ICNGCIS), pàg. 29-34, 2017.
[3] A. A. Khan and M. Zakarya, “Energy, performance and cost efficient cloud datacentres: A survey,” Computer Science Review, vol. 40, 2021.
[4] L. Ceze, J. Nivala and K. Strauss, “Molecular digital data storage using DNA,” Nature Reviews Genetics, vol. 20, pàg. 456-466, 2019.
[5] I. Erlich and D. Zielinski, “DNA Fountain enables a robust and efficient storage architecture,” Science, vol. 355, pàg. 950-954, 2017.
[6] J. Koch, S. Gantenbein, K. Masania, W. J. Stark, I. Erlich and R. N. Grass, “A DNA-of-things storage architecture to create materials with embedded memory,” Nature Biotechnology, vol. 38, pàg. 39-43, 2019.
[7] L. C. Meiser, B. H. Nguyen, I.-J. Chen, J. Nivala, K. Strauss, L. Ceze and R. N. Grass, “Synthetic DNA applications in information technology,” Nature Communications, vol. 13, ez. 352, 2022.
[8] R. Heckel, “An arxivi written in DNA,” Nature Biotechnology, vol. 36, pàg. 236-237, 2018.
[9] P. M. Church, I. Gao and S. Kosuri “Next-Generation Digital Information Storage in DNA,” Science, vol. 337, p. 1628, 2018.
[10] C. Matange, J. M. Tuck and A. J. Keung, “DNA stability: a central design consideration for DNA data storage systems,” Nature Communications, vol. 12, ez. 1358, 2021.