La intel·ligència artificial marca una fita per a resoldre un dels majors reptes de la biologia

adimen-artifizialak-biologiaren-erronkarik-handien
Ed. Wikimedia

En els últims 40 anys, la biologia molecular ha tingut un gran repte: poder predir l'estructura tridimensional de cada proteïna. De fet, les proteïnes tenen una funció en l'altre organisme gràcies a la seva estructura tridimensional, i els biòlegs somien amb saber com serà la proteïna a la vista de la simple seqüència de l'ADN. La resposta ha estat de Google.

El laboratori d'intel·ligència artificial de Google, DeepMind, ha estat l'encarregat de conquistar als humans en els escacs i en el joc Go. No ha resolt del tot el misteri: inventa estructures del 90% de les proteïnes, de les quals no totes, però fins ara era impensable amb precisió. Així, assenyalen que aquest assoliment és la primera fita significativa de la intel·ligència artificial cap a la ciència.

Les proteïnes són molècules grans i complexes imprescindibles per a la vida. Dirigeixen la major part de les funcions que tenen lloc en el nostre cos: contracció i moviment dels músculs, digestió dels aliments, visió i escolta, coneixement dels virus introduïts de l'exterior… I la funció que tindrà cada proteïna li proporcionarà la seva forma tridimensional. De fet, les proteïnes només contenen vint aminoàcids diferents, però combinant-los en llargues cadenes poden donar lloc a milers i milers de plecs, una hèlix aquí, un gir després, un plec allí… obtenint estructures molt complexes.

Però conèixer la seqüència genètica d'una proteïna no significa que es pugui conèixer automàticament la seva forma. Per contra, quan una proteïna es plega, dos aminoàcids molt allunyats de la cadena poden quedar entre si. De fet, entre els aminoàcids poden donar-se interaccions químiques de molt diversa índole: interaccions iòniques, ponts H, interaccions de Van der Waals, etc., per la qual cosa els biòlegs moleculars tenen grans limitacions per a entendre aquest procés de plegat.

Donada la complexitat del procés, cada dos anys van començar a organitzar-se en 1994 el concurs internacional de predicció de l'estructura de proteïnes CASP. Se celebra cada dos anys i participen nombrosos grups de recerca. Els investigadors de Google han obtingut un resultat espectacular en aquest concurs.

DeepMind ha entrenat la xarxa neuronal relacionant la forma i seqüència gènica de milers de proteïnes ja conegudes. Basant-se en aquest coneixement, el programa AlphaFold prediu la distància i l'angle entre cada parella d'aminoàcids, realitzant un ajust per a trobar la configuració més estable.

Estructura de tres proteïnes que han hagut de preveure en el concurs. En verd, l'estructura vista amb criomicroscopía; en blau, la prevista per DeepMind. Han entrenat el programa AlphaFold per a predir estructures tridimensionals de proteïnes. Ed. DeepMind

Els resultats de la intel·ligència artificial permeten preveure grans canvis en bioingeniería i medicina. De fet, aportarà noves claus per a entendre les malalties. En moltes ocasions, una única mutació pot produir grans canvis en el plegat de la proteïna i, per tant, en la seva funció. Moltes malalties són conseqüència d'això i els científics podran conèixer el seu fonament. Però també permetrà dissenyar proteïnes a la carta. És a dir, mitjançant el disseny d'una estructura concreta, permetrà dissenyar medicaments amb una activitat o una altra.

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila