Ils ont présenté un modèle d'apprentissage automatique capable de décoder et de concevoir avec une grande précision des séquences d'ADN, d'ARN et de protéines. Ils l'appellent EVO. Avec l’analyse de millions de génomes microbiens, l’EVO a développé la capacité de comprendre le code génétique. Ainsi, par exemple, il est capable de prédire si les mutations auront un effet biologique ou de concevoir de nouvelles séquences. Le travail a été publié dans la revue Science.
L'EVO a été conçu pour produire des séquences d'ADN à l'échelle de génomes entiers, et a été formé avec des données du génome des micro-organismes pour 2,7 millions d'euros. Et selon les développeurs, il a une grande capacité d'interpréter et de générer des informations biologiques avec une grande précision. Il prédit avec une grande précision l'influence des mutations sur les protéines des bactéries et sur l'ARN, ainsi que sur la modélisation de la régulation génétique. En outre, EVO comprend la co-évolution complexe entre des séquences de codage et des séquences de non-codage. Et il est capable de générer des séquences de plus de 1 mégaoctets.