Même si la séquence du génome humain était pratiquement entièrement décodée, une partie (8%) était encore inconnue. Ils étaient des fragments de séquences très répétitives, trop répétitives pour pouvoir se séquencer avec la technologie existante. Maintenant, avec les nouvelles technologies et méthodes, ils ont réussi à compléter les lacunes manquantes. Le magazine Science a publié dans un numéro spécial six articles sur son travail.
Le consortium international Telomere-to-Telomere (T2T) a travaillé pendant trois ans pour décoder ces séquences. Ils ont utilisé une ligne spéciale de bazar, qui provient d'un embryon qui a rejeté l'ADN de sa mère et a doublé celui du père. Lorsque cela se produit, les embryons sont invitables et deviennent des tumeurs. Ces cellules n'ont pas deux copies différentes de chaque gène (celle du père et celle de la mère), mais deux copies égales, ce qui facilite le décodage de parties inconnues. En même temps, les méthodes et outils de séquençage développés ces dernières années ont été fondamentaux, permettant de décoder des séquences beaucoup plus longues et beaucoup plus rapides qu'auparavant.
Ainsi, 200 millions de paires de développées ont été ajoutées à la séquence connue jusqu'ici, environ 2.000 gènes. Au total, le génome complet a 3.055 millions de paires de développées et 19.969 protéines de codage. Ils ont également corrigé des milliers d'erreurs et, comparant ce génome de référence à d'autres, ils ont déjà trouvé deux millions de nouvelles variantes génétiques.
La plupart des nouvelles séquences se trouvent dans les centromères et les télomères. Les centromères sont des zones situées au centre des chromosomes et qui ont une grande importance pour la distribution de l'ADN dans la division cellulaire. Les erreurs des centromères sont directement liées à diverses maladies, et on y conserve des indices de l'évolution humaine.
Les télomères sont des séquences répétitives qui protègent les extrémités des chromosomes, se raccourcissent à mesure qu'ils vieillissent et grandissent dans des tumeurs. Ainsi, connaître ces séquences peut être important pour mieux comprendre le vieillissement, le cancer et d'autres maladies.