Biohub, un institut de recherche biomédicale fondé par la famille Zuckerberg, a lancé l'ESM Atlas, une base de données révolutionnaire de structures protéiques comprenant 1,1 milliard de structures protéiques prédites. Cette publication dépasse largement la base de données AlphaFold, qui contient plus de 200 millions de structures. Le modèle d'IA ESMFold2, développé par Biohub, est crédité de la génération de ces prédictions et serait supérieur à AlphaFold3 selon divers critères. Notamment, ESMFold2 est entièrement open-source, permettant une utilisation commerciale sans restriction, ce qui pourrait transformer le paysage de la recherche en IA appliquée aux protéines. Le modèle ESMFold2 adopte une approche novatrice en traitant les séquences protéiques comme un langage, similaire aux techniques de traitement du langage naturel. Cette méthode permet la prédiction des structures 3D directement à partir des séquences, en intégrant une vaste gamme de données protéiques microbiennes absentes de la base de données d'AlphaFold. Le caractère open-source d'ESMFold2 devrait mobiliser la communauté scientifique mondiale, facilitant une itération et une application rapides. Si la communauté académique a réagi positivement, certains experts appellent à la prudence, soulignant la nécessité d'une validation indépendante des résultats de prédiction.