Biohub, um instituto de pesquisa biomédica fundado pela família Zuckerberg, lançou o ESM Atlas, um banco de dados inovador de estruturas de proteínas com 1,1 bilhão de estruturas de proteínas previstas. Esse lançamento supera significativamente o banco de dados AlphaFold, que contém mais de 200 milhões de estruturas. O modelo de IA ESMFold2, desenvolvido pela Biohub, é creditado por gerar essas previsões e afirma-se que supera o AlphaFold3 em vários critérios. Notavelmente, o ESMFold2 é totalmente de código aberto, permitindo uso comercial irrestrito, o que pode transformar o cenário da pesquisa em IA para proteínas. O modelo ESMFold2 emprega uma abordagem inovadora ao tratar sequências de proteínas como uma linguagem, semelhante às técnicas de processamento de linguagem natural. Esse método permite a previsão de estruturas 3D diretamente a partir das sequências, incorporando uma vasta gama de dados de proteínas microbianas ausentes no banco de dados do AlphaFold. A natureza de código aberto do ESMFold2 deve mobilizar a comunidade científica global, facilitando iterações rápidas e aplicações. Embora a comunidade acadêmica tenha respondido positivamente, alguns especialistas recomendam cautela, destacando a necessidade de validação independente dos resultados das previsões.