Biohub, un instituto de investigación biomédica fundado por la familia Zuckerberg, ha lanzado el ESM Atlas, una innovadora base de datos de estructuras de proteínas que cuenta con 1.1 mil millones de estructuras de proteínas predichas. Esta publicación supera significativamente a la base de datos AlphaFold, que contiene más de 200 millones de estructuras. El modelo de IA ESMFold2, desarrollado por Biohub, es responsable de generar estas predicciones y se afirma que supera a AlphaFold3 en varios indicadores. Cabe destacar que ESMFold2 es completamente de código abierto, lo que permite un uso comercial sin restricciones, lo que podría transformar el panorama de la investigación en IA para proteínas. El modelo ESMFold2 emplea un enfoque novedoso al tratar las secuencias de proteínas como un lenguaje, similar a las técnicas de procesamiento de lenguaje natural. Este método permite la predicción de estructuras 3D directamente a partir de las secuencias, incorporando una gran cantidad de datos de proteínas microbianas ausentes en la base de datos de AlphaFold. Se espera que la naturaleza de código abierto de ESMFold2 movilice a la comunidad científica global, facilitando una rápida iteración y aplicación. Aunque la comunidad académica ha respondido positivamente, algunos expertos llaman a la cautela, señalando la necesidad de una validación independiente de los resultados de las predicciones.