Biohub, биомедицинский исследовательский институт, основанный семьей Цукербергов, запустил ESM Atlas — революционную базу данных структур белков, содержащую 1,1 миллиарда предсказанных структур белков. Этот релиз значительно превосходит базу данных AlphaFold, которая содержит более 200 миллионов структур. Модель искусственного интеллекта ESMFold2, разработанная Biohub, приписывается создание этих предсказаний и, как утверждается, превосходит AlphaFold3 по различным показателям. Примечательно, что ESMFold2 полностью с открытым исходным кодом, что позволяет неограниченное коммерческое использование и может изменить ландшафт исследований ИИ в области белков. Модель ESMFold2 использует новый подход, рассматривая последовательности белков как язык, аналогично методам обработки естественного языка. Этот метод позволяет предсказывать 3D-структуры непосредственно из последовательностей, включая огромное количество данных о микробных белках, отсутствующих в базе данных AlphaFold. Открытый исходный код ESMFold2, как ожидается, мобилизует мировое научное сообщество, способствуя быстрому развитию и применению. В то время как академическое сообщество отреагировало положительно, некоторые эксперты призывают к осторожности, отмечая необходимость независимой проверки результатов предсказаний.