Biohub, một viện nghiên cứu y sinh được thành lập bởi gia đình Zuckerberg, đã ra mắt ESM Atlas, một cơ sở dữ liệu cấu trúc protein đột phá với 1,1 tỷ cấu trúc protein dự đoán. Phiên bản này vượt xa cơ sở dữ liệu AlphaFold, vốn chỉ chứa hơn 200 triệu cấu trúc. Mô hình AI ESMFold2, do Biohub phát triển, được ghi nhận là đã tạo ra những dự đoán này và được cho là vượt trội hơn AlphaFold3 trên nhiều chỉ số. Đáng chú ý, ESMFold2 hoàn toàn mã nguồn mở, cho phép sử dụng thương mại không giới hạn, điều này có thể thay đổi toàn cảnh nghiên cứu AI về protein. Mô hình ESMFold2 sử dụng một phương pháp mới bằng cách coi chuỗi protein như một ngôn ngữ, tương tự kỹ thuật xử lý ngôn ngữ tự nhiên. Phương pháp này cho phép dự đoán cấu trúc 3D trực tiếp từ chuỗi, kết hợp một lượng lớn dữ liệu protein vi sinh vật không có trong cơ sở dữ liệu của AlphaFold. Tính chất mã nguồn mở của ESMFold2 được kỳ vọng sẽ huy động cộng đồng khoa học toàn cầu, tạo điều kiện cho việc lặp lại và ứng dụng nhanh chóng. Trong khi cộng đồng học thuật phản ứng tích cực, một số chuyên gia vẫn cảnh báo thận trọng, nhấn mạnh sự cần thiết của việc xác thực độc lập các kết quả dự đoán.