ザッカーバーグ家が設立した生物医学研究所Biohubは、11億の予測タンパク質構造を特徴とする画期的なタンパク質構造データベース「ESMアトラス」を発表しました。このリリースは、2億以上の構造を含むAlphaFoldデータベースを大幅に上回っています。Biohubが開発したESMFold2 AIモデルはこれらの予測を生成したとされ、さまざまな指標でAlphaFold3を上回ると主張されています。特に、ESMFold2は完全にオープンソースであり、商用利用に制限がないため、タンパク質AI研究の状況を一変させる可能性があります。 ESMFold2モデルは、タンパク質配列を自然言語処理技術に似た言語として扱う新しいアプローチを採用しています。この方法により、AlphaFoldのデータベースに存在しない膨大な微生物タンパク質データを取り入れつつ、配列から直接3D構造の予測が可能となっています。ESMFold2のオープンソース性は、世界中の科学コミュニティを活性化し、迅速な反復と応用を促進すると期待されています。学術界は好意的に受け止めていますが、一部の専門家は予測結果の独立した検証の必要性を指摘し、慎重な姿勢を求めています。