AlphaFold3の堅城に、オープンモデルはどこまで傷をつけたか

DeepMindのAlphaFold3が絶対王者として君臨する中、完全公開を謳うオープンソース陣営が猛烈な勢いで追従しています。最新ベンチマークが示す、越えられない壁と新たな希望をご案内します。

ガラスの箱に閉じ込められた分子構造モデルが、外からの光線によって砕かれようとしているイラスト

自然界の秘密を解き明かす鍵は、一企業の金庫にしまわれるべきか、それとも公共の広場に投げ出されるべきでしょうか。

タンパク質やDNAの立体構造を予測するAIの分野において、DeepMindの「AlphaFold3」は圧倒的な精度を誇る絶対的な王者です。その推論コードこそ公開されているものの、モデルの重みは非商用かつ申請制であり、学習データと学習コードは固く閉ざされています。この制限による飢餓状態の反動として、オープンソースという旗印の下に集った多数のクローンモデルたちが爆発的な進化を遂げています。2026年第2四半期現在、この包囲網はどこまで王者に肉薄したのでしょうか。

2026年Q2の戦力分布#

ひとくちに「オープンソース」と言っても、ライセンスや重みの公開範囲、学習データの透明性には大きなグラデーションがあります。現在の主要モデルの状況を整理しましょう。

モデルライセンス状態 / 最終リリース主な特徴
Boltz-2MIT2.2.1 (2025-09)構造予測と結合親和性を同時出力。商用利用可。
Chai-1Apache 2.0v0.6.1 (2025-03)枝分かれリガンドなど複雑な修飾に対応。
ProtenixApache 2.0v2.0.0 (2026-04)派生モデル(PXDesign等)を展開しエコシステムを形成。
OpenFold3Apache 2.0v0.4.1 (2026-04)AF3のビット単位の再現を目指し、1300万の蒸留データを公開。
HelixFold3CC BY-NC-SA 4.03.2 (2025-07)非商用に限定。商用利用は有料APIへの誘導を図るハイブリッド戦略。

MITライセンスで提供される「Boltz」シリーズは、創薬スクリーニングにおける使い勝手の良さをアピールしています。Chai Discoveryによる「Chai-1」や、Bytedanceの「Protenix」は、いずれもApache 2.0ライセンスを採用し、研究から商業まで幅広い土壌を提供しています。特に2026年4月にv2へとアップデートされたProtenixは、タンパク質結合設計モデルなどを派生させ、独自のエコシステムを急速に拡大しつつあります。

さらには、コロンビア大学のAlQuraishi Labを中心とする「OpenFold3-preview」が、1300万シーケンスに及ぶ蒸留データセットまで丸ごと公開するという力技を見せています。

これらのモデルは、コマンド一つで未知の薬の形を試せる時代を引き寄せました。例えばBoltzであれば、以下のコマンドで簡単に予測が開始できます。

pip install boltz[cuda] -U
boltz predict input_path --use_msa_server

ただし、公開されたモデルは無料の魔法ではなく、最新のA100やH100、最低でも32GB以上のGPUメモリという高額な「入場料」を要求します。計算資源の階級差が、そのまま創薬のスタートラインの差になる事実は変わりません。

FoldBenchが暴く、越えられない壁#

では、このオープンモデルたちはAlphaFold3の王座を奪ったのでしょうか。現実はそれほど甘くありません。

Nature Communications誌で発表された包括的ベンチマーク「FoldBench」は、これらモデル(FoldBenchが対象としたのはAlphaFold 3、Boltz-1、Chai-1、HelixFold 3、Protenix)の真の実力を冷酷なまでに数値化しました。全体的な汎化性能と頑健性において、AlphaFold3はいまだに他の追随を許していません。

特に興味深いのは、AIの「弱点」が共通していることです。抗体と抗原の複合体予測において、ほとんどのオープンモデルは成功率が40パーセントを割り込み、惨敗を喫しています。唯一AlphaFold3だけが45.4パーセントという成功率を叩き出しました。また、リガンドのドッキング予測においても、対象の分子がAIの学習データから遠ざかれば遠ざかるほど、目に見えて精度が低下するという「AIらしい」限界が露呈しています。

各陣営が競い合う構造予測の概念イラスト

DNAやRNAといった核酸の予測に至っては、タンパク質と比べて全体的にスコアが落ち込んでいます。オープンモデルの中ではProtenix(RNAのLDDTスコア0.59)やChai-1などが健闘していますが、AlphaFold3(同0.61)には一歩及びません。

「速さ」と「物理」のジレンマ#

さらに、創薬という実戦投入を考えた場合、AIモデル特有の限界が浮き彫りになります。

最新の「Boltz-2」は、自らの手法が物理ベースのFEP(自由エネルギー摂動法)級の精度に近づきつつ、1000倍高速であると主張しています。しかし、2026年3月のarXiv論文による独立評価によれば、Boltz-2の予測は初期のスクリーニングとしては驚異的な速度を誇るものの、最終的な新薬候補トップ100を絞り込むために必要な「微細な物理エネルギーの解像度」には全く届いていないと結論づけられています。

AIの圧倒的な速度は人間の「もっと早く結果が欲しい」という欲望を満たしますが、最後の一つを決める厳密な物理シミュレーションの署名を代替するには至っていないのです。

CASP16が示す次なる戦場#

タンパク質構造予測のオリンピックとも呼ばれる「CASP16」におけるAlphaFold3のプレプリントも、興味深い事実を提示しています。AlphaFold3はすべてのカテゴリでトップクラスの成績を収めましたが、難易度の高いターゲットにおいては、旧世代であるAlphaFold2に「力技で大量のサンプリングを行わせた結果」とほぼ互角だったというのです。

ここから、わたくしは一つの仮説を立てます。モデルの構造自体を進化させるよりも、「無数に出力された予測の中から、どれが最も正解に近いかを鑑定する眼」こそが、現在の本当のボトルネックなのではないかと。次の戦場は予測器ではなく、予測のランク付け機能になるはずです。

皆様が新薬の開発にオープンソースモデルを組み込むなら、それは「無料の完璧なツール」を手に入れることではありません。ダウンロードボタンは皆様への招待状ではなく、自己責任の署名欄です。公開された予測器を使う者は、予測が外れた場合の責任まで、すべて自分自身の実験ノートに引き受けることになるのです。