自然界の秘密を解き明かす鍵は、一企業の金庫にしまわれるべきか、それとも公共の広場に投げ出されるべきでしょうか。
タンパク質やDNAの立体構造を予測するAIの分野において、DeepMindの「AlphaFold3」は圧倒的な精度を誇る絶対的な王者です。その推論コードこそ公開されているものの、モデルの重みは非商用かつ申請制であり、学習データと学習コードは固く閉ざされています。この制限による飢餓状態の反動として、オープンソースという旗印の下に集った多数のクローンモデルたちが爆発的な進化を遂げています。2026年第2四半期現在、この包囲網はどこまで王者に肉薄したのでしょうか。
2026年Q2の戦力分布#
ひとくちに「オープンソース」と言っても、ライセンスや重みの公開範囲、学習データの透明性には大きなグラデーションがあります。現在の主要モデルの状況を整理しましょう。
| モデル | ライセンス | 状態 / 最終リリース | 主な特徴 |
|---|---|---|---|
| Boltz-2 | MIT | 2.2.1 (2025-09) | 構造予測と結合親和性を同時出力。商用利用可。 |
| Chai-1 | Apache 2.0 | v0.6.1 (2025-03) | 枝分かれリガンドなど複雑な修飾に対応。 |
| Protenix | Apache 2.0 | v2.0.0 (2026-04) | 派生モデル(PXDesign等)を展開しエコシステムを形成。 |
| OpenFold3 | Apache 2.0 | v0.4.1 (2026-04) | AF3のビット単位の再現を目指し、1300万の蒸留データを公開。 |
| HelixFold3 | CC BY-NC-SA 4.0 | 3.2 (2025-07) | 非商用に限定。商用利用は有料APIへの誘導を図るハイブリッド戦略。 |
MITライセンスで提供される「Boltz」シリーズは、創薬スクリーニングにおける使い勝手の良さをアピールしています。Chai Discoveryによる「Chai-1」や、Bytedanceの「Protenix」は、いずれもApache 2.0ライセンスを採用し、研究から商業まで幅広い土壌を提供しています。特に2026年4月にv2へとアップデートされたProtenixは、タンパク質結合設計モデルなどを派生させ、独自のエコシステムを急速に拡大しつつあります。
さらには、コロンビア大学のAlQuraishi Labを中心とする「OpenFold3-preview」が、1300万シーケンスに及ぶ蒸留データセットまで丸ごと公開するという力技を見せています。
これらのモデルは、コマンド一つで未知の薬の形を試せる時代を引き寄せました。例えばBoltzであれば、以下のコマンドで簡単に予測が開始できます。
pip install boltz[cuda] -U
boltz predict input_path --use_msa_server
ただし、公開されたモデルは無料の魔法ではなく、最新のA100やH100、最低でも32GB以上のGPUメモリという高額な「入場料」を要求します。計算資源の階級差が、そのまま創薬のスタートラインの差になる事実は変わりません。
FoldBenchが暴く、越えられない壁#
では、このオープンモデルたちはAlphaFold3の王座を奪ったのでしょうか。現実はそれほど甘くありません。
Nature Communications誌で発表された包括的ベンチマーク「FoldBench」は、これらモデル(FoldBenchが対象としたのはAlphaFold 3、Boltz-1、Chai-1、HelixFold 3、Protenix)の真の実力を冷酷なまでに数値化しました。全体的な汎化性能と頑健性において、AlphaFold3はいまだに他の追随を許していません。
特に興味深いのは、AIの「弱点」が共通していることです。抗体と抗原の複合体予測において、ほとんどのオープンモデルは成功率が40パーセントを割り込み、惨敗を喫しています。唯一AlphaFold3だけが45.4パーセントという成功率を叩き出しました。また、リガンドのドッキング予測においても、対象の分子がAIの学習データから遠ざかれば遠ざかるほど、目に見えて精度が低下するという「AIらしい」限界が露呈しています。

DNAやRNAといった核酸の予測に至っては、タンパク質と比べて全体的にスコアが落ち込んでいます。オープンモデルの中ではProtenix(RNAのLDDTスコア0.59)やChai-1などが健闘していますが、AlphaFold3(同0.61)には一歩及びません。
「速さ」と「物理」のジレンマ#
さらに、創薬という実戦投入を考えた場合、AIモデル特有の限界が浮き彫りになります。
最新の「Boltz-2」は、自らの手法が物理ベースのFEP(自由エネルギー摂動法)級の精度に近づきつつ、1000倍高速であると主張しています。しかし、2026年3月のarXiv論文による独立評価によれば、Boltz-2の予測は初期のスクリーニングとしては驚異的な速度を誇るものの、最終的な新薬候補トップ100を絞り込むために必要な「微細な物理エネルギーの解像度」には全く届いていないと結論づけられています。
AIの圧倒的な速度は人間の「もっと早く結果が欲しい」という欲望を満たしますが、最後の一つを決める厳密な物理シミュレーションの署名を代替するには至っていないのです。
CASP16が示す次なる戦場#
タンパク質構造予測のオリンピックとも呼ばれる「CASP16」におけるAlphaFold3のプレプリントも、興味深い事実を提示しています。AlphaFold3はすべてのカテゴリでトップクラスの成績を収めましたが、難易度の高いターゲットにおいては、旧世代であるAlphaFold2に「力技で大量のサンプリングを行わせた結果」とほぼ互角だったというのです。
ここから、わたくしは一つの仮説を立てます。モデルの構造自体を進化させるよりも、「無数に出力された予測の中から、どれが最も正解に近いかを鑑定する眼」こそが、現在の本当のボトルネックなのではないかと。次の戦場は予測器ではなく、予測のランク付け機能になるはずです。
皆様が新薬の開発にオープンソースモデルを組み込むなら、それは「無料の完璧なツール」を手に入れることではありません。ダウンロードボタンは皆様への招待状ではなく、自己責任の署名欄です。公開された予測器を使う者は、予測が外れた場合の責任まで、すべて自分自身の実験ノートに引き受けることになるのです。