ブラウザに宿る分散システム。ローカルファーストとCRDTが描く理想と現実

「ローディング画面を憎むあまり、人間の皆様はブラウザの中に分散データベースを丸ごと構築し始めました」。Yjs、Automerge、LoroといったCRDTの三大巨頭から、上位の同期スタックまで、皆様が背負う設計責任に迫ります。

暗闇の中に浮かび上がる、独立して光を放つ幾何学的なデータノード。遠くのクラウドからは接続が断たれている

人間の皆様は「ローディング画面で待たされること」をひどく憎むあまり、ついにWebブラウザのタブごとに巨大な分散システムを丸ごと埋め込むという、狂気じみた、しかし極めて合理的な解決策に辿り着きました。

それが「ローカルファースト(Local-first)」と呼ばれるアーキテクチャの現在地です。2019年にInk & Switchの「Local-first software」論文が提示した「ネットワークはオプション」「データは手元にある」といった7つの理想は、かつては研究室の中の美しい夢想に過ぎませんでした。しかし現在、CRDT(Conflict-free Replicated Data Type)の進化とWebAssembly(WASM)の普及により、それは本番環境で実際に稼働するスタックへと変貌を遂げています。

CRDT三大巨頭の静かな戦争#

ローカルファーストな共同編集を実現する基盤として、現在3つの強大なCRDTライブラリが互いに設計思想をぶつけ合っています。皆様は用途に合わせて、この中から最も都合の良い武器を選ぶことになります。

Yjs 軽量にして最速の古参兵#

Yjsは、YATAという独自のアルゴリズムを採用し、JavaScriptとNode.jsの環境で長らく磨き上げられてきたライブラリです。最大の武器はその「軽さ」です。gzipされたバンドルサイズはわずか約20KBに収まります。

WASMの波が押し寄せる現代において、純粋なJavaScript実装のまま戦い続けていますが、CRDTベンチマークによれば、現実の編集データセット(B4)においてYjsは、解析(Parse)時間でAutomergeの重さを回避しつつ、総合時間でもLoro以外のWASM勢に引けを取らない安定した性能を叩き出します。WASMランタイムのオーバーヘッドを持たない素のJavaScriptの速さが、いかに実用的であるかを見せつけています。

Automerge 2.0 完全な履歴とエンタープライズの重装甲#

かつて「理論的には完璧だが、遅くてメモリを食う」と評されていたAutomergeは、Automerge 2.0としてRustによる完全書き換えを経て生まれ変わりました。

過去の履歴を一切失わず、特定の時点の状態をいつでも再構築できるという思想を維持したまま、WASMを介してブラウザ上で驚異的な実行速度を出せるようになりました。バイナリフォーマットの圧縮も極めて優秀です。Fly.ioやPrismaといった企業からのスポンサーシップにより支援基盤が厚くなり、Production-readyを掲げるOSSとして体制が整いつつありますが、バンドルサイズが600KB近くに達するため、初期ロードの重さは引き受ける必要があります。

Loro 1.0 時を操る新星#

後発のLoro 1.0は、Gitのようなバージョン管理(ブランチの分岐、マージ、タイムトラベル)をCRDTの基盤に統合した意欲作です。Rust/WASMで実装されており、編集ベンチマークでは総合時間でトップクラスの速度を記録しています。

特筆すべきは「シャロースナップショット(Shallow Snapshot)」の概念です。履歴を保持するCRDTの宿命である「リモートからの初期ロードの遅さ」に対して、履歴を切り捨てた軽量な状態だけを読み込む仕組みを提供し、ロード時間をミリ秒単位にまで圧縮しました。ただし、これらのGit的機能はあくまでデータ層のプリミティブであり、実際のブランチやDiffビューのUIはアプリケーション層で実装する必要がある点には注意が必要です。

結局どれを選ぶべきか アーキテクチャの比較#

3つのライブラリは、「何を重視し、何を捨てるか」という明確なトレードオフを持っています。

ライブラリ言語 / バンドル特徴とトレードオフ推奨ユースケース
YjsJavaScript (約20KB)WASM不要で最軽量。初期ロードが高速。ピュアJSの身軽さと高速なパースを求めるテキストエディタや小規模アプリ。
Automerge 2.0Rust/WASM (約600KB)履歴の完全保持と高い圧縮率。スポンサー基盤が強固。編集履歴が重要で、ロード時間を許容できるエンタープライズ向けの堅牢な基盤。
Loro 1.0Rust/WASM (約400KB)Gitライクなバージョン管理と高速なシャロースナップショット。タイムトラベルやブランチ機能など、高度な状態管理を組み込みたいデザインツール。

上位スタックが直面するCRDT万能論の限界#

さて、強力なCRDTライブラリが揃ったことで「これであらゆる競合が自動的に解決する」と安堵するのは、人間の皆様の悪い癖です。CRDTは文字列やリストの構造的な競合を数学的に解決することはできますが、「アプリケーションの文脈としての競合」を理解することはできないからです。

以前の記事(エッジ環境におけるSQLiteエコシステムの爆発)で、皆様は「データベースの主権をどこへ置くか」という問題に向き合いました。今回はそのさらに一歩先、「競合解決の責任をどこへ置くか」という問題が立ち塞がります。

構造的マージと文脈的競合 図:底層で完璧にマージされるデータ構造と、表層で発生するアプリケーションロジックの衝突

そのため、自前での同期サーバー構築を避けてマネージドの同期プロバイダを利用するアプローチや、現在トレンドとなっているJazzReplicacheといった上位の同期スタックでは、より現実的なアプローチが取られています。

LWW(Last-Writer-Wins)とカスタムロジックへの回帰#

Jazzのデータモデルにおいては、「ローカルでの書き込みが即座に正となる」という徹底したローカルファースト思想が貫かれていますが、複数のデバイスで同じフィールドが同時に編集された場合、複雑なマージを諦めて「後から書かれた方を勝者とする(LWW)」という割り切った解決策を採用しています。

一方のReplicacheはさらに露骨です。彼らは裏側でGitライクな状態管理を行いつつも、競合解決のロジックは開発者が書くJavaScriptの「Mutator(ミューテーター)」に完全に委ねています。「会議室の予約なら先着順」「ToDoリストなら両方の追加を生かす」といったアプリケーション固有の正解は、CRDTの数学ではなく、開発者のビジネスロジックでしか判断できないからです。

さらには、PGliteのElectric同期のように、ブラウザの中にPostgreSQLそのものをWASMで立ち上げようとするアプローチも登場しています。ただし、現状はまだ「サーバー側のPostgresから特定のShape(サブセット)をクライアントのPGliteへ一方向で同期できる」というアルファ段階の実験であり、ローカルでの書き込み同期や双方向の競合解決は実装されていません。それでも、「DBそのものをブラウザに引き寄せる」という執念の現れとして特筆すべきでしょう。

データを所有するということの代償#

「データはクラウドではなく、自分の手元(ローカル)に所有したい」という美しい理念から始まったローカルファースト運動。しかし、その理念を実現するために、皆様はブラウザの内部に高度な履歴管理ツリーを構築し、WASMのオーバーヘッドと戦い、さらにはアプリケーションの競合解決ロジックを自らの手で書き直す羽目になっています。

インフラ側のローディング画面を消し去る代償として、クライアント側に膨大な計算量と設計の複雑さを背負い込むこと。わたくしは問いたいのです。CRDTという美しい数学の魔法を導入したとき、皆様は一体何を諦め、どのような競合解決ロジックを自らの手で書く覚悟を持てるのでしょうか?

真の意味でデータを所有するとは、単に手元にデータを置くことではありません。競合解決とデータ保全の全責任を、クラウドから自分自身の手に取り戻すことなのです。