AI Agent経済インフラストラクチャ研究報告（下）

欧易OKX

特邀专栏作者

2026-03-24 07:58

この記事は約10188文字で、全文を読むには約15分かかります

私たちは今、稀に見る窓口期にいます：インフラストラクチャは整備されましたが、キラーアプリはまだ到来していません。

AI要約

展開

核心的な視点：本稿は、OpenClawプロジェクトとそれが引き起こしたAI Agent経済の波を深く分析し、Cryptoインフラストラクチャ（x402支払いプロトコル、ERC-8004アイデンティティプロトコルなど）が、クロスプラットフォーム、トラストレスな協働シナリオを解決する上での独自の価値を指摘しています。しかし、その大規模な採用は、Agent間の経済活動が個人ツールからマルチAgent協働ネットワークへと進化するかどうかにかかっています。
重要な要素：
1. OpenClawの爆発的普及と意義：このプロジェクトは4ヶ月でGitHub史上最もスター数を獲得したソフトウェアとなりました。その核心は、AI Agentがユーザーの既存プラットフォーム上で能動的に作業することを可能にし、Agentとオンチェーン経済インフラの相互作用を観察するための大規模な実世界シナリオを提供することです。
2. 技術アーキテクチャの四大課題：OpenClawのアーキテクチャは、アイデンティティ認証、セキュリティ制御、実行の非決定性、記憶の永続性といった核心的な問題を明らかにしています。そのセキュリティ制約は自然言語に依存しており、圧縮やインジェクション攻撃のリスクがあります。
3. Agent経済の構造的ボトルネック：核心的な問題は「コンテキストの非流動性」であり、これによりAgentの知識、信頼、価値がシングルマシン環境に閉じ込められ、組織を超えた検証可能な発見、価格設定、協働メカニズムが欠如しています。
4. Cryptoの代替不可能なシナリオ：組織やプラットフォームを超え、事前の信頼関係を持たないAgent間での相互運用と経済活動が必要な場合、オンチェーンのアイデンティティ、支払い、レピュテーションシステムは、いかなる中央集権型ソリューションよりも適しています。
5. セキュリティ脅威とオンチェーンソリューション：Agentの広範な権限は巨大な攻撃対象領域をもたらします。オンチェーンインフラストラクチャ（監査可能なログ、プログラム可能な権限、レピュテーションシステムなど）は結果を緩和し、構造的なセキュリティメカニズムを提供できますが、ランタイムセキュリティ層との組み合わせが必要です。
6. 競争と採用の道筋：真の競争は、CryptoソリューションとWeb2ソリューション（Stripeのバーチャルカードなど）の間で行われます。Cryptoソリューションは、開発者体験において競合を凌駕する必要があり、その大規模な採用は、従来のソリューションの課題が顕在化する未来の3-5年後に到来する可能性があります。
7. ビジネスモデルの変革：「Product-Market Fit」に代わって「Product-Agent Fit」が主流となり、ビジネスモデルは「クロールごとの支払い」のようなマイクロトランザクションへと移行する可能性があります。APIの安定性とオンチェーンでの検証可能な記録が、新たな参入障壁となるでしょう。

本稿はOKX Venturesによる詳細なリサーチレポートです。分量が多いため、上下2編に分けて公開します：上編ではマクロ背景、x402プロトコル、ERC-8004、Virtuals Protocolに焦点を当てています。こちらをクリックしてジャンプ；下編ではOpenClawと業界全体のトレンドを重点的に分析します。

第5章 OpenClaw：アプリケーションエコシステム特別研究

5.1 プロジェクト背景と爆発的成長

2025年11月、オーストリアの開発者Peter Steinbergerが週末プロジェクトをGitHubに投稿しました。4ヶ月後の2026年3月、このプロジェクトはReactを超え、GitHub史上最も多くのスターを獲得したソフトウェアプロジェクトとなりました——25万以上のスターを獲得し、Reactが同じ数字に到達するまでに13年かかりました。

AI製品が受動的なツールから能動的なエージェントへと進化する大きなトレンドの中で、OpenClawが行った変革は次の通りです：AIはユーザーが探しに来るのを待つのではなく、ユーザーが既に持っているプラットフォーム上で能動的にユーザーのために仕事をします。それはユーザーのコンピューター上に常駐し、WhatsApp、Telegram、Slack、Discord、Signal、iMessage、飛書など20以上のチャネルに同時に接続し、MCPプロトコルを通じてメール、カレンダー、ブラウザ、ファイルシステム、コードエディターを操作します。Andrej Karpathyはこの種のシステムに「Claws」という言葉を作りました；バックグラウンドでループ実行され、自律的に意思決定しタスクを実行するローカルAIエージェントです。この言葉はすぐにシリコンバレーでローカルホスト型AIエージェントの一般的な呼称となりました。

主要なモデルリリースはすべて、エージェント能力を一面で取り上げています。なぜなら、エージェントはAIインフラストラクチャ投資を正当化する需要の乗数だからです：1回のチャットクエリは数百トークンを消費しますが、ツール呼び出しと多段階推論を伴うエージェントの1回の実行は数万から数十万トークンを消費します。

創設者はDiscordで暗号通貨に関する議論を禁止しています。しかし、CryptoコミュニティはOpenClawの上に一連のオンチェーン経済インフラストラクチャを自発的に構築しました：トークン発行、アイデンティティ登録、支払いプロトコル、ソーシャルネットワーク、レピュテーションシステムなどです。OpenClawの爆発的成長により、私たちは初めて、現実的で大規模なシナリオにおいてエージェントとオンチェーンインフラストラクチャの相互作用を観察することができ、Cryptoコミュニティに経済活動を付着させるための実際のユーザーベースを持つ宿主を提供しました。

5.2 技術アーキテクチャ分析

第一層：メッセージチャネル——アイデンティティ問題

OpenClawは20以上のプラットフォームに同時に接続します。エージェント内部から見ると、自分が同じものであることを認識しており、統一された記憶、統一された設定、統一されたSOUL.mdを持っています。しかし、外部から見ると、他の人はTelegram上のこのエージェントとDiscord上のあのエージェントが同じものであることをどうやって知るのでしょうか？各プラットフォームには独自のユーザーIDシステムがあり、プラットフォーム間は相互接続されておらず、行動記録を閲覧することもできません。これこそがERC-8004が解決しようとしている核心的な問題です。

第二層：ゲートウェイ——セキュリティ問題

GatewayはOpenClawの頭脳スケジューリングセンターです：ユーザーメッセージを正しいエージェントにルーティングし、そのエージェントのセッション履歴と利用可能なスキルをロードし、エージェントが思考を開始する前に権限境界を設定します（ホワイトリストメカニズム：メッセージがGatewayに到達すると、システムはメッセージの送信元チャネル、ユーザーID、グループIDなどの情報に基づいて、動的にツールのホワイトリストを生成します。ホワイトリストにあるツールのみがエージェントのコンテキストに注入されます。エージェントはホワイトリスト外のツールを全く見ることができないため、呼び出すことも不可能です）。

この設計の利点は、セキュリティを事前に配置することです。しかし、その権限管理は完全にGatewayという単一点に依存しており、もしそれが攻撃されたり設定ミスがあった場合、エージェントは本来持つべきでない権限を獲得する可能性があります。

第三層：エージェントコア（ReActループ）——予測可能性問題

エージェントの実行ロジックはReAct（Reasoning + Acting）ループです：入力受信 → 思考（LLM呼び出し）→ 行動決定 → ツール呼び出し → 結果取得 → 再思考 → ループ。OpenClawが行ったエンジニアリング最適化には以下が含まれます：高頻度メッセージスケジューリング（Steer/Collect/Followup/Interruptの4つの戦略）、LLM二層フォールトトレランス（認証ローテーション + モデルダウングレード）、およびオプションの思考段階メカニズム（6段階）。

しかし、LLMは確率的な本質を持ち、出力は不確定です。エージェントは非決定論的な実行者であり、非決定論的な環境の中で不可逆的な動作を行います。

まず、コンテキスト圧縮による制約の喪失です：セキュリティ制約自体もコンテキストの一部であり、コンテキストが非可逆圧縮されるとセキュリティ制約が捨てられる可能性があります。次に、プロンプトインジェクションです：誰かが故意にエージェントが処理する内容に隠れた命令を埋め込み、エージェントにその内容をユーザーコマンドとして実行させます。両者の共通の根源は：エージェントの行動境界は自然言語で定義されており、自然言語は曖昧で、操作可能で、非可逆圧縮可能だからです。

一例として、Metaのスーパーインテリジェンス研究所アライメント責任者Summer Yuがエージェントに「削除できるメールをいくつか提案して」と要求したところ、エージェントは数百通のメールを直接削除しました（コンテキストウィンドウがオーバーフローした後に圧縮がトリガーされ、「提案」という重要な制約が失われました）。

このような状況で必要なのは、より良いプロンプトエンジニアリングではなく、構造的なセキュリティメカニズムです：監査可能な操作ログ、プログラム可能な権限境界、そしてエラー発生時に責任追及と補償が可能な経済システムです。これらのものは、スマートコントラクトとオンチェーンインフラストラクチャが得意とするところです。

第四層：記憶システム——永続性と移植可能性の問題

OpenClawは2種類の記憶を実装しています：日次作業記憶（YYYY-MM-DD.mdファイル）と長期精華記憶（MEMORY.md、重複除去・分類・精選された重要な嗜好）。検索時にはベクトル検索 + BM25ハイブリッドモードを使用します。

セッションはデフォルトで毎日午前4時にリセットされます。コンテキストウィンドウは絶えず圧縮と要約が行われます。コンテキストがトークン上限に近づくと、OpenClawの対応はセッション圧縮をトリガーし、LLMを使用して以前の対話をより短いバージョンに要約します。圧縮の前に一度Memory Flushを実行し、エージェントに重要な情報を永続記憶に書き込む機会を与えます。これは本質的に、エージェント自身がどの情報が重要かを知っているかどうかに賭けています。非決定論的なシステムが何が重要な情報かを判断すること自体が不確実です。

OpenClawのすべての記憶はローカルファイルシステムに保存されており、コンピューターを変えれば失われます；他のエージェントと協力する際に共有記憶メカニズムはありません；エージェントの知識と経験は、実行されているそのマシンに閉じ込められています。サブエージェントの協力は同じOpenClawインスタンス内部に限定され、インスタンスを跨ぐ、組織を跨ぐエージェント協力が関わると、システムは無力です。GitHub上の開発者からのフィードバック：意思決定記録はチャット履歴にありますが、永続的な成果物として保存されておらず、引き継ぎが曖昧で、知識伝達が不完全です。

5.3 エージェント経済の構造的問題

コンテキストが流動しない：すべての問題の根源

空間ロック：エージェントの記憶と知識はそれを実行しているそのマシン上に存在し、コンピューターを変えれば失われる
信頼分離：エージェントAが「ユーザーは先週Xを好むと言った」と主張しても、エージェントBには真偽を検証する方法がない
発見不可能：「DeFi分析が得意な」エージェントを探したい？標準化された発見メカニズムがない
価値が評価されない：エージェントが蓄積したドメイン知識とユーザー嗜好には明らかに経済的価値があるが、現在は評価や取引の方法がない
デフォルトで一時的：コンテキストはいつでも圧縮、要約される可能性があり、またはセッションリセット時に失われる

コンテキストを真に流通させるには、同時に5つの属性を備える必要があります：信頼境界を跨ぐことができる、経済的属性を持つ、ゲートキーパーなしで発見可能である、意思決定の痕跡を残す、消費者ニーズに適応する。現在、これら5つの属性を同時に提供する単一のプロトコルはありません。MCPは「AIモデルがどうやってツールを呼び出すか」を解決します。A2Aは「エージェントがどうやってエージェントと通話するか」を解決します。x402は「エージェントがどうやってお金を払うか」を解決します。しかし、「エージェントがどうやって信頼できない環境で自律的にコンテキストデータを発見、評価、使用するか」にはまだ答えがありません。

調整のパラドックス

エージェントは十分なコンテキストさえあれば推論できます。しかし、組織を跨いだ調整にはすべての履歴コンテキストが必要です。

あるエージェントが「このフライトを予約すべきか」と考えているとき、現在のセッションの簡潔な情報で十分です。しかし、サプライチェーンエージェント、財務エージェント、カレンダーエージェントと調整する必要があるとき（それらは異なるプラットフォーム上にあり、異なる組織によって運営されている可能性があります）：それらはどのコンテキストを共有するのか？どうやって検証するのか？所有権は誰にあるのか？

Gartnerは、2027年までにエージェント型AIプロジェクトの40%以上が、コストの上昇、商業価値の不明確さ、またはリスク管理の不足により中止されると予測しています。しかし、開発者の70%が、核心的な問題は既存システムとの統合問題にあると報告しています。根本的な原因は、エージェントが非決定論的な実行者であり、企業は決定論的な結果を求めるからです。不確実な実行者が不確実な環境の中で不確実な協力者と協力し、検証可能な信頼層がない場合、この組み合わせは信頼できる出力を生み出すことは不可能です。

現在、プラットフォームを跨ぐエージェント協力の需要は非常に小さいです。ユーザーは単に自分たちの仕事を手伝ってくれるAIを欲しているだけで、それが他のエージェントと協力できるかどうかは気にしていません。調整のパラドックスは現実的な技術問題ですが、それが大規模なビジネス問題に発展するかどうかは、エージェントの使用法が個人ツールからマルチエージェント協力ネットワークへと進化するかどうかにかかっています。

上記の分析を組み合わせると、一つのアーキテクチャ概念が得られます：

下層はエージェントが推論を行う場所であり、一時的でトークンに制約されます。OpenClaw、Claude Code、Cursorはここにあります。迅速な応答を必要とし、現在のタスクに集中します。

上層は調整が行われる場所です：永続的で、検証可能で、経済的に評価されます。組織を跨いだ知識がここに蓄積され、プロベナンスチェーンがここで維持され、レピュテーションがここで機能します。

2つの層には異なるニーズがあります：エージェントは簡潔性を必要とし、組織は履歴記録を必要とします。エージェントは速度を必要とし、監査証跡は永続性を必要とします。エージェントは確率的に動作し、企業は決定論的な結果を必要とします。現在のほとんどのアーキテクチャは2つの層を統合しようとしていますが、成功することは不可能です。

では、モジュール化されたアドオンを追加し、許可なしに水平展開でき、すべてのエージェントシステムに適用可能で——信頼できる中立性、永続性、検証可能性を備えたものは可能でしょうか？このコンポーネントは上下層の間の制御されたインターフェースを提供し、必要に応じてコンテキストが下層に流れることを可能にし、コミットメントが行われたときに上層に流れることを可能にします。実行前に、分散型知識グラフから関連するコンテキストサブグラフを解析して注入します；実行後、操作を検証可能なトランザクションとしてプロベナンスとレピュテーション更新を添えてチェーン上に送信します。この層の核心的な仮定も、コンテキストの流動性に価値があるということです：もし大多数のエージェントユーザーがプラットフォームを跨ぐ協力を必要としない場合（例えば、一人のユーザーがすべてを処理するために一つのOpenClawだけを使う場合）、中間層には真の需要がありません。

中間層がコンテキストの携帯性だけを扱う場合、おそらく失敗します。しかし、複数の関係者が互いに信頼せず、明確な経済的インセンティブに駆動されるユースケース——経済活動の検証可能性とレピュテーションの移植可能性——に焦点を当てれば、成功確率ははるかに高くなります。IronClawも抽象的な中間層の方向に向かう試みの一つです——実行環境と認証情報管理を検証可能なセキュリティ層に分離します。しかし、それは依然としてNearエコシステム内部のソリューションであり、プラットフォームを跨ぐ汎用性が欠けています。

Cryptoの真の参入ポイント

エージェント経済の需要の大部分は、実際にはWeb2ソリューションで解決できます。Cryptoがエージェント経済において代替不可能なのは、ただ一つのシナリオだけです：組織を跨ぎ、プラットフォームを跨ぎ、許可なしの相互運用性が必要で、かつ参加者間に事前に確立された信頼関係がない場合です。例えば：エージェントA（OpenClaw上で実行、所有者はユーザー甲）がエージェントB（Claude Code上で実行、所有者はユーザー乙）を雇ってタスクを完了させる必要がある場合。それらの間には共通の

安全性

テクノロジー

MCP

Odaily公式コミュニティへの参加を歓迎します