Cloudflare、AIエージェントのコンテキスト費用を大幅削減
2026年2月20日 (金)
- •Cloudflareが「Code Mode」MCPサーバーを公開。ツール呼び出しのコンテキスト消費量を99.9%削減した。
- •2,500以上のAPIエンドポイントを2つのツールに集約し、消費トークンを1,000に固定した。
- •エージェントが生成したコードはV8アイソレートのサンドボックス内で安全に実行される。
AIエージェントは、あまりに多くの外部ツールを読み込むことで、モデルが本来のタスクを処理するための容量が不足する「コンテキストの肥大化」という課題に直面することが多い。これに対し、Cloudflareはモデル・コンテキスト・プロトコル (MCP) サーバーに「Code Mode」を導入することで解決を図った。従来のように2,500を超えるすべてのエンドポイントを個別のツールとして記述すると、消費量は100万トークン以上に達するが、新システムでは「検索」と「実行」という2つの専門ツールのみを提供する。
このアーキテクチャにおいて、AIエージェントは開発者のように振る舞う。具体的には、まず検索ツールを用いて必要なAPIドキュメントを探し出し、次にJavaScriptを記述して実行ツール経由でタスクを処理する仕組みだ。「計画としてのコード(Code as a plan)」というこの戦略により、基盤となるAPIがどれほど大規模になっても、消費量は常に1,000トークンに固定される。その結果、モデルのコンテキストウィンドウをユーザーの要求処理に最大限集中させることが可能となった。
セキュリティも最優先事項として考慮されており、エージェントが生成したコードはDynamic Workerのアイソレート内で動作する。このV8ベースのサンドボックス環境は、機密性の高いシステムファイルへのアクセスや環境変数の漏洩を遮断し、安全な自動API連携を保証する。また、CloudflareはCode Mode SDKをオープンソースとして公開しており、開発者はこの高効率なアーキテクチャを自身のシステムに統合してコスト削減と性能向上を実現できる。