グーグル、Gemini APIのコスト管理機能を公開
2026年3月16日 (月)
- •Google AI Studioが、プロジェクトごとに月間予算を厳密に管理できる「プロジェクト支出制限」を導入した。
- •支払い実績に応じてAPIの容量を自動で引き上げる「使用量ティア」により、手動の手続きなしでスケールアップが可能になった。
- •新設の観測ダッシュボードにより、リクエスト数、トークン数、コストをモデル別にリアルタイムで把握できる。
大規模言語モデル(LLM)の導入に伴う財務的な複雑さは、プロトタイプから本番環境への移行を目指す開発者にとって、しばしば大きな障害となる。この負担を軽減すべく、グーグルはGoogle AI Studioに「プロジェクト支出制限(Project Spend Caps)」を導入した。これにより、個別のプロジェクト単位で月間予算の上限を厳密に設定することが可能になった。この細やかな制御機能は、実験的な機能の急激なスケールや、予期せぬループ処理によって発生する請求額の急騰を防ぐことを目的としている。
また、成長プロセスを簡素化する「使用量ティア(Usage Tiers)」システムも刷新された。従来のように容量増加のために手動の承認を待つ必要はなく、プラットフォームが自動的なステップアップをサポートする。支払い実績が積み上がり利用規模が拡大するにつれ、システムはアカウントのステータスを自動的に昇格させる。その結果、開発者が手動で申請することなく、システムが許容する最大リクエスト数であるレート制限(Rate limiting)が段階的に緩和される仕組みだ。
今回のリリースにおけるもう一つの柱が、透明性を高める新たな観測ダッシュボードの提供である。開発者は1分あたりのリクエスト数(RPM)や1分あたりのトークン数(TPM)といった指標から技術的な稼働状況を監視できるほか、日々のコスト内訳をリアルタイムに確認できる。こうした情報を一元化することで、グーグルは高度なAIアプリケーション開発における運用上の摩擦を取り除き、技術的なパフォーマンスと財務的なガバナンスが両立する環境を整えようとしている。