Chrome「自律型ブラウザ」の期待と現実
- •GoogleがChromeのAI ProおよびUltra購読者向けに「Auto Browse」エージェントのプレビュー版を公開した。
- •エージェントは構造化されたサイト操作には長けているが、複雑なデータ入力やタスクの継続性には課題がある。
- •実環境でのテストの結果、手動でのブラウジングに比べ、信頼性に大きな隔たりがあることが明らかになった。
生成AIのトレンドは、受動的なチャットボットから、ユーザーに代わってタスクを実行する能動的な「エージェンティックAI(自律型AI)」へと移行しつつある。GoogleがChromeエコシステム内に展開した「Auto Browse」エージェントは、膨大なブラウザのシェアを背景に、Webベースの複雑なワークフローの自動化を試みている。自律的にナビゲートするブラウザの将来性は計り知れないが、初期の検証では、現代の複雑なWebデザインを処理する上で依然として困難に直面していることが浮き彫りになった。
実際の検証において、エージェントのパフォーマンスはデジタル環境によって大きな差が見られた。公共料金プランの比較といった明確なフィルターを持つ構造化されたサイトの操作では優れた能力を発揮した一方で、複雑なインターフェースや状態の維持を要するタスクでは苦戦を強いられた。例えば、ライブ配信中のラジオから曲名を監視し続けるといった作業には失敗しており、現在のブラウザエージェントは長時間フォーカスを維持したり、リアルタイムの更新を正確に処理したりすることが苦手であるという共通の限界が露呈している。
Google自前のワークスペースツールとの連携についても、評価の結果、意外なほど脆いことが明らかになった。Gmailへの直接的なアクセス権限を持ちながらも、メールデータをGoogleスプレッドシートに転記する際に、既存の項目を上書きしたり文脈を誤解したりするミスが目立ったのだ。このような「監視」を必要とする現状は、自動運転ブラウザの理想こそ近いものの、論理のループやデータエラーを防ぐためには依然としてHuman-in-the-loop(HITL)による人間主導の監督が不可欠であることを物語っている。本作はあくまで実験的なプレビュー段階にあり、一般ユーザーが常用できる完成された生産性ツールにはまだ至っていない。