Google、Geminiに「パーソナル・インテリジェンス」を導入
- •GoogleがGeminiに「パーソナル・インテリジェンス」を統合し、GmailやGoogleフォト、検索を横断する自律的な自動化機能を実現。
- •Gemini 3 Flashに搭載された「エージェンティック・ビジョン」が、画像の細部を能動的に検証することでハルシネーションを抑制。
- •Google検索の結果画面から離れることなく、AIエージェントが買い物を完結させる「ユニバーサル・コマース・プロトコル」を発表。
Googleが1月に発表したアップデートは、AIが単なるチャットボットの枠を超え、日常のタスクを先回りして管理する「パーソナル・インテリジェンス」への転換を象徴している。Geminiアプリへの新たな統合により、システムはユーザーの許可を得た上でGmailやGoogleフォト、YouTubeのデータへ安全にアクセスし、文脈に即した高度な支援を提供することが可能になった。この動きにより、大規模言語モデル(LLM)は単なる情報の検索ツールから、現実世界の状況に基づいてニーズを予測するパーソナライズされたデジタルアシスタントへと進化したのである。
この構造的な変化は、Gemini 3 Flashに導入された「エージェンティック・ビジョン」に最も顕著に表れている。従来のコンピュータビジョンが静止画を一度に処理するのとは対照的に、この新手法ではモデルが捜査官のように画像を「探索」できるようになった。具体的には、特定の細部を能動的にズームしたり注視したりすることで、事実とは異なる情報を生成するハルシネーションのリスクを大幅に低減させている。この能動的な検証プロセスにより、視覚に関するベンチマークで高いスコアを記録し、複雑なタスクにおいても信頼性の高いパフォーマンスを実現した。
小売分野においてGoogleは、エージェンティックAI(自律型AI)向けのオープン標準である「ユニバーサル・コマース・プロトコル」を導入した。このプロトコルは、商品の発見から決済まで、ユーザーが現在の画面を離れることなくAIエージェントがショッピング体験のすべてを完結させることを可能にする。さらに、ユーザーがインタラクティブなデジタル環境を生成・構築できる「世界モデル」のGenie 3も公開された。これにより、GoogleはAIが経済活動やデジタル空間と関わる境界線を急速に押し広げつつある。