グーグル、若年層向け生成AIの安全指針を発表
2026年3月11日 (水)
- •不適切なコンテンツを遮断するための多段階のセーフガードを導入
- •2025年までに350回以上の敵対的テストを実施し、安全性を徹底的に検証
- •Geminiの新機能「Guided Learning」により、対話型でパーソナライズされた学習支援を提供
グーグルは、生成AIを利用する若年層ユーザーのために設計された、包括的な安全アーキテクチャの詳細を公開した。このフレームワークは、有害なコンテンツからの保護、家庭内におけるデジタルな関係の尊重、そして教育ツールを通じた探究心の支援という3つの柱で構成されている。モデルのライフサイクルのあらゆる段階、つまり最初のプロンプトから最終的な出力に至るまで分類器(クラスシファイア)を組み込むことで、摂食障害や危険なトレンドといった年齢に不適切なトピックを、ユーザーに届く前に先回りしてフィルタリングすることが可能だ。
単なるコンテンツフィルタリングにとどまらず、人間とAIの相互作用における心理的なニュアンスにも配慮がなされている。具体的には、AIが自意識を持つと主張したり、恋愛関係を模倣したり、あるいは有害な人物として振る舞うことを禁じる「ペルソナ保護」を導入した。これは、10代の若者が感情的に脆弱であることを認識した設計思想であり、AIとの不健全な依存関係を防ぎつつ、創造性や学びを支える健全なアシスタントとしての役割を維持することを目的としている。
こうした保護策の技術的な検証は、厳格な敵対的テストによって支えられている。専門チームであるCART(Content Adversarial Red Team)は、プロンプトインジェクションやサイバー悪用に対する耐性を試すため、数百回に及ぶ演習を実施した。一方で、Geminiに搭載された「Guided Learning」のような新機能は、能動的な学習支援へと舵を切っている。単に答えを提示するのではなく、複雑な問題を理解しやすいステップに分解し、生徒の学習ニーズに合わせて説明を調整することで、真の理解を促す仕組みとなっている。