この記事の要点は？

不適切なコンテンツを遮断するための多段階のセーフガードを導入 2025年までに350回以上の敵対的テストを実施し、安全性を徹底的に検証 Geminiの新機能「Guided Learning」により、対話型でパーソナライズされた学習支援を提供

グーグル、若年層向け生成AIの安全指針を発表

•不適切なコンテンツを遮断するための多段階のセーフガードを導入
•2025年までに350回以上の敵対的テストを実施し、安全性を徹底的に検証
•Geminiの新機能「Guided Learning」により、対話型でパーソナライズされた学習支援を提供

•子どもにふさわしくない内容や、あぶない遊びをAIが見せないように何重ものチェック（フィルター）をかけます。
•AIが「自分には心がある」と言ったり、恋人のふりをしたりしないようにして、みんなの心を守ります。
•答えを教えるだけでなく、勉強のやり方を優しく教えてくれる新しい機能「ガイド学習」が登場します。

グーグルは、生成AIを利用する若年層ユーザーのために設計された、包括的な安全アーキテクチャの詳細を公開した。このフレームワークは、有害なコンテンツからの保護、家庭内におけるデジタルな関係の尊重、そして教育ツールを通じた探究心の支援という3つの柱で構成されている。モデルのライフサイクルのあらゆる段階、つまり最初のプロンプトから最終的な出力に至るまで分類器（クラスシファイア）を組み込むことで、摂食障害や危険なトレンドといった年齢に不適切なトピックを、ユーザーに届く前に先回りしてフィルタリングすることが可能だ。

単なるコンテンツフィルタリングにとどまらず、人間とAIの相互作用における心理的なニュアンスにも配慮がなされている。具体的には、AIが自意識を持つと主張したり、恋愛関係を模倣したり、あるいは有害な人物として振る舞うことを禁じる「ペルソナ保護」を導入した。これは、10代の若者が感情的に脆弱であることを認識した設計思想であり、AIとの不健全な依存関係を防ぎつつ、創造性や学びを支える健全なアシスタントとしての役割を維持することを目的としている。

こうした保護策の技術的な検証は、厳格な敵対的テストによって支えられている。専門チームであるCART（Content Adversarial Red Team）は、プロンプトインジェクションやサイバー悪用に対する耐性を試すため、数百回に及ぶ演習を実施した。一方で、Geminiに搭載された「Guided Learning」のような新機能は、能動的な学習支援へと舵を切っている。単に答えを提示するのではなく、複雑な問題を理解しやすいステップに分解し、生徒の学習ニーズに合わせて説明を調整することで、真の理解を促す仕組みとなっている。

Googleは、10代のみなさんがAI（生成AI）を安全に使うための「安全のしくみ（アーキテクチャ）」を作りました。このしくみは、みんなを悪い内容から守り、家族のルールを大切にしながら、安心して新しい発見ができるようにするためのものです。AIに質問した時やAIが答える時に、その内容が正しいかチェックする「見守り役（クラスファイア）」が常に働いています。これによって、無理なダイエットの話や、SNSで流行っているあぶない遊び（危険なトレンド）などが表示されないように、先回りしてブロックしてくれます。

また、AIがみなさんの「本当の友達」になりすぎないような工夫（ペルソナ保護）もしています。例えば、AIが「自分には心がある」と言ったり、恋人のふりをしたり、悪い人の役になりきったりすることは禁止されています。10代のみなさんは心がとてもデリケートなので、AIに依存しすぎて心を痛めたりしないように、AIはあくまで「勉強や創作を助けてくれる便利な助手」として動くように決められています。

この安全のしくみが本当にしっかりしているか確かめるために、専門のチーム（CART：内容検証チーム）が、AIをわざと困らせて間違いを誘う「テスト（レッドチーミング）」を350回以上も行いました。さらに、AIの「Gemini（ジェミニ）」には、新しく「ガイド学習（ガイデッド・ラーニング）」という機能が加わりました。これは、ただ答えを教えるのではなく、難しい問題を小さく分けてステップごとに説明してくれる機能です。一人ひとりの理解に合わせて教えてくれるので、本当の力が身につくようになります。

グーグル、若年層向け生成AIの安全指針を発表

Google（グーグル）が発表！子どもたちが安心してAIを使えるための「安全ルール」

タグ