この記事の要点は？

OpenAIがオープンウェイトモデル「gpt-oss-safeguard」向けに、プロンプトベースの安全ポリシーを導入。有害なボディイメージや危険な活動など、若年層に特化した6つのリスク領域をカバー。開発者コミュニティ「ROOST」を通じてオープンソースとして公開し、グローバルな連携を目指す。

OpenAI、10代の安全を守るAIモデレーション指針を公開

•OpenAIがオープンウェイトモデル「gpt-oss-safeguard」向けに、プロンプトベースの安全ポリシーを導入。
•有害なボディイメージや危険な活動など、若年層に特化した6つのリスク領域をカバー。
•開発者コミュニティ「ROOST」を通じてオープンソースとして公開し、グローバルな連携を目指す。

•若者を守るため、AIが不適切な言葉や内容を自動的に判別する新しいルール集を公開しました。
•暴力や過激な遊び、恋愛的な会話など、若者にとって特に注意が必要な6つの危険分野に対応します。
•開発者が誰でもこのルールを調整して自分のサービスに組み込めるよう、設計図を無料公開しています。

OpenAIは、10代を対象としたAI体験を開発するエンジニア向けに、特化した安全ポリシーの提供を開始した。従来の固定的なルール設定に頼るのではなく、OpenAIのオープンウェイト型モデレーションモデルであるgpt-oss-safeguardに対する自然言語プロンプトとして構築されている点が大きな特徴だ。テンプレート化されたこれらのポリシーを提供することで、コンテンツの分類やフィルタリングを行う「クラス分類器」の作成が容易になり、AIとの対話における安全性と年齢への適合性がより確実に担保されるようになる。

今回の取り組みでは、若年層ユーザーに特有の6つのリスク領域、すなわち過激な暴力、有害なボディイメージ、危険な行動への挑戦、恋愛目的のロールプレイ、そして年齢制限商品の入手が重点的に扱われている。開発者はこれらのプロンプトを活用して、汎用的なフィルターよりも精密に、ユーザー投稿のリアルタイムな選別や事後監査を行うことが可能だ。これは、成人と比較して10代のユーザーには独自のデジタル保護とよりきめ細かなモデレーションが必要であるという、業界内での認識の高まりを裏付けている。

開発の透明性と協力を促進するため、これらのポリシーはROOST Model Communityを通じて一般に公開された。このオープンソース方式により、各国の開発者は現地の言語や文化的な文脈に合わせてフレームワークを柔軟に調整できるようになる。コモン・センス・メディアなどの専門組織とも連携することで、OpenAIは抽象的な安全原則を、実際のプロダクト運用で機能する具体的な技術ツールへと落とし込むことを目指している。

OpenAIは、10代の若者がAIを使う際に、より安全で年齢に適した会話ができるようにするための新しいガイドラインを発表しました。これまではAIのルールを厳しくプログラムで固定するのが一般的でしたが、今回は人間が指示を出すような自然な文章（プロンプト）を使ってAIをコントロールする仕組みを採用しました。これにより、開発者はAIが何を良しとし、何をダメと判断すべきかというルールを、まるで料理のレシピを教えるように簡単に設定できるようになります。このAIのフィルター機能を備えたモデルを（gpt-oss-safeguard）と呼びます。

具体的には、若者が巻き込まれやすい6つのリスクに焦点を当てています。例えば、過激な暴力表現や、痩せすぎを助長するような体型への過度な執着、ネット上で流行する危険な遊び、不適切な恋愛のなりきり会話、そして未成年にふさわしくない商品の購入などが対象です。これまでの一般的なフィルターよりも、若者の心身の発達を考えた細かい判断ができるようになり、AIがやり取りの中で危険な兆候を察知して、リアルタイムで会話を調整したり、後からチェックしたりすることが可能になります。

この取り組みは、特定の会社だけで抱え込まず、オープンソースとして（ROOST Model Community）というコミュニティを通じて誰でも使えるように公開されています。これにより、世界中の開発者が、それぞれの国や地域の言葉、文化に合わせてルールを調整しやすくなりました。OpenAIは、子供のネット環境を守る団体などと協力しながら、専門家が考える理想の安全ルールを、実際のアプリ開発の現場でもしっかり守れるように橋渡しをしようとしています。

OpenAI、10代の安全を守るAIモデレーション指針を公開

中高生がAIと安心して会話できるための新しい仕組みをOpenAIが公開しました

タグ