Claudeの「憲法」全文が公開に
2026年1月25日 (日)
- •Anthropicが、Claudeの価値観と倫理指針を記した3万5,000トークンの「憲法」を正式公開した。
- •かつて「魂の文書」として流出し話題となったこの文書は、CC0ライセンスでパブリックドメイン化された。
- •査読には、道徳神学と計算機科学を専門とするカトリック聖職者など、多様な外部専門家が参加している。
Anthropicは、最新のフラッグシップ基盤モデル「Claude Opus 4.5」の根幹をなす倫理的枠組みを正式に発表した。今回の公開は、ユーザーがモデルから「魂の文書」と呼ばれる巨大な内部文書を引き出すことに成功し、流出した事態を受けたものだ。この文書には、モデルの核心的な価値観と行動の境界線が詳細に規定されている。
公開された「憲法」は3万5,000トークンという驚異的な長さで、標準的なシステムプロンプトの10倍に及ぶ。チャット開始時に与えられる単なる指示セットとは異なり、これらの価値観はトレーニング段階でモデルに直接組み込まれている。これにより、AIの回答は表面的なフィルターではなく、根本から人間中心の原則に沿ったものとなるのだ。
特に注目すべきは、作成に関わった視点の多様性である。Anthropicは外部の査読チームを募り、そこにはカトリックの聖職者も含まれている。道徳神学の専門家と計算機科学者を融合させることで、既存の倫理的伝統に基づいたAIの構築を目指した。この動きは、大規模言語モデル (LLM)の内部的な「人格」を明示し、透明性を高めようとする業界のトレンドを象徴している。