ニュージャージー州、記述試験のAI採点を本格導入
2026年3月10日 (火)
- •ニュージャージー州は今春、小学3年生から高校1年生(10年生)を対象とした州全体の記述試験にAI採点を導入する。
- •自動採点システムは、過去に人間が採点した試験データを基に構築されたパラメーターを用いて、エッセイの評価を行う。
- •テキサス州やマサチューセッツ州の学区でAI採点の不一致が報告されたことを受け、信頼性への懸念が高まっている。
ニュージャージー州は、標準化テストの枠組みである「New Jersey Student Learning Assessments-Adaptive」に自動採点方式を取り入れることを決定した。このシステムは、小学生から高校生までの英語(国語)科目におけるエッセイや短答式回答を評価するためにAIを活用するものだ。コンピューターによる採点自体は以前から存在していたが、130万人もの学生が提出する課題をAIが処理するという今回の転換は、教育現場におけるテクノロジー活用の大幅な拡大を意味している。
採点エンジンを管理するのはCambium Assessmentであり、一般的なチャットボットのような生成モデルではなく、厳格なパラメーターに基づいて動作する設計となっている。これはAIが事実とは異なる内容を出力するハルシネーションを回避するための措置だ。また、精度を担保するために、州は「特殊な」回答については人間が直接確認するフラグ立て機能を備えている。こうしたハイブリッドな運用により、処理速度の向上と精度の維持を両立させる狙いがあるものの、教職員組合からは依然として懸念の声が上がっている。
特に他州での先行事例が、自動採点の課題を浮き彫りにしている。実際にテキサス州の学区では、AIが採点した回答を人間が再確認したところ、約44%でスコアが上昇したという報告があった。このような採点結果の乖離は、学生の成績や進路に直結する重要な試験において、自動化システムの信頼性をいかに確保するかという極めて重要な問いを投げかけている。