뉴저지주, 학생 작문 시험 채점에 AI 전격 도입
- •이번 봄부터 뉴저지주 내 3~10학년 학생을 대상으로 하는 주 단위 작문 평가에 AI 채점 방식이 도입된다.
- •자동화 시스템은 과거 사람이 직접 채점한 연습 시험 데이터를 학습한 매개변수를 바탕으로 에세이를 평가한다.
- •최근 텍사스와 매사추세츠주 교육구에서 AI 채점 결과의 큰 격차가 보고되면서 이에 대한 우려가 커지고 있다.
뉴저지주가 표준화된 평가 체계인 '뉴저지 학생 학습 적응형 평가(New Jersey Student Learning Assessments-Adaptive)'에 자동화 방식을 도입하기로 했다. 이 시스템은 초등학생부터 고등학생까지 영어 과목의 에세이와 단답형 답변을 인공지능으로 평가하는 구조를 갖추고 있다. 컴퓨터를 활용한 채점 방식 자체는 이전에도 존재했으나, 이번 전환은 130만 명에 달하는 학생들의 학업 성과를 처리하는 방식에 있어 전례 없는 대규모 확장을 의미한다.
Cambium Assessment가 운영하는 이 채점 엔진은 일반적인 챗봇에서 볼 수 있는 생성형 모델 대신 엄격한 매개변수를 기반으로 작동한다. 특히 이는 인공지능이 허구의 정보를 생성하는 할루시네이션 현상을 방지하기 위한 설계다. 주 정부는 정확성을 유지하기 위해 비정상적인 답변이 감지될 경우 사람이 직접 검토하도록 분류하는 시스템을 갖췄다고 밝혔다. 이러한 하이브리드 워크플로우는 기계의 속도와 인간의 판단력 사이에서 균형을 맞추려는 시도지만, 교사 노동조합 사이에서는 여전히 시행을 둘러싼 논란이 계속되고 있다.
한편 비판론자들은 다른 주의 실패 사례를 근거로 신중한 접근을 요구하고 있다. 실제로 텍사스주의 한 교육구에서는 AI가 채점한 시험지를 사람이 재검토했을 때 약 44%가 더 높은 점수를 받은 사례가 발견되기도 했다. 이와 같은 점수 차이는 학생의 학업 성취도와 미래가 결정될 수 있는 중요한 평가 환경에서 자동화 시스템의 신뢰성에 대한 근본적인 의문을 제기하고 있다.