METR、GPT-5.1-Codex-Maxの自律性リスクは低いと評価 | KnowAI Space