追加学習なしでAIエージェントのツール呼び出しエラーを修正
2026年2月12日 (木)
- •ASA手法は、追加訓練なしに中間層のアクティベーションへの介入を通じてツール呼び出しの挙動を修正する。
- •Qwen2.5-1.5Bのベンチマークにおいて、ツール使用のF1スコアが0.18から0.50へと大幅に向上した。
- •わずか20KBの資産で動作する軽量なシステムであり、モデルの重みの更新は一切不要である。
AIエージェントを外部ツールに適応させるプロセスは、非常に壊れやすいことで知られている。ツールのインターフェースがわずかに変化しただけで、モデルが問題を解決する知識を持ちながらも、必要なツールを起動し損ねる「怠惰なエージェント(Lazy Agent)」現象が発生するためだ。これに対し、筆頭研究者のユジン・ワン(Youjin Wang)氏らのチームは、推論プロセス中にエラーを修正する訓練不要のソリューション「Activation Steering Adapter(ASA)」を導入した。
モデルのコアな重みを再学習させる標準的なファインチューニングとは異なり、ASAは中間層のアクティベーションに対してシングルショットの介入を行う。このアクティベーションとは、モデルが情報を処理する際に内部層を流れる信号のことだ。ASAはルーターを用いて特定のステアリングベクトルを選択することで、モデルを正しいツール使用モードへと精密に誘導する。さらに、プローブに導かれたゲート機能が、真の意図を増幅させつつ誤作動を抑制することを可能にした。
Qwen2.5-1.5Bを用いたMTU-Benchベンチマークのテストでは、精度と再現率のバランスを示すF1スコアが0.18から0.50へと急上昇した。この改善は、わずか20KBのポータブルな資産のみで達成されており、永続的な重みの更新や、既存の知識を失う「破滅的忘却」のリスクも伴わない。この優れたモジュール性により、開発者はインターフェースの進化に合わせてツールの挙動を即座に更新できるようになる。