この記事の要点は？

ASA手法は、追加訓練なしに中間層のアクティベーションへの介入を通じてツール呼び出しの挙動を修正する。 Qwen2.5-1.5Bのベンチマークにおいて、ツール使用のF1スコアが0.18から0.50へと大幅に向上した。わずか20KBの資産で動作する軽量なシステムであり、モデルの重みの更新は一切不要である。

追加学習なしでAIエージェントのツール呼び出しエラーを修正

•ASA手法は、追加訓練なしに中間層のアクティベーションへの介入を通じてツール呼び出しの挙動を修正する。
•Qwen2.5-1.5Bのベンチマークにおいて、ツール使用のF1スコアが0.18から0.50へと大幅に向上した。
•わずか20KBの資産で動作する軽量なシステムであり、モデルの重みの更新は一切不要である。

•ASA手法は、追加訓練なしに中間層のアクティベーションへの介入を通じてツール呼び出しの挙動を修正する。
•Qwen2.5-1.5Bのベンチマークにおいて、ツール使用のF1スコアが0.18から0.50へと大幅に向上した。
•わずか20KBの資産で動作する軽量なシステムであり、モデルの重みの更新は一切不要である。

AIエージェントを外部ツールに適応させるプロセスは、非常に壊れやすいことで知られている。ツールのインターフェースがわずかに変化しただけで、モデルが問題を解決する知識を持ちながらも、必要なツールを起動し損ねる「怠惰なエージェント（Lazy Agent）」現象が発生するためだ。これに対し、筆頭研究者のユジン・ワン(Youjin Wang)氏らのチームは、推論プロセス中にエラーを修正する訓練不要のソリューション「Activation Steering Adapter（ASA）」を導入した。

モデルのコアな重みを再学習させる標準的なファインチューニングとは異なり、ASAは中間層のアクティベーションに対してシングルショットの介入を行う。このアクティベーションとは、モデルが情報を処理する際に内部層を流れる信号のことだ。ASAはルーターを用いて特定のステアリングベクトルを選択することで、モデルを正しいツール使用モードへと精密に誘導する。さらに、プローブに導かれたゲート機能が、真の意図を増幅させつつ誤作動を抑制することを可能にした。

Qwen2.5-1.5Bを用いたMTU-Benchベンチマークのテストでは、精度と再現率のバランスを示すF1スコアが0.18から0.50へと急上昇した。この改善は、わずか20KBのポータブルな資産のみで達成されており、永続的な重みの更新や、既存の知識を失う「破滅的忘却」のリスクも伴わない。この優れたモジュール性により、開発者はインターフェースの進化に合わせてツールの挙動を即座に更新できるようになる。

AIエージェントを外部ツールに適応させるプロセスは、非常に壊れやすいことで知られている。ツールのインターフェースがわずかに変化しただけで、モデルが問題を解決する知識を持ちながらも、必要なツールを起動し損ねる「怠惰なエージェント（Lazy Agent）」現象が発生するためだ。これに対し、筆頭研究者のユジン・ワン(Youjin Wang)氏らのチームは、推論プロセス中にエラーを修正する訓練不要のソリューション「Activation Steering Adapter（ASA）」を導入した。

モデルのコアな重みを再学習させる標準的なファインチューニングとは異なり、ASAは中間層のアクティベーションに対してシングルショットの介入を行う。このアクティベーションとは、モデルが情報を処理する際に内部層を流れる信号のことだ。ASAはルーターを用いて特定のステアリングベクトルを選択することで、モデルを正しいツール使用モードへと精密に誘導する。さらに、プローブに導かれたゲート機能が、真の意図を増幅させつつ誤作動を抑制することを可能にした。

Qwen2.5-1.5Bを用いたMTU-Benchベンチマークのテストでは、精度と再現率のバランスを示すF1スコアが0.18から0.50へと急上昇した。この改善は、わずか20KBのポータブルな資産のみで達成されており、永続的な重みの更新や、既存の知識を失う「破滅的忘却」のリスクも伴わない。この優れたモジュール性により、開発者はインターフェースの進化に合わせてツールの挙動を即座に更新できるようになる。

追加学習なしでAIエージェントのツール呼び出しエラーを修正

タグ