テキストから「潜在的経験」を抽出、AIエージェントの新訓練法
2026年1月25日 (日)
- •GEMパイプラインがテキストから対話型のツール利用データを抽出し、AIエージェントを効率的に学習
- •GEM-32BモデルはBFCL V3ベンチマークで16.5%の性能向上を達成し、既存モデルを凌駕
- •専用の「軌跡シンセサイザー」がファインチューニングを通じて、低コストかつ高品質なデータ生成を実現
複雑なタスクをこなすAIエージェントの育成において、高品質なインタラクションデータの不足は常に大きな壁となっていた。従来の訓練手法はあらかじめ定義された硬直的なツールセットに依存していたが、研究チームは膨大なテキストから「潜在的な経験」を収穫するフレームワーク「GEM」を開発した。 GEMは標準的なテキストを問題解決のロードマップとして扱い、4段階の精緻化プロセスを経て、実行可能なツールの利用軌跡へと変換する。合成されたAPI呼び出しに頼るのではなく、既存のテキストから知識を抽出することで、訓練シナリオの多様性が飛躍的に向上したのである。 その成果は目覚ましく、GEM-32Bモデルは「BFCL V3 Multi-turn」ベンチマークで16.5%もの性能向上を記録した。さらに、研究チームはこの複雑なパイプライン全体を、専用の「軌跡シンセサイザー(Trajectory Synthesizer)」へと蒸留することに成功している。 この特化型モデルは、ファインチューニングによって元のパイプラインの出力を再現しつつ、計算コストを大幅に削減した。次世代のAIエージェントに求められるのは、単なるデータの増量ではない。人間の知識を実行可能なスキルへと変換する、より知的な手法なのだ。 静的なテキストと動的なツール実行の溝を埋めるこの研究は、より汎用性の高い基盤モデルの構築に向けた重要な一歩となるだろう。効率性を犠牲にすることなく、生成される経験の質を担保するこのアプローチは、スケーラブルなエージェント学習の未来を提示している。