OpenAI、API経由でのカスタムスキル直接実行を可能に
- •OpenAIが新たな「shell」ツールを通じて、APIに「スキル」機能を直接統合した
- •開発者はZIP形式でbase64エンコードしたカスタム関数をJSONリクエストに含めることが可能になる
- •開発スクリプト内では、動的なスキル実行をサポートするモデルとして「GPT-5.2」が明記された
OpenAIは、自社APIに「スキル(Skills)」機能を直接統合することで、モデルの機能範囲を大幅に拡張している。これにより、開発者がエージェンティックAI(自律型AI)に独自のカスタム機能を追加するプロセスが劇的に簡素化された。特に注目すべきは「shell」ツール環境の導入だ。これにより、モデルが特定のスクリプトや関数をその場で実行できるようになる。従来のように複雑な外部ホスティングや関数の事前登録を行う必要はなく、開発者はカスタムツールをZIP形式にまとめてbase64エンコードし、単一のJSONリクエストに含めて送信するだけで済む。
技術開発者でありブロガーでもあるサイモン・ウィリソン(Simon Willison)は、この機能を「gpt-5.2」という名称のモデルを対象としたスクリプトで実演した。彼が示した例では、単語をカウントするスキルがパッケージ化されてモデルに直接送信され、モデルは自動化されたコンテナ環境内でそのコードを実行した。このアプローチは、モデルの有用性を拡張する際の摩擦を最小限に抑えるものだ。事実上、永続的なインフラを必要とせず、特定のタスクに合わせてモデルが自分専用の「道具箱」を携行できるようになったといえる。
また、このワークフローは、専門化された開発ツールの重要性が増していることも浮き彫りにした。ウィリソンは、APIの新機能を調査・記録するために、Anthropicのコーディング用コマンドラインツールであるClaude Codeと、エージェントの動作をデモンストレーションするShowboatを組み合わせて活用した。こうした多様なAIコーディングエージェントと実演ツールの連携は、APIの検証やソフトウェア統合がAI同士の相互作用によって完結する未来を示唆している。人間は今後、より高次のアーキテクチャ設計や意図の定義に注力することになるだろう。