Kimi K2.5登場、100個のAIが連携する「スウォーム」技術
- •15兆トークンで学習された、強力なオープンソース・マルチモーダルモデル「Kimi K2.5」がリリースされた。
- •100個のサブエージェントを協調させる「エージェント・スウォーム」技術により、単一モデルより4.5倍高速な処理を実現した。
- •動画からのウェブサイト再構築や、自律的な視覚デバッグを行う高度なコーディング能力を実証した。
Kimi K2.5は、従来の単一モデルによる対話から、協調的な「エージェント・スウォーム(Agent Swarm)」アーキテクチャへの移行を象徴する、オープンソースAIの大きな飛躍である。15兆トークンという膨大なデータで学習されたネイティブなマルチモーダル基盤を活用し、テキストと視覚データの両方を極めて高い精度で処理することが可能になった。これにより、ウェブサイトの画面録画から機能するコードを生成したり、自律的にPythonスクリプトを記述・実行して複雑な論理パズルを解いたりと、高度なソフトウェア・エンジニアリング・タスクをこなす力を備えている。
このモデルの核心的な革新は、最大100個のサブエージェントを同時に自己組織化(セルフオーケストレーション)する能力にある。人間が特定の役割やワークフローを定義する必要があった従来のシステムとは異なり、K2.5は並列エージェント強化学習を用いることで、大規模な問題を動的に分解し、並列的なトラックへと振り分ける。タスクを一つずつ順番にこなすシリアル処理から、群れ(スウォーム)のような実行形態へと転換したことで、複雑な演算にかかる時間は4倍以上短縮された。これは単一モデルを巨大化させるのではなく、計算能力を「横に広げる」スケーリングの成功を意味している。
この高度な調整を実現するため、開発チームは「クリティカル・ステップ」という指標を導入し、並列ワークフローにおける最長経路の速度を最優先させた。これにより、AIがマルチタスク能力を持ちながらも、効率の悪い段階的な処理に陥ってしまう「シリアル・コラプス(直列崩壊)」を防いでいる。ユーザー向けには、開発環境に統合可能なオープンソース・ツール「Kimi Code」が提供される。自律的なビジュアルデバッグやドキュメント検索を可能にするこのツールは、スウォーム型ソフトウェア開発という新たな時代の幕開けを告げている。