TwinBrainVLA:ロボットの「知能」と「動作」を両立
2026年1月26日 (月)
- •TwinBrainVLAは、高度な意味推論と精密なロボット制御を高い次元で両立させている
- •「二脳」システムを採用し、特化訓練中の汎用的な知識の喪失を効果的に防止した
- •SimplerEnvなどのベンチマークにおいて、器用さが要求されるタスクで最高性能を記録
中関村学院(Zhongguancun Academy)の研究者たちは、ロボティクスにおける長年の難題を解決する新アーキテクチャ「TwinBrainVLA」を発表した。 AIは特定の身体動作を学習すると、それまで持っていた広範な推論能力を失ってしまう傾向がある。通常、視覚言語モデル(VLM)をロボット制御用に微調整すると、普遍的な世界知識が低レベルの運動スキルと引き換えに失われる「破滅的忘却」が発生するのだ。 TwinBrainVLAは、AIの認知負荷を独立的かつ協力的な2つの要素に分割することで、このトレードオフを回避している。 このシステムは、これらを調整するために「非対称トランスフォーマー混合(AsyMoT)」という革新的なメカニズムを採用した。 「左脳」は凍結された学習済みの汎用モデルで、膨大な意味知識を保持し続ける。一方、「右脳」は特化型の学習可能なモジュールであり、身体的な知覚やロボット自身の物理的状態を把握する自己受容感覚に焦点を当てる。 右脳が核心的な重みを変えずに左脳から意味的コンテキストを引き出すことで、ロボットは知性を保ったまま新しい器用なタスクを習得できる仕組みだ。 これらの高度な思考を物理的なアクションへ変換するため、データは専門のエキスパートモジュールへと送られ、操作に必要な精密かつ連続的なコマンドが生成される。 シミュレーション環境での広範なテストの結果、TwinBrainVLAは既存の最先端モデルを一貫して上回る性能を示した。 この二重経路アプローチは、デジタルな推論と物理的な実行の溝を埋め、知能と身体能力を兼ね備えた汎用ロボットを実現するための有望な設計図となるだろう。