この記事の要点は？

Sber Robotics Centerが、多様な形状のロボットを制御する5段階フレームワーク「Green-VLA」を公開した。統合されたR64アクション空間と3,000時間の学習データにより、ヒューマノイドから固定アームまで柔軟な制御が可能だ。段階的な強化学習アライメントを導入した結果、実環境での両腕清掃タスクの成功率が従来比で2倍に向上した。

汎用ロボットの脳となる「Green-VLA」が登場

•Sber Robotics Centerが、多様な形状のロボットを制御する5段階フレームワーク「Green-VLA」を公開した。
•統合されたR64アクション空間と3,000時間の学習データにより、ヒューマノイドから固定アームまで柔軟な制御が可能だ。
•段階的な強化学習アライメントを導入した結果、実環境での両腕清掃タスクの成功率が従来比で2倍に向上した。

•Sber Robotics Centerが、多様な形状のロボットを制御する5段階フレームワーク「Green-VLA」を公開した。
•統合されたR64アクション空間と3,000時間の学習データにより、ヒューマノイドから固定アームまで柔軟な制御が可能だ。
•段階的な強化学習アライメントを導入した結果、実環境での両腕清掃タスクの成功率が従来比で2倍に向上した。

あらゆるロボットの身体を自由自在に制御できる「脳」の開発は、ロボット工学における究極の目標だ。Sber Robotics Centerが発表したVLAフレームワーク「Green-VLA」は、5段階のトレーニングカリキュラムを通じて、この高い汎用性を実現した。具体的には、視覚の基盤モデルからマルチモーダルな事前学習、そして強化学習による微調整へと段階的に進むことで、異なるハードウェア構成間でも身体的知性を一般化することに成功している。

このシステムの核心的な革新は、ロボットの動きを記述する「共通言語」として機能する「R64アクション空間」にある。このインターフェースは、使用しない関節（自由度）をマスキングすることで、技術的な干渉を防ぎつつ単一のポリシーで多様なロボットを制御することを可能にした。また、質の異なる3,000時間分の膨大なデモデータを処理するため、オプティカルフローを用いた時間的リサンプリングを採用している。これにより、記録環境に左右されない一貫した動作の学習が可能となった。

さらに、フレームワーク内にはエピソードの進行状況を予測する専用ヘッドが搭載されており、安全性と精度の向上も図られている。これは、タスク完了後にロボットが不要に動き続けて失敗を招く「成功後のそわそわ（fidgeting）」現象を効果的に抑制する。実際に、現実世界での両腕清掃テストにおいて、Green-VLAは従来モデルの約2倍の成功率を記録し、動作速度も2倍に向上させるなど、身体化AI（Embodied AI）の分野に大きな飛躍をもたらした。

あらゆるロボットの身体を自由自在に制御できる「脳」の開発は、ロボット工学における究極の目標だ。Sber Robotics Centerが発表したVLAフレームワーク「Green-VLA」は、5段階のトレーニングカリキュラムを通じて、この高い汎用性を実現した。具体的には、視覚の基盤モデルからマルチモーダルな事前学習、そして強化学習による微調整へと段階的に進むことで、異なるハードウェア構成間でも身体的知性を一般化することに成功している。

このシステムの核心的な革新は、ロボットの動きを記述する「共通言語」として機能する「R64アクション空間」にある。このインターフェースは、使用しない関節（自由度）をマスキングすることで、技術的な干渉を防ぎつつ単一のポリシーで多様なロボットを制御することを可能にした。また、質の異なる3,000時間分の膨大なデモデータを処理するため、オプティカルフローを用いた時間的リサンプリングを採用している。これにより、記録環境に左右されない一貫した動作の学習が可能となった。

さらに、フレームワーク内にはエピソードの進行状況を予測する専用ヘッドが搭載されており、安全性と精度の向上も図られている。これは、タスク完了後にロボットが不要に動き続けて失敗を招く「成功後のそわそわ（fidgeting）」現象を効果的に抑制する。実際に、現実世界での両腕清掃テストにおいて、Green-VLAは従来モデルの約2倍の成功率を記録し、動作速度も2倍に向上させるなど、身体化AI（Embodied AI）の分野に大きな飛躍をもたらした。

汎用ロボットの脳となる「Green-VLA」が登場

タグ