HERO:ヒューマノイドの操作精度を3.2倍に向上
2026年2月19日 (木)
- •HEROフレームワークにより、現実世界の予測不能な環境でヒューマノイドが多様な物体を操作可能になった。
- •古典的ロボティクスと機械学習を融合させた新しい追跡ポリシーにより、操作誤差を3.2分の1に削減した。
- •オープン語彙の視覚モデルを統合し、事前の再学習なしで未知のシーンを汎用的に理解する。
ヒューマノイドロボットに、複雑で予測不可能な現実世界との相互作用を教え込むことは、ロボット工学における「聖杯」であり続けている。多くのシステムが研究室の外では苦戦する中、イリノイ大学アーバナ・シャンペーン校の研究者であるルンペイ・ドン(Runpei Dong)氏らのチームは「HERO」を発表した。この新しいパラダイムは、空間を移動しながら同時に物体を扱う高度な技術「ロコマニピュレーション(移動操作)」に焦点を当てている。視覚と運動制御を橋渡しすることで、HEROはコーヒーショップのマグカップやオフィスの玩具など、未学習の物体とも対話することを可能にした。
HEROの驚異的な精度の秘密は、その追跡ポリシーにある。従来のロボットは手を特定の場所に配置するために厳密な数学的計算に頼ることが多く、物理的条件が変化すると失敗しやすかった。一方、HEROはロボットの手が実際にどこにあるかを正確に予測する学習済みモデルを導入することで、この問題を解決している。古典的な物理学と現代のソフトウェア技術を融合させたこのハイブリッドな手法により、従来の手法と比較して精度が3.2倍も向上した。
さらに、HEROはオープン語彙(Open-vocabulary)の視覚システムを採用している点でも際立っている。あらかじめ設定されたリストにある物体だけを認識するのではなく、高度な視覚モデルを用いて人間のようにシーン全体を理解するのだ。これにより、再学習なしで高さの異なる場所にある物体を掴むことが可能となった。このモジュール化された設計は、将来的にエージェンティックAI(自律型AI)のアシスタントが家庭内の多様なタスクを自律的にこなす未来を予感させる。