ByteDance、1分間の動画をリアルタイム生成する「Helios」発表
2026年3月5日 (木)
- •140億パラメータのHeliosモデルが、単一GPUで19.5 FPSのリアルタイム動画生成を実現
- •特殊なエラー修正手法なしで、1分間に及ぶ高品質な動画の一貫性を維持することに成功
- •テキスト、画像、動画をソースとする多様な生成タスクを一つのアーキテクチャで統合
ByteDanceの研究チームが、ビデオ合成技術の飛躍的な進歩を象徴する140億パラメータのモデル「Helios」を発表した。このモデルは真のリアルタイム性能を実現しており、従来のモデルが抱えていた大きな課題を解決している。具体的には、生成時間の経過に伴い品質が劣化する「ドリフト」現象を、複雑な修正ロジックに頼ることなく抑制することに成功した。これにより、1分間にわたるクリップでも一貫した高品質な映像を維持できるようになった。
Heliosの特筆すべき点は、その圧倒的な効率性にある。量子化による精度削減や特殊なキャッシュ技術を用いることなく、単一のハイエンドチップで毎秒19.5フレーム(FPS)という驚異的な生成速度を達成した。これは過去のデータを高度に圧縮し、各フレーム生成のステップ数を最小化した結果である。このアプローチにより、Heliosは膨大な計算リソースを必要とする従来の大規模システムと同等の品質を、劇的に少ない負荷で実現している。
自己回帰型拡散モデルとしての特性を活かし、テキストからの動画生成や静止画の動画化など、複数のタスクをシームレスに処理できる点も強みだ。学習段階でエラーをシミュレーションすることでモデルに自己修復能力を持たせており、より流動的で自然なメディア生成を可能にした。ByteDanceは今後、このコードとモデルをオープンソースとして公開し、AIコミュニティ全体での活用を促進する方針を掲げている。