Preferred Networksが軽量VLM「PLaMo 2.1-VL」を発表
2026年4月3日 (金)
- •Preferred Networksが自律型エッジデバイス向けの高精度な軽量VLMを発表した。
- •モデルは8Bと2Bの2サイズで展開され、工場やインフラ点検に最適化されている。
- •視覚情報の理解と説明において、オープンソースの既存モデルを上回るゼロショット性能を実証した。
Preferred Networksは、自律型ハードウェアの制約下で動作する次世代のVision-Language ModelであるPLaMo 2.1-VLを公開した。汎用的なAIアシスタントとは異なり、同モデルはネットワーク接続が制限され、電力効率が重視されるドローンや産業用ロボットなどのエッジデバイスでローカルに実行できるよう設計されている。
今回のモデルは8Bと2Bのパラメータサイズで提供される。小規模ながらもVisual Question AnsweringやVisual Groundingにおいて高い能力を発揮する。これにより、自律システムは単なる物体認識にとどまらず、状況のセマンティックな説明が可能となり、産業環境におけるAI判断の透明性を高めることにつながる。
技術的な焦点は、セマンティックな理解と位置特定にある。動的なタイル分割手法を用いることで、解像度やアスペクト比の異なる画像を安定して処理できる。さらに、高度なデータ合成技術を導入し、特定の機材に対する事前の大量学習なしで点検対象の認識や異常検知を行うゼロショット性能を実現した。ビジュアルデータとテキストの高品質なアライメントを追求した同モデルは、エッジAIにおける新たな基準を提示するものである。