2026.05.28 パナソニックHD論文、CVPR2026で「Highlight」選出

PALによるデータ選択プロセスの概要

高効率な空間認識技術Proxy3Dの概要高効率な空間認識技術Proxy3Dの概要

 パナソニック ホールディングスは、AI(人工知能)・コンピュータービジョン分野で世界最高峰の国際会議「CVPR 2026」に2件の論文が採択された。

 採択されたのは、「フィジカルAIの実用化を支える高効率な空間認識技術」(論文タイトル=Proxy3D: Efficient 3D Representations for Vision-Language Models Via Semantic Clustering and Alignment)と「AI開発のコストと時間を削減、効率的な学習を実現するPortable Active Learning(PAL)」(同=Portable Active Learning for Object Detection)。

 このうち、PALに関する論文が、特に優れた研究として「Highlight」に選出された。

 PALは、AI開発における最大のボトルネックであるアノテーションのコストを大幅に削減しながら、高精度な物体検出を実現する技術。開発した技術は、不確実性、画像の多様性、クラス不均衡といった複数の要素を統合評価し、AIが「どの画像を優先的に学習すべきか」を自動で判断する。

 これにより、従来手法と比べ平均約20%少ないアノテーション作業で同等以上の認識性能を実現した また、さまざまなAI物体検出モデルにそのまま適用できるplug-and-play型を採用している点が特長で、従来手法で課題だったモデルの改造が不要となる。

 自動運転やエッジAI、インフラ点検、工場検査などの分野で、AI導入の低コスト化と開発の効率化に貢献する。

フィジカルAIの高度化に貢献する技術

 もう一つの高効率な空間認識技術Proxy3Dは、3D空間情報を効率よく圧縮し、処理する情報量の削減と高い空間認識能力の両立を実現する。

 ロボティクスやフィジカルAIなど、現実世界で動作するAIの高度化に貢献する技術となる。

 ロボットや機械が現実世界の環境を認識・判断し、自律的に行動するためのAI「フィジカルAI」の実現には、物体同士の位置関係を把握するなど、高度な空間認識能力が不可欠となる。

 このため、画像、テキストなど複数の種類の情報を同時に扱えるAI「マルチモーダルAI」の進化が期待されている。

 ただ、従来のマルチモーダルAIを用いた空間認識技術には、空間情報を保持するための演算量が増大しやすいという課題があった。

 この技術では、クラスタリングによる高効率な特徴表現の圧縮と、段階的な空間認識学習を組み合わせることで、マルチモーダルAIが扱う空間情報量を抑えながら、他手法と同等以上の空間認識性能を実現した。

 従来の3D空間認識手法の一部では約8000トークンの空間情報をマルチモーダルAIに入力するのに対し、同技術は700トークンで3D空間を表現する。

 現実世界で動作するAIの将来的なリアルタイム処理への応用をはじめ、3D空間の認識や位置関係の理解が求められる領域など幅広い分野での実用化に貢献する。

 2件の採択論文については、6月3~7日に米国コロラド州で開催されるCVPR 2026で発表する。