これまで,私達はリアルタイム処理可能な,多視点カメラベースの人体姿勢認識手法について研究をしています.これまでは高速近傍近似手法を用いた枠組みを採用していましたが,ジェスチャインタフェースや複数人同時の推定を必要とする支援サービスを考えると従来よりもさらに高速な推定が必要となります.
そこで本研究では実際のモーションキャプチャデータから取り出した数十万の姿勢一つ一つをクラスとして扱うことで,人体姿勢の推定問題を大量多クラス識別問題として扱います.そして,ボクセルと呼ばれる復元された人の立体形状を入力として,識別時に分類対象クラス数の対数オーダーで候補の絞り込みをしていく,高速な木構造型の識別器を用いる手法の開発に取り組んでいます.実験を通して,本手法が従来手法と比較して推定精度を保ちつつ大幅な高速化できていることを確認しています.