The 2020 IEEE/RSJ International Conference on Intelligent Robots (IROS2020) が10月25日より11月25日まで開催中です.以下の成果について発表を行います.
動作認識技術は様々な取り組みに応用が可能であり,従来研究が盛んに行われている分野です. 動作認識では,動画や装着式センサから得られる時系列データを用いることが一般的であるため,時系列モデルの適用が一般的である.近年では,深層学習への注目に伴い長期的な作業文脈を考慮可能なLong Short-Term Memory(LSTM) [1] が注目を集めています.
一般に,より詳細な行動を認識できれば様々な応用が考えられますが,自然なセッティングでの動作の取得を考える場合,大規模な動作対象(クラス)への識別ではクラス毎のデータ量に大きな偏りが生じるという問題があります.この問題に対処するため,マルチラベル分類の枠組みを取り入れ,各ラベル毎に識別タスクを解くことでデータの偏りを抑える方法をこの研究では採用します.
一方,マルチラベル分類問題の枠組みでは,長期的な文脈への対応に関して議論が不足していため,本研究ではこの状況を鑑み,長期文脈とマルチラベル分類の双方を同時に扱う新たな深層学習モデルとしてマルチラベルLSTMを提案します.
本研究では従来から存在している二つの技術についてその統合の方法について複数のアプローチを提示し,実験結果とともにその優劣について議論しています.
-発表情報-
Haruka Abe*, Takuya Hino**, Motohide Sugihara**, Hiroki Ikeya**, and Shimosaka, Masamichi*: Multi-Label Long Short-Term Memory for Construction Vehicle Activity Recognition with Imbalanced Supervision.
(*東京工業大学, **小松製作所)
NOTE: 今回IROSはオンライン開催であり,また,無料で参加することが可能です. IROS2020 on-demand