The the 33rd IEEE Intelligent Vehicles Symposium (IV22) が,6月5日〜6月9日までドイツアーヘン及びオンライン(ハイブリッドフォーマット)で開催されています. 研究室から以下の発表を行いますした.
先進運転支援システムは、交通事故の回避を支援する安全技術として研究開発が進んでいます.システムの信頼性を向上させるため,運転行動予測・運転行動モデリングの重要性が高まっています.逆強化学習(IRL)は,熟練ドライバの運転行動のコツ・癖を抽出する学習手法として有力なアプローチとして知られています.一方,運転の意思決定には準最適性の課題,例えば障害物の回避について右側・左側に避けようともどちらも妥当な選択である場合,それらの選択の多様性を考慮したモデリングが必要となります.この準最適性を考慮できる確率モデリングとして,最大エントロピーIRLが広くIRLの課題で用いられています.
これらのモデルは幅広くIRLの研究で用いられてきましたが,連続状態空間における最大エントロピーIRLでは規格化関数の計算で近似計算が不可欠であり,その近似計算の方法に課題がありました.既存の研究では,ラプラス近似・確率制御手法と組み合わせた重点サンプリングなど,様々なアプローチでの近似が試みられてきましたが,運転行動モデリングに適した正確かつ効率的な近似には不十分でした.
本研究では,運転行動モデリングでよく用いられる高速探索型乱択木(RRT)を行動計画に用い,一度木を構築した後,O(1)のオーダで重点サンプリングを実現する,効率的な最大エントロピーIRL手法を開発しました.
車線変更・交差点での右左折行動予測のタスクを対象に人工環境を用いた評価により
提案するアプローチは既存のIRL手法よりも安定かつ効率的であることを確認しました.
発表情報
We-Po1S.10, June 8th, 9:30 – 10:50 (現地時間)
RRT-Based Maximum Entropy Inverse Reinforcement Learning for Robust and Efficient Driving Behavior Prediction
Shinpei Hosoma, Masato Sugasaki, Hiroaki Arie, and Masamichi Shimosaka