生活道路における運転行動モデリングでは,天候や時間帯,道路幅など,運転の状況(以下,コンテクストと総称)が熟練ドライバの危険予知運転行動に与える影響を考慮することが鍵を握ります.そこで本研究では学習データに存在しない運転状況における正確な運転行動予測が可能なモデルを開発しています.
この枠組では,運転時のコンテクストを符号化し,道路の幾何形状に基づく報酬関数と交互作用を考慮したモデルとして定式化されます.このことで複数の状況に応じて報酬場を調整する枠組になり,その結果,運転行動の予測性能の大幅な改善が可能になります.本研究では,複数のコース全長100kmを超える走行データを用いて性能評価実験を実施しております.実験結果からは.データ数が少ないコンテクストや未知のコンテクストに対しても,提案手法の予測結果が熟練ドライバーの走行データに最も類似していることを確認することができました.
交互作用を考慮するとパラメータが増大となり,学習結果が不安定になる問題があるため,エラスティックネットによる正則化による試みも行っています.
関連論文
佐藤 潤一, 西 賢太郎, 片岡 裕雄, 下坂 正倫
運転状況により変化する報酬関数からなる多タスク逆強化学習に基づく生活道路の運転行動予測.
自動車技術会2015 年秋季大会学術講演会講演予稿集.
Kentaro Nishi, Masamichi Shimosaka
Fine-Grained Driving Behavior Prediction via Context-Aware Multi-Task Inverse Reinforcement Learning
In proceedings of the 2020 IEEE International Conference on Robotics and Automation, 2020.
平川 優伎, 竹中 一仁, 平野 大輔, 細馬 慎平, 下坂 正倫
スパース双線型逆強化学習による運転状況の多様性を考慮した運転行動モデリング
自動車技術会2020 年秋季大会学術講演会講演予稿集.