第22回 計測自動制御学会 システムインテグレーション部門講演会 が, 昨年12月,オンラインで開催されました.アナウンスが遅くなりましたが,研究室からは以下の発表を行いました.
逆強化学習を用いてドライバーの走行データから望ましい運転行動の評価関数を獲得するアプローチが注目されています.
逆強化学習ベースの運転行動モデリング手法の課題としては報酬関数を表現する特徴量の候補を事前に与える必要が点が挙げられます.先行研究では,障害物との車間距離や車両速度などの変数の関数として特徴量設計を人手で実施することが提案されていますが,考慮する変数が増加した場合に特徴量設計が困難になるという課題があります.
ナイーブな解決策としては考慮可能な全ての特徴量に対して重みを与え,学習の過程でそれらの重みを調節することが考えられますが,パラメタ数が必要以上に増大してしまうという課題があります.パラメタ数の増大は過学習や推論環境の計算資源の圧迫をもたらすため,コンパクトかつ高性能なモデルを実現するための手法が必要となります.
そこで本研究では,前向き特徴量探索と過去に学習した重みを含めた特徴量重みの最適化を交互実行することにより,特徴量設計の自動化しつつ,モデルのコンパクトさと高い推論性能を両立可能な学習アルゴリズムを提案しました.
この手法では,通常の勾配ブースティングベースの手法とは異なり,過去に学習した特徴量の重みを後方修正する仕組みを備えているため,特徴量数当たりの学習効率を改善することが可能となります.
都内の生活道路において収集した熟練ドライバーの走行データを用いた性能比較実験においては,提案手法は25次元の特徴量で手動設計した137次元の特徴量に基づくモデルと同等の推論性能を達成しており,提案手法の有用性を定量的に示しました.
発表情報
———-
2021/12/16 13:40 – 13:55
論文タイトル:特徴量探索とパラメータ最適化の交互実行によるコンパクトな運転行動推定モデル
著者:平川 優伎(東京工業大学),下坂 正倫(東京工業大学)
———-