2023年6月28日-7月1日にロボティクス・メカトロニクス講演会2023が名古屋国際会議場で開催されます.
我々は本講演会にて,以下の3本の論文の発表を行います.
1. 危険行動の時間的局所性に着目した負例導入逆強化学習の安定化
近年の日本では,高齢者の関わる交通事故数が著しく増加している.ヒューマンエラーによる交通事故の抑制に貢献する逆強化学習が注目されている.正例と負例の両方を学習に用いることにより,安全な運転行動を模倣し,危険な運転行動を防止できる.しかしながら,先行研究には正例と負例の間のデータコンフリクトが存在し,学習が不安定になる原因となっている.
本研究は負例の時間的局所性に着目した制約条件を逆強化学習の最適化問題に導入している.評価結果より,本研究は正例と負例間のコンフリクトを解消することにより,先行研究よりも学習の収束が早いことに加え,正例と負例の割合に対する報酬場のロバスト性が向上していることを示している.
2. Improved Template-Based RRT for Efficient Kinodynamic Motion Planning
モーションプランニングは古くから研究されている課題であるが,走行車両のような運動制約を考慮した高速なパス生成法については,未だ重要な研究課題として位置づけられている.本研究では運動制約を単純な方法で満たす枠組みとして,モーションテンプレートを用いたRRTベースの生成手法について論じる.従来のテンプレートベースRRTは単純なアプローチで実装が可能な一方で,安直なRRTの枠組みに基づくものであり,パスの改善についてはノード数を増やす以外手立てがないことが問題である.
本研究では,テンプレートに基づいたRRTに「再配線」する枠組みを導入し,効率的なパスの改善を狙う.人工環境での実験により,提案手法がベースラインを上回り,より良い解を短時間で見つけることができることを示す.
3. 車両軌跡情報を用いたニューラル常微分方程式に基づく高速道路の所要時間予測
高速道路では利用者の利便性向上のため,渋滞を含む状況での所要時間予測が盛んに研究されている.従来の研究では交通速度場の時空間データを入力にし,直近の時空間速度場を推定し,その情報を元に所要時間を予測する枠組みが数多く提案されている. これらの研究では,車両検知器のような環境に設置したセンシングにより得られることが多いが,その値にバイアスが生じる場合,推定された速度場を元にした積分値(予測所要時間)も結果としてバイアスが生じる問題がある.
本研究では既存の枠組みと異なり,トリップタイムを直接的に用い,バイアス解消が保証される枠組を提案する.任意の2点間の所要時間予測のための予測器を構築するには,安直なトリップタイムを出力とする回帰では実現が困難であり,本研究では,予測した速度場を用いた積分:所要時間と実際の所要時間の誤差を最小化できるニューラルODE手法を提案する.車両軌跡データの一種であるETC2.0プローブデータを用いた実験により,提案手法の優位性と学習の安定性を示す.
発表情報(ROBOMECH2023 スケジュール)
———-
日時:2023年6月29日(木) 13:30 – 15:00
セッション:1P1-G12:進化・学習とロボティクス
論文タイトル:危険行動の時間的局所性に着目した負例導入逆強化学習の安定化
著者:趙茗璐,羊少宇,下坂正倫(東工大)
日時:2023年6月30日(金) 9:00 – 10:30
セッション:2A1-D18:動作計画と制御の新展開(1)
論文タイトル:Improved Template-Based RRT for Efficient Kinodynamic Motion Planning
著者:Shaoyu Yang, Minglu Zhao, Masamichi Shimosaka (Tokyo Tech)
日時:2023年6月30日(金) 11:00 – 12:30
セッション:2A2-D06:交通・物流のロボティクスとITS(2)
論文タイトル:車両軌跡情報を用いたニューラル常微分方程式に基づく高速道路の所要時間予測
著者:高澤寛治,羊少宇,白冰(東工大),亀岡弘之(中日本高速道路株式会社),刑健 (株式会社高速道路総合技術研究所),下坂正倫 (東工大)
———-