Saturday, 2025/05/31

  • 東京工業大学
  • 情報理工学院
  • 情報工学系
  • 東京工業大学
  • 情報理工学院
  • 情報工学系
  • Switch Language
    • ja日本語
    • enEnglish (英語)

下坂研究室

Shimosaka Research Group pursuing MIUBIQ (machine intelligence in UbiComp Research)

  • ホーム
    • メンバー
    • 所在地
  • ニュース
  • プロジェクト
  • 発表論文
  • 受賞
  • アーカイブ
    • コード
    • データセット
Navigation
  • ホーム
    • メンバー
    • 所在地
  • ニュース
  • プロジェクト
  • 発表論文
  • 受賞
  • アーカイブ
    • コード
    • データセット
  • プロジェクト 危険行動の時間的局所性に着目した負例導入逆強化学習の安定化

    危険行動の時間的局所性に着目した負例導入逆強化学習の安定化

    2023/09/14 | プロジェクト | 652 views |

    近年,人為的ミスに起因する交通事故の抑制につながる自動運転システムが注目されています.自動運転の鍵となるのは,ドライバーの意思決定を自動化することです.特に,複雑な運転行動を人が書き下したルールで定義することは困難であるため,データから最適な行動規範をモデリングできる逆強化学習への期待が高まっています.

    これまでの取り組みでは,安全な行動データ(正例)と危険な行動データ(負例)を用いて,交通事故を避けるための意思決定を模倣することを目的とした逆強化学習手法が提案されています.しかしながら,運転行動に限れば,危険な行動データの中の行動が常に危険とは限りません.例えば,障害物にぶつかる行動は危険ですが,それに至るまでの一連の行動の全ては必ずしも危険ではありません.すなわち,行動が常に安全な正例と行動のごく一部の時間のみが危険な負例の間にコンフリクトが存在し,このコンフリクトは学習の収束を遅める問題を引き起こします.

    本プロジェクトでは,この課題に取り組み,危険行動のごく一部の時間のみを負例として扱い,大半は正例として扱うべきであることに着目し,危険行動の時間的局所性に着目した負例導入逆強化学習を提案しました.この提案手法では,危険行動の時間的パターンを時系列正負ラベルとして捉え,これを従来の逆強化学習の枠組みに組み込みました.

    障害物回避シナリオにおける実験により,提案手法が既存の方法よりも正確に障害物を回避できることが確認されました.また,提案手法による正例と負例間のコンフリクトを解消することにより,学習の収束が速くなるだけでなく,正例と負例の比率によらず安定して最適報酬が得られることも示しました.

    —– 発表論文 —–
    趙 茗璐, 羊 少宇, 下坂 正倫. 危険行動の時間的局所性に着目した負例導入逆強化学習の安定化. ロボティクス・メカトロニクス講演会2023 講演論文集 (Robomech2023), 名古屋, 6 2023.

    • tweet

    Comments are disabled for this post

    Social Networks

    • twitter
    • rss

    Recent News

    • 情報処理学会第84回UBI研究会で発表した論文が優秀論文賞を受賞しました 2025/03/05
    • LLMによるシーン中の物体の形容記述を用いた景観画像の印象予測 2025/03/04
    • 情報処理学会第87回全国大会にて研究室学生が受賞した山下記念研究賞の授賞式が行われます 2025/03/04
    • PerCom2025にて,周期的なUWBチャネルインパルス応答からのデバイスフリー行動認識について発表します 2025/02/15
    • 情報処理学会UBI研究会第85回研究発表会にて複数SISO Wi-Fiチップを用いたAoA推定,複合ウェアラブルセンサによる物体操作認識の検討 ,に関して2本の論文について発表します 2025/02/15
    • UBIシンポジウム2025にて都市動態予測に関するポスター発表を行います 2025/02/14
    • 訪問者の興味関心に基づいた大学の雰囲気分析についてIEEE Big Data 2024にて発表を行います 2024/12/13
    • 情報処理学会UBI研究会第84回研究発表会にて形容記述を用いた景観画像の印象予測に関する論文を発表します 2024/11/18
    • GPSログ・乗換検索履歴を活用した群衆混雑の予報に関する論文が 鉄道サイバネ・シンポジウムにて学生優秀論文賞を受賞しました 2024/11/18
    • 高精度な屋内測位のためのBLEビーコンの逐次的な配置最適化についてIPIN2024にて発表しました 2024/10/23

    Search

    Copyright 2015 · Shimosaka Research Group at TITECH