大学院理工学府生が電気学会より「電気学会優秀論文発表賞」を受賞
受賞情報

賞状

メダル
大学院理工学府博士課程前期 2年の山下廣大さん(指導教員:濱上知樹 教授)が、2020年度電気学会システム・制御 合同研究会にて発表した題目について、2021年 9月 16日、電気学会より優秀論文発表賞 A( IEEJ Excellent Presentation Award )を受賞しました。
受賞題目は、「エキスパート群から方策推定を行う敵対的逆強化学習」です。
この発表では、強化学習の報酬設計を学習する「逆強化学習」の新たな手法を提案しました。複数のエキスパートから逆強化学習を行う InfoGAIL において、環境が変化した場合にも追従できる手法として、その Discriminator の構造と目的関数を AIRL(Adversarial Inverse Reinforcement Learning)により置き換えることで複数のエキスパートから報酬関数の推定が可能な手法を開発しました。本手法により、個々のエキスパートを潜在変数に割り当て識別して模倣が可能なこと、エキスパートとして与えてはいない方策についても推定可能になることを、経路探索タスクを通じて示しました。