Satoshi Yamada
強化学習は制御結果の良否だけを用いて制御を学習する自律的な学習法です。前提知識が必要ありませんので、幅広い制御に適用できる可能性があります。人間の名人を破って話題になったAlphaGoは強化学習と深層学習の組み合わせである深層強化学習で囲碁の戦い方を学習しました。深層強化学習をロボット制御に適用することを研究しています。また、各課題に適したネットワーク構造を自律的に獲得できるINGnetを用いた学習法で、色々な制御を学習できました。また、困難な制御課題を学習するための段階的学習法やひとまとまりの動きである複合行動を用いた学習法も研究しています。段階的学習法や複合行動を深層強化学習と組み合わせ、実用的な制御課題の学習に取り組んでいます。
また、別の研究として、細胞内の反応系のモデル化に取り組んでいます。シグナル伝達系は体の中の調節を司る反応系です。その破綻によって多数の疾患が引き起こされます。医学部の研究者と共同で、疾患の発症を模擬するモデルに取り組み、疾患発症メカニズムの解明を行っています。慢性炎症は様々な疾患に関係する現象です。慢性炎症に関係する疾患である、リウマチ、多発性硬化症、動脈硬化の発症メカニズムのモデル化を研究しています。
専門分野
キーワード
シミュレーション環境で、小型移動ロボット(上図右下)の移動制御や車やトレーラー付きトラックの駐車制御の学習を行いました。この図は、学習されたロボットの動きを示す図です。特定の物体に近づいたり、指定の場所に駐車したりすることができています。
シグナル伝達系のモデル化の研究のモデルとシミュレーション結果を示す図です。
このモデルは成長因子が作用するシグナル伝達系のモデルです。
このシグナル伝達系に異常が生じると癌になります。
このモデルにより上皮成長因子と線維芽細胞成長因子の作用の違いが解明されました。
岡山理科大学情報理工学部
情報理工学科