抖阴旅行射

本文へ ナビゲーションへ
ここから本文です

深層強化学習による運動学習過程におけるシナジー発現プロセスの存在を実証 ー運動学習メカニズムの解明に貢献ー

【発表のポイント】

  • 深层强化学习による运动学习タスクにおいて运动シナジーの発现プロセスが起きていることを初めて定量的に示した。
  • 运动シナジーの発现度合いが运动学习の习熟度と连动しており、特にエネルギーあたりの运动パフォーマンスと高い相関があることを示した。
  • 人间の运动学习プロセスと関连のある运动シナジーが、深层强化学习でも発现していることから、人间や生物の运动学习メカニズムの理解にもつながる。

【概要】

東北大学大学院工学研究科の林部充宏教授とJiazheng Chai大学院生らの研究グループは、深層強化学習※1による运动学习过程において运动シナジー※2の発现プロセスが起きていることを初めて定量的に示しました。深层强化学习アルゴリズムを用いた报酬※3では运动パフォーマンスとエネルギーを考虑しただけで、シナジーについては何も指定していないにもかかわらず、运动习熟レベルが进むほど运动シナジー强度も増大しました。また运动シナジー発现が特にエネルギーあたりの运动パフォーマンスと高い相関があることを示しました。运动学习过程で潜在的に起きている现象との関连性が期待されるため、人间や生物の运动学习メカニズムの理解にもつながると期待されます。

本研究成果は、ロボット分野で最もメジャーな国際会議IEEE ICRA2020のJournal Optionとして採択され、科学雑誌「IEEE Robotics and Automation Letters」に2020年1月22日付けで掲載されました。

図1深层强化学习による歩行タスクを行いながら时空间シナジーを算出する模式図

【用语解説】

注1: 深層強化学習
深层学习(ディープラーニング)とは、生物の神経回路を模拟する多层ニューラルネットワークによる机械学习手法で、深层强化学习は一连の行动を通じて报酬が最も多く得られるような方策を学习する最近注目されている础滨计算手法です。

注2: 運動シナジー
运动が时空间的にある一定の组み合わせで协调的に制御されているという考え方で、人间や生物の运动にはこの协调构造が採用されていると考えられています。

注3: 報酬
强化学习の枠组みで用いられる计算指针のようなもので、础滨が导いた结果の评価として得られるのが报酬です。

详细(プレスリリース本文)PDF

问い合わせ先

(研究に関して)
东北大学大学院工学研究科 ロボティクス専攻
教授 林部 充宏
電話 022-795- 6970
E-mail: mitsuhiro.hayashibe.e6*tohoku.ac.jp(*を@に置き換えてください)

(报道に関して)
東北大学工学研究科情報広報室 担当 沼澤 みどり
TEL: 022-795-5898
E-mail: eng-pr*grp.tohoku.ac.jp(*を@に置き換えてください)