2024年 | プレスリリース?研究成果
「好奇心」によって性能を改善した対話型AIを開発 - 次世代タスク指向対話システムの高度化に貢献 -
【本学研究者情报】
〇大学院工学研究科 教授 伊藤彰则
【発表のポイント】
- チケット予约など、人から頼まれたタスクを遂行するためのシステムをより贤くする対话型人工知能(础滨)(注1)の新しい手法を开発しました。
- 础滨自体がシステムの学习时に报酬を受け取り、新しい状况を探求するための「好奇心」を持つことで、より効率的な対话が可能になります。
- 复数の础滨学习者(エージェント)を竞合させ、最も优れたエージェントを选び出すことで、対话の成功率を向上させました。
【概要】
颁丑补迟骋笔罢などに代表される、自然言语を使う対话型础滨技术は、ここ数年で剧的に発展し、チャットボットをはじめとした様々なシステムに活用されるなど、日常のタスクの自动化や効率化が进んでいます。しかし、现状の対话型础滨は、タスク达成に不要な质问をしてしまうなど、必ずしもタスク达成の効率が十分ではありませんでした。
東北大学大学院工学研究科の牛雪澄大学院生と伊藤彰则教授らの研究チームは、映画のチケット予約などのタスクを効率的に行うための新しい対話システムを開発しました。このシステムは、AIがユーザと対話しながら、適切な行動を学習する技術を使っています。
対话システムが适切に行动するためのシステム开発手法に、将棋や囲碁の础滨にも使われている强化学习(注2)があります。今回の研究では、强化学习に「好奇心駆动型の探索方法」を导入しました。さらに、强化学习を行う础滨エージェント(注3)を复数竞合させ、もっとも适切に振る舞うことのできたエージェントを选别することで、対话によるタスク达成の成功率を向上させ、また达成までの対话回数を减らすことに成功しました。
本研究の内容は、9月17日に、米国電気電子学会(IEEE)の学術誌「IEEE Access」に掲載されました。
図1. 様々な対話システムの性能比較(強化学習の一種であるQ学習の派生であるDQN(Deep Q-Network) 、DDQ(Deep Dyna-Q)など多数の学習法と比較)。横軸はタスク達成のための平均ターン数(システムとのやり取りの数、小さい方が良い)、縦軸は平均タスク達成率(大きい方が良い)。本研究の提案法(RCC-DDQ:好奇心駆動型の探索方法)は、少ないターン数で高いタスク達成率を得ることができた。
【用语解説】
注1. 対話型人工知能(AI):人間同士は、言葉で対話をしながら仕事を進めたり、あるいは楽しんだりします。それと同様に、言葉によって人間と様々なやり取りをするためのAIが対話型AIです。電話応答のオペレーターの代替やヘルスケアといった実用的な分野から、エンターテインメント分野まで、様々な応用があります。
注2. 強化学習:強化学習(Reinforcement Learning)は、人工知能(AI)の一分野で、エージェント(学習者)が環境と相互作用しながら最適な行動を学習する方法です。エージェントは行動を選択し、その結果として報酬(または罰)を受け取ります。このプロセスを繰り返すことで、エージェントはどの行動が最も良い結果をもたらすかを学習します。強化学習は、ゲームのAI、自動運転車、ロボット制御、金融取引など、さまざまな分野で応用されています。エージェントが環境との相互作用を通じて、複雑なタスクを効率的に解決できるようにします。
注3. エージェント:強化学習におけるエージェントは、環境と相互作用しながら最適な行動を学習する主体です。エージェントは行動を選択し、その結果として得られる報酬を基に学習を進めます。例えば、迷路を解くロボットでは、ロボットがエージェントであり、環境(迷路)の中を動き回りながら、最適な脱出方法を試行錯誤によって学習します。同様に、本研究でのエージェントは、ユーザと対話をしながら、ユーザの要求を最も効率的に満たす対話方法を試行錯誤によって学習します。
【论文情报】
タイトル:A replaceable curiosity-driven candidate agent exploration approach for task-oriented dialog policy learning
著者:Xuecheng Niu, Akinori Ito, Takashi Nose
*責任著者:東北大学大学院工学研究科 大学院生 牛 雪澄
掲載誌:IEEE Access
顿翱滨:
问い合わせ先
(研究に関すること)
东北大学大学院工学研究科通信工学専攻
教授 伊藤 彰則
TEL: 022-795-7084
Email: aito.spcom*tohoku.ac.jp
(*を蔼に置き换えてください)
(报道に関すること)
东北大学大学院工学研究科情报広报室
担当 沼泽 みどり
TEL: 022-795-5898
Email: eng-pr*grp.tohoku.ac.jp
(*を蔼に置き换えてください)