Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
タスク固有のポリシーおよび共有ポリシーをもつマルチタスクニューラルネットワークシステム
Document Type and Number:
Japanese Patent JP2020521205
Kind Code:
A
Abstract:
マルチタスクニューラルネットワークシステムなどのマルチタスクコンピュータシステムを訓練するための方法が提案される。システムは、訓練可能なワーカのセットと、共有モジュールとを含む。訓練可能なワーカおよび共有モジュールは、複数の異なるタスク上で訓練され、各ワーカがそれぞれのタスクポリシーに従ってタスクの対応する1つを行うことを学習し、共有ポリシーネットワークがタスクに対する共通の行動を表すマルチタスクポリシーを学習するようにする。協調訓練は、タスクごとに、タスクポリシーに従って対応するタスクを行う際にワーカによって得られる期待報酬を示す報酬項と、タスクポリシーの分布をマルチタスクポリシーの分布に向かって正則化する少なくとも1つのエントロピー項とを含む目的関数を最適化することによって行われる。

Inventors:
Razban Pashkanu
Lia Thais Hadsel
Victor Constant Baptist
Voichev Chalnecchi
James Kirkpatrick
E we te
Nicholas Manfred Otto Heath
Application Number:
JP2019559288A
Publication Date:
July 16, 2020
Filing Date:
May 22, 2018
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
Deep Mind Technologies Limited
International Classes:
G06N3/08; G06N3/063
Domestic Patent References:
JP2013106202A2013-05-30
JP2009288934A2009-12-10
Other References:
山口智浩: "強化信号のコミュニケーションに基づくマルチエージェント強化学習", 電子情報通信学会技術研究報告, vol. 100, no. 199, JPN6021004580, 12 July 2000 (2000-07-12), JP, pages 39 - 46, ISSN: 0004444235
MING TAN: "Multi-Agent Reinforcement Learning: Independent vs. Cooperative Agents", THE 10TH INTERNATIONAL CONFERENCE ON MACHINE LEARNING (10TH ICML 1993), JPN6021004583, 27 June 1993 (1993-06-27), US, pages 330 - 337, ISSN: 0004444236
Attorney, Agent or Firm:
Yasuhiko Murayama
Shinya Mitsuhiro
Tatsuhiko Abe