タスク固有のポリシーおよび共有ポリシーをもつマルチタスクニューラルネットワークシステム

Title:

タスク固有のポリシーおよび共有ポリシーをもつマルチタスクニューラルネットワークシステム

Document Type and Number:

Japanese Patent JP2020521205

Kind Code:

A

Abstract:

マルチタスクニューラルネットワークシステムなどのマルチタスクコンピュータシステムを訓練するための方法が提案される。システムは、訓練可能なワーカのセットと、共有モジュールとを含む。訓練可能なワーカおよび共有モジュールは、複数の異なるタスク上で訓練され、各ワーカがそれぞれのタスクポリシーに従ってタスクの対応する1つを行うことを学習し、共有ポリシーネットワークがタスクに対する共通の行動を表すマルチタスクポリシーを学習するようにする。協調訓練は、タスクごとに、タスクポリシーに従って対応するタスクを行う際にワーカによって得られる期待報酬を示す報酬項と、タスクポリシーの分布をマルチタスクポリシーの分布に向かって正則化する少なくとも1つのエントロピー項とを含む目的関数を最適化することによって行われる。

Inventors:

Razban Pashkanu
Lia Thais Hadsel
Victor Constant Baptist
Voichev Chalnecchi
James Kirkpatrick
E we te
Nicholas Manfred Otto Heath

Application Number:

JP2019559288A

Publication Date:

July 16, 2020

Filing Date:

May 22, 2018

Export Citation:

Click for automatic bibliography generation Help

Assignee:

Deep Mind Technologies Limited

International Classes:

G06N3/08; G06N3/063

Domestic Patent References:

JP2013106202A	2013-05-30
JP2009288934A	2009-12-10

Other References:

山口智浩: "強化信号のコミュニケーションに基づくマルチエージェント強化学習", 電子情報通信学会技術研究報告, vol. 100, no. 199, JPN6021004580, 12 July 2000 (2000-07-12), JP, pages 39 - 46, ISSN: 0004444235
MING TAN: "Multi-Agent Reinforcement Learning: Independent vs. Cooperative Agents", THE 10TH INTERNATIONAL CONFERENCE ON MACHINE LEARNING (10TH ICML 1993), JPN6021004583, 27 June 1993 (1993-06-27), US, pages 330 - 337, ISSN: 0004444236

Attorney, Agent or Firm:

Yasuhiko Murayama
Shinya Mitsuhiro
Tatsuhiko Abe

Previous Patent: 知能感知装置及び感知システム

Next Patent: ＤｉｓｃｏｖｅｒｙａｎｄＬａｕｎｃｈプロトコルを使用するモバイル�...