Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
画像データを自然言語の説明に変換するためのシステム及び方法
Document Type and Number:
Japanese Patent JP2022510282
Kind Code:
A
Abstract:
【解決手段】コンピュータゲーム画像または他の画像などの画像のキャプショニングに対し、ボトムアップ注意(400)をトップダウン注意(402)と結合して、マルチレベルの残差注意ベースの画像キャプショニングモデルを提供する。残差注意メカニズム(500)がFaster R-CNNネットワークに最初に適用されて、空間的情報を考慮に入れることによってより良い特徴表現を各領域について学習する。画像キャプショニングネットワークでは、抽出された領域特徴を入力として受け取って、後続のキャプション生成のために領域特徴を注意深く融合させるように第2の残差注意ネットワーク(1204)が実装される。【選択図】図1

Inventors:
Zen, Jen
Chen, Ruthin
Application Number:
JP2021530948A
Publication Date:
January 26, 2022
Filing Date:
November 26, 2019
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
Sony Interactive Entertainment Inc.
International Classes:
G06T7/00; G06V10/764
Domestic Patent References:
JP2019537147A2019-12-19
JP2020533696A2020-11-19
Foreign References:
US20180121734A12018-05-03
Attorney, Agent or Firm:
Morishita Kenki