Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
音声認識方法、装置及びコンピュータプログラム
Document Type and Number:
Japanese Patent JP2022551068
Kind Code:
A
Abstract:
本出願は、音声認識方法、装置及びコンピュータ可読記憶媒体に関し、方法は、音声分離強化モデルの第1の損失関数と音声認識モデルの第2の損失関数を取得するステップ(S202)と、第2の損失関数に基づいてバックプロパゲーションを実行して、音声分離強化モデルと音声認識モデルの間にブリッジされた中間モデルをトレーニングし、ロバスト特徴付けモデルを取得するステップ(S204)と、第1の損失関数と第2の損失関数を融合して、ターゲット損失関数を取得するステップ(S206)と、ターゲット損失関数に基づいて、音声分離強化モデル、ロバスト特徴付けモデル、及び音声認識モデルを共同でトレーニングし、予め設定された収束条件を満たすと、トレーニングを終了するステップ(S208)と、を含む。

Inventors:
王 ▲ジュン▼
林 永▲業▼
Application Number:
JP2022520112A
Publication Date:
December 07, 2022
Filing Date:
November 12, 2020
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
TENCENT TECHNOLOGY(SHENZHEN)COMPANY LIMITED
International Classes:
G10L15/06; G10L15/065; G10L15/16; G10L15/20
Domestic Patent References:
JP2019078857A2019-05-23
Foreign References:
WO2019198265A12019-10-17
US20180053087A12018-02-22
US20190043516A12019-02-07
Other References:
MAX W.Y.LAM ET. AL.: "Extract, Adapt and Recognize: an End-to-end Neural Network for Corrupted Monaural Speech Recognition", INTERSPEECH 2019, JPN6022055379, 15 September 2019 (2019-09-15), pages 2778 - 2782, XP055958776, ISSN: 0004956204, DOI: 10.21437/Interspeech.2019-1626
Attorney, Agent or Firm:
Shinya Mihiro
Naoki Matsuo