Title:
サブワードエンドツーエンド自動音声認識のための学習ワードレベルコンフィデンス
Document Type and Number:
Japanese Patent JP7436760
Kind Code:
B1
Abstract:
方法(500)は、音声認識結果(232)を受け取るステップと、コンフィデンス予測モジュール(CEM: confidence estimation module)(300)を使用して、音声認識結果に対する仮説サブワードユニットのシーケンス中のサブワードユニット毎に、それぞれのコンフィデンス埋込み(242)を獲得するステップと、第1のアテンション機構(310)を使用してコンフィデンス特徴ベクトル(312)を生成するステップと、第2のアテンション機構(320)を使用して音響文脈ベクトル(332)を生成するステップと、CEMの出力層(340)からの出力として、対応するサブワードユニット毎にそれぞれのコンフィデンス出力スコア(302)を生成するステップとを含む。方法は、仮説サブワードユニットのシーケンスによって形成される1つまたは複数のワードの各々毎に、ワードのためのそれぞれのワードレベルコンフィデンススコアを決定するステップをも含む。方法は、ワードレベルコンフィデンススコアを集約することによって発声レベルコンフィデンススコア(350)を決定するステップをも含む。
More Like This:
Inventors:
David Chiu
Chiujia Li
Yangjang Hae
Yoo Jiang
Bo Li
Lianlian Cao
Rohit Prabhavalkar
Deep Tea Batia
Way re
Ke Hu
Tara Sainas
Ian McGraw
Chiujia Li
Yangjang Hae
Yoo Jiang
Bo Li
Lianlian Cao
Rohit Prabhavalkar
Deep Tea Batia
Way re
Ke Hu
Tara Sainas
Ian McGraw
Application Number:
JP2023550664A
Publication Date:
February 22, 2024
Filing Date:
February 23, 2022
Export Citation:
Assignee:
Google LLC
International Classes:
G10L15/18; G10L15/16; G10L15/187; G10L15/30; G10L15/32
Domestic Patent References:
JP2009116107A |
Foreign References:
US20210020175 |
Attorney, Agent or Firm:
Yasuhiko Murayama
Shinya Mihiro
Tatsuhiko Abe
Shinya Mihiro
Tatsuhiko Abe