Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
AUDIO SYNTHESIS DEVICE, AUDIO SYNTHESIS METHOD, AND AUDIO SYNTHESIS PROGRAM
Document Type and Number:
WIPO Patent Application WO/2009/069596
Kind Code:
A1
Abstract:
It is possible to provide an audio synthesis device, an audio synthesis method, and an audio synthesis program which can improve an audio quality and reduce a calculation amount with a preferable balance between them. The audio synthesis device includes: a sub-score calculation unit (60/65) which calculates an element selection sub score for selecting an optimal element; and a candidate narrowing unit (70/73) for narrowing the candidates according to the number of the candidate elements and the element selection sub score. The audio synthesis device performs candidate narrowing by the sub score calculation unit (60/65) and the candidate narrowing unit (70/73) in the candidate selection process when generating a synthesized audio from an input text.

Inventors:
KATO MASANORI (JP)
MITSUI YASUYUKI (JP)
KONDO REISHI (JP)
Application Number:
PCT/JP2008/071351
Publication Date:
June 04, 2009
Filing Date:
November 25, 2008
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
NEC CORP (JP)
KATO MASANORI (JP)
MITSUI YASUYUKI (JP)
KONDO REISHI (JP)
International Classes:
G10L13/07
Foreign References:
JP2007233216A2007-09-13
JP2008249808A2008-10-16
JP2005265895A2005-09-29
JP2005241789A2005-09-08
JP2004109535A2004-04-08
Attorney, Agent or Firm:
KATO, Asamichi (20-12 Shin-Yokohama 3-chome Kohoku-ku, Yokohama-sh, Kanagawa 33, JP)
Download PDF:
Claims:
 最適素片を選択するための素片選択サブスコアを計算するサブスコア計算部と、
 候補素片の数と、前記素片選択サブスコアと、を基に候補絞込みを行う候補絞込み部と、を備えることを特徴とする音声合成装置。
 前記素片選択サブスコアは、
 単位サブスコア又は接続サブスコアのいずれか一方を含むことを特徴とする請求項1に記載の音声合成装置。
 前記候補絞込み部は、
 前記候補素片の数を基に閾値を求める閾値計算部を備え、
 前記閾値と前記素片選択サブスコアを基に候補絞込みを行うことを特徴とする請求項1又は2に記載の音声合成装置。
 前記閾値計算部は、
 前記候補素片の数が多い場合に、前記候補素片の数が少ない場合の閾値より大きな閾値を求めることを特徴とする請求項3に記載の音声合成装置。
 前記閾値計算部は、
 素片選択サブスコアを用いて閾値を求めることを特徴とする請求項3又は4に記載の音声合成装置。
 前記閾値計算部は、
 最適素片の素片選択サブスコアの統計量に基づいて閾値を求めることを特徴とする請求項3乃至5いずれか一に記載の音声合成装置。
 前記候補絞込み部の前段に、
 候補素片の数を基に重み関数を選択する重み関数選択部と、
 前記重み関数と前記素片選択スコアを基に前記素片選択スコアを重み付けする重み付け部とが配置され、
 前記候補絞込み部は、
 前記重み付けされた素片選択スコアを基に候補絞込みを行うことを特徴とする請求項1乃至6いずれか一に記載の音声合成装置。
 入力テキストから合成音声を生成する音声合成装置における音声合成方法であって、
 最適素片の選択過程において、
 最適素片を選択するための素片選択サブスコアを計算し、
 候補素片の数と、前記素片選択サブスコアと、を基に候補を絞込む工程を含むこと、
を特徴とする音声合成方法。
 前記素片選択サブスコアは、
 単位サブスコア又は接続サブスコアのいずれか一方を含むことを特徴とする請求項8に記載の音声合成方法。
 前記候補の絞込みは、
 前記候補素片の数を基に求められた閾値と前記素片選択サブスコアを基に行われることを特徴とする請求項8又は9に記載の音声合成方法。
 前記候補素片の数が多い場合に、前記候補素片の数が少ない場合の閾値より大きな値が適用されることを特徴とする請求項10に記載の音声合成方法。
 素片選択サブスコアを用いて前記閾値を求めることを特徴とする請求項10又は11に記載の音声合成方法。
 前記閾値計算部は、
 最適素片の素片選択サブスコアの統計量に基づいて閾値を求めることを特徴とする請求項10乃至12いずれか一に記載の音声合成方法。
 前記候補絞込みの前に、
 候補素片の数を基に重み関数の選択と、前記重み関数と前記素片選択スコアを基に前記素片選択スコアの重み付けと、を実行し、
 前記重み付けされた素片選択スコアを基に候補絞込みを行うことを特徴とする請求項8乃至13いずれか一に記載の音声合成方法。
 入力テキストから合成音声を生成する際の最適素片の選択過程において、
 最適素片を選択するための素片選択サブスコアを計算する処理と、
 候補素片の数と、最適素片を選択する際の素片選択サブスコアと、を基に候補絞込みを行う候補絞込み処理と、を、入力テキストから合成音声を生成する音声合成装置を構成するコンピュータに実行させるプログラム。
 前記素片選択サブスコアは、
 単位サブスコア又は接続サブスコアのいずれか一方を含むことを特徴とする請求項15に記載のプログラム。
 前記候補素片の数を基に閾値を求める閾値計算処理を前記コンピュータに実行させ、
 前記候補絞込み処理は、
 前記閾値と前記素片選択サブスコアを基に候補絞込みを行うことを特徴とする請求項15又は16に記載のプログラム。
 前記閾値計算処理は、
 前記候補素片の数が多い場合に、前記候補素片の数が少ない場合の閾値より大きな閾値を求めることを特徴とする請求項17に記載のプログラム。
 前記閾値計算処理は、
 素片選択サブスコアを用いて閾値を求めることを特徴とする請求項17又は18に記載のプログラム。
 前記閾値計算処理は、
 最適素片の素片選択サブスコアの統計量に基づいて閾値を求めることを特徴とする請求項17乃至19いずれか一に記載のプログラム。
 前記候補絞込み処理の前に、
 候補素片の数を基に重み関数を選択する重み関数選択処理と、
 前記重み関数と前記素片選択スコアを基に前記素片選択スコアを重み付けする重み付け処理とを実行させ、
 前記候補絞込み処理は、
 前記重み付けされた素片選択スコアを基に候補絞込みを行うことを特徴とする請求項15乃至20いずれか一に記載のプログラム。
Description:
音声合成装置、音声合成方法及 音声合成プログラム

 (関連出願についての記載)
 本願は、先の日本特許出願2007-307507号(2007年 11月28日出願)の優先権を主張するものであり 前記先の出願の全記載内容は、本書に引用 もって繰込み記載されているものとみなさ る。
 本発明は、音声合成装置、音声合成方法及 音声合成プログラムに関し、特に、テキス から音声を合成するための音声合成装置、 声合成方法及び音声合成プログラムに関す 。

 従来から、テキスト文を解析し、その文 示す音声情報から規則合成により合成音声 生成する音声合成装置が、種々開発されて た。図25は、一般的な規則合成型の音声合 装置の構成を示したブロック図である。こ ような構成を有する音声合成装置の構成と 作の詳細については、例えば非特許文献1乃 3と、特許文献1及び2に記載されている。

 図25に示した音声合成装置は、言語処理 X1と、韻律生成部X2と、単位スコア計算部X11 接続スコア計算部X13と最適素片検索部X14を する素片選択部X3と、素片情報記憶部X4と、 波形生成部X5とを備えている。素片情報記憶 X4は、音声合成単位ごとに生成された音声 片と、各音声素片の属性情報を記憶してい 。ここで、音声素片とは、合成音声の波形 生成するために使われる情報で、収録され 自然音声波形から抽出されることが多い。 声素片の例としては、合成単位毎に切り出 れた音声波形そのものや、線形予測分析パ メータ、ケプストラム係数などが挙げられ 。また、音声素片の属性情報とは、各音声 片の抽出元である自然音声の音素環境や、 ッチ周波数、振幅、継続時間情報等の音韻 報や韻律情報のことである。音声合成単位 しては、音素、CV、CVC、VCV(Vは母音、Cは子音 )などが用いられることが多い。この音声素 の長さや合成単位の詳細については、非特 文献1と非特許文献3に記述されている。

 言語処理部X1は、入力されたテキスト文 対して形態素解析や構文解析、読み付け等 分析を行い、音素記号などの「読み」を表 記号列と、形態素の品詞、活用、アクセン 型などを言語処理結果として韻律生成部X2と 素片選択部X3に出力する。

 韻律生成部X2は、言語処理部X1から出力さ れた言語処理結果を基に、合成音声の韻律情 報(ピッチ、時間長、パワーなどに関する情 )を生成し、素片選択部X3と波形生成部X5に出 力する。素片選択部X3は、言語処理結果と生 された韻律情報に関して適合度が高い音声 片を、素片情報記憶部X4に記憶されている 声素片の中から選択し、選択した音声素片 付属情報と併せて波形生成部X5に出力する。 波形生成部X5は、選択された音声素片から、 律生成部X2で生成した韻律に近い韻律を有 る波形を生成し、それらの波形を接続して 合成音声として出力する。

 素片選択部X3は、入力された言語処理結 と韻律情報から、目標合成音声の特徴を表 情報(以下、これを「目標素片環境」と呼ぶ )を所定の合成単位ごとに求める。目標素片 環境に含まれる情報には、該当・先行・後続 の各音素名、ストレスの有無、アクセント核 からの距離、合成単位のピッチ周波数やパワ ー、単位の継続時間長、ケプストラム、MFCC(M el Frequency Cepstral Coefficients)、及びこれらの 量(単位時間あたりの変化量)などが挙げられ る。次に、目標素片環境が与えられると、素 片選択部X3は、素片情報記憶部X4の中から目 素片環境により指定される特定の情報(主に 当音素)に合致する音声素片を複数選択する 。選択された音声素片は、合成に用いる音声 素片の候補となる。そして、選択された候補 素片に対して、合成に用いる音声素片として の適切度を示す指標である「スコア(又はコ ト)」を計算する。高音質な合成音声を生成 ることを目標としているため、スコアが高 (又はコストが小さい)、即ち適切度が高い 、合成音の音質は高くなる。従って、スコ は、合成音声の音質の劣化度を推定するた の指標であると言える。

 ここで、素片選択部X3で計算されるスコ には、単位スコアと接続スコアがある。単 スコアは、候補素片を目標素片環境の下で いることにより生じる推定音質劣化度を表 もので、候補素片の素片環境と目標素片環 との類似度を基に算出される。一方、接続 コアは、接続する音声素片間の素片環境が 連続であることによって生じる推定音質劣 度を表すもので、隣接候補素片同士の素片 境の親和度を基に算出される。この単位ス ア及び接続スコアの計算方法は、これまで 種提案されている。一般に、単位スコアの 算には、目標素片環境に含まれる情報が用 られ、接続スコアには、素片の接続境界に けるピッチ周波数、ケプストラム、MFCC、短 間自己相関、パワー、及びこれらの△量な が用いられる。以上の通り、単位スコア及 接続スコアは、素片に関する各種情報(ピッ チ周波数、ケプストラム、パワー等)を複数 いて算出される。

 図25の構成に即して説明を加えると、素 選択部X3は、単位スコア計算部X11及び接続ス コア計算部X13において単位スコアと接続スコ アを素片ごとに計算したのちに、接続スコア と単位スコアの両者が最大となる音声素片を 各合成単位に対して一意に求める。スコア最 大化により求めた素片を、候補素片の中から 音声の合成に最も適した素片として選択され たことから最適素片と呼ぶ。素片選択部X3は 最適素片検索部X14において全合成単位を対 にそれぞれの最適素片を求めると、最終的 最適素片の系列(最適素片系列)を素片選択 果として波形生成部X5に出力する。

 素片選択部X3では、最適素片系列を求め ために、最適候補の素片のすべてに対して 位スコア及び接続スコアを計算することに る。素片情報記憶部が保有する素片数、即 候補素片が多くなれば、これらのスコア計 に必要となる計算量が多くなり、結果とし テキストが入力されてから合成音声が生成 れるまでの処理速度が著しく低下する。従 て、単位スコア及び接続スコアの計算に必 な候補素片数を減らすことが、計算量削減 基本的手段であるが、素片数の削減方法を ると著しい音質劣化を引き起こすことにな 。そこで、著しい音質劣化を防ぎつつ素片 択処理の計算量を減らす方法が検討されて る。

 例えば、特許文献3では、素片情報記憶部 に記憶されている素片が音声合成時に使われ る頻度を調査し、使用頻度の低い素片を素片 情報記憶部から除外することで、音質への悪 影響を抑えつつ素片数を削減する方法が提案 されている。また、特許文献4では、単位サ コストが低い素片を候補対象から外し、す ての単位サブコスト及び接続コストを計算 る素片の数を削減することで、素片選択の 算量を削減する方法が提案されている。

特開2005-91551号公報

特開2006-84854号公報

特開2004-037605号公報

特開2005―265895号公報 Xuedong Huang,Alex Acero,Hsiao-wuen Hon:“Spoken  Language Processing”, Prentice Hall, pp.689-836,2001. 石川 泰、 “音声合成のための韻律制 の基礎”、電子情報通信学会技術研究報告 Vol.100、No.392、pp.27-34、2000. 阿部 匡伸、 “音声合成のための合成 位の基礎”、電子情報通信学会技術研究報 、Vol.100、No.392、pp.35-42、2000.

 なお、上記特許文献1-4及び非特許文献1-3の 開示内容はその引用をもって本書に繰込み 載する。
 以下の分析は、本発明の観点から与えられ 。
 以下、本願では、各種情報ごとに求められ スコアをサブスコア(「サブコスト」ともい う。)と定義する。例えば単位スコア関係で 目標素片環境のピッチ周波数と候補素片の ッチ周波数の類似度から算出されるスコア ど、接続スコア関係では隣接する候補素片 士のケプストラムの類似度から算出される コアなどをサブスコアと呼び、単位スコア サブスコアのことを単位サブスコア、接続 コアのサブスコアのことを接続サブスコア 呼ぶ。なお、接続スコアに関して、ある2つ 素片が元音声波形上で連続している場合に 、その素片間の素片環境が完全に連続なの 、接続スコアの値は最大になる。

 しかしながら、上記した特許文献及び非 許文献等に記載された従来の音声合成装置 おける素片の削減方法は、下記のような問 点を有している。

 まず、特許文献3に記載された方法では、 使用頻度という観点で候補を除外するため、 サブスコアを全く計算せずに候補対象から除 外される素片が存在する、という問題がある 。使用頻度が低い素片であっても、入力テキ ストの内容次第では高いスコアを達成できる 可能性がある。従って、使用頻度が理由で除 外された素片を用いればスコアが高くなる入 力テキストに対しては、音質低下を招くこと になる。

 また、特許文献4には、計算量削減という 観点から、2以上の段階に分けて候補対象の 込みを行う構成が開示されているが、当該 補対象の絞込みを適切に行うための具体的 手段や基準は開示されていない。

 従って、特許文献3及び4に記載された音 合成装置では、計算量削減は実現可能であ が音質低下の防止には不十分であるという 題があった。

 本発明は、上記問題点に鑑みてなされた のであり、音質向上と、計算量の削減をバ ンスよく実現できる音声合成装置、音声合 方法及び音声合成プログラムを実現するこ を目的とする。

 本発明の第1の視点によれば、最適素片を 選択するための素片選択サブスコアを計算す るサブスコア計算部と、候補素片の数と、前 記素片選択サブスコアと、を基に候補絞込み を行う候補絞込み部と、を備える音声合成装 置が提供される。

 本発明の第2の視点によれば、入力テキス トから合成音声を生成する音声合成装置にお ける音声合成方法であって、最適素片の選択 過程において、最適素片を選択するための素 片選択サブスコアを計算し、候補素片の数と 、前記素片選択サブスコアと、を基に候補を 絞込む工程を含む音声合成方法が提供される 。

 本発明の第3の視点によれば、入力テキス トから合成音声を生成する際の最適素片の選 択過程において、最適素片を選択するための 素片選択サブスコアを計算する処理と、候補 素片の数と、最適素片を選択する際の素片選 択サブスコアと、を基に候補絞込みを行う候 補絞込み処理と、を、入力テキストから合成 音声を生成する音声合成装置を構成するコン ピュータに実行させるプログラムが提供され る。

 本発明によれば、計算量の削減による音 の低下を伴うことなく、合成音声を出力す ことが可能となる。その理由は、候補数が くなるほど最適素片のサブスコアが高くな 性質を利用して、高音質を達成できる見込 のある素片を選択する構成を採用したこと ある。

本発明の音声合成装置の基本原理を説 するための図である。 本発明に係る第1の実施形態の音声合成 装置の構成を示すブロック図である。 図2の閾値計算部の詳細構成を示すブロ ック図である。 本発明の第1の実施形態の音声合成装置 の動作を説明するためのフローチャートであ る。 図2の閾値計算部の動作を説明するため のフローチャートである。 図3の最適素片サブスコア分析部で得ら れる最適単位サブスコアの度数分布の例であ る。 図3の閾値関数生成部で生成される閾値 関数の一例である。 図3の閾値関数生成部で生成される閾値 関数の一例である。 図3の閾値関数生成部で生成される閾値 関数の一例である。 本発明の第2の実施形態の音声合成装 の構成を示すブロック図である。 図10の重み関数選択部の詳細構成を示 ブロック図である。 本発明の第2の実施形態の音声合成装 の動作を説明するためのフローチャートで る。 図11の重み関数生成部の動作を説明す ためのフローチャートである。 図11の重み関数生成部で生成される重 関数の一例である。 図11の重み関数生成部で生成される重 関数の一例である。 図11の重み関数生成部で生成される重 関数の一例である。 本発明の第3の実施形態の音声合成装 の構成を示すブロック図である。 図17の閾値計算部の詳細構成を示すブ ック図である。 本発明の第3の実施形態の音声合成装 の動作を説明するためのフローチャートで る。 図18の閾値計算部の動作を説明するた のフローチャートである。 本発明の第4の実施形態の音声合成装 の構成を示すブロック図である。 図21の閾値計算部の詳細構成を示すブ ック図である。 本発明の第4の実施形態の音声合成装 の動作を説明するためのフローチャートで る。 図22の閾値計算部の動作を説明するた のフローチャートである。 一般的な規則合成型の音声合成装置の 一例を示した構成図である。

符号の説明

1 言語処理部
2 韻律生成部
3 素片選択部
4 素片情報記憶部
5 波形生成部
11、110、111、112 単位スコア計算部
13、131 接続スコア計算部
14 最適素片検索部
60/65 サブスコア計算部
60 1 、60 2 、…、60 N  第一~第N単位サブスコア計算部
65 1 、65 2 、…、65 N  第一~第N接続サブスコア計算部
70/73 候補絞込み部
70 1 、70 2 、…、70 N  第一~第N候補絞込み部
71 1 、71 2 、…、71 N  第一~第N候補絞込み部
73 1 、73 2 、…、73 N  第一~第N候補絞込み部
80 1 、80 2 、…、80 N  第一~第N閾値計算部
81 1 、81 2 、…、81 N  第一~第N重み関数選択部
82 2 、82 3 、…、82 N  第二~第N閾値計算部
83 1 、83 2 、…、83 N  第一~第N閾値計算部
121/122 サブスコア集計部
121 単位サブスコア集計部
122 接続サブスコア集計部
200、201 候補数取得部
800 M  テキスト記憶部
801 M  言語処理部
802 M  韻律生成部
803 M  素片選択部
804 M  素片情報記憶部
805 M  第M単位サブスコア計算部
807 M  最適素片サブスコア分析部
808 M  閾値関数生成部
809 M  閾値算出部
811 1 、811 2 、…、811 N  第一~第N重み付け部
818 M  重み関数生成部
851 M  重み関数記憶部
852 M  関数選択部
853 M  閾値補正部
855 M  第M接続サブスコア計算部

 次に、本発明を実施するための最良の形態 ついて図面を参照して詳細に説明する。
[発明の概要]
 図1は、本発明の音声合成装置の基本原理を 説明するための図である。本発明に係る音声 合成装置は、最適素片を選択するための素片 選択サブスコアを計算するサブスコア計算部 60/65と、候補素片の数と、前記素片選択サブ コアと、を基に候補絞込みを行う候補絞込 部70/73と、を備える。音声合成装置は、入 テキストから合成音声を生成する際の最適 片の選択過程において、前記サブスコア計 部60/65と、候補絞込み部70/73による候補絞込 を行う。

 前記候補絞込み部70/73により絞込まれた 補の素片選択サブスコアは、別途設けられ サブスコア集計部にて集計され、最適素片 行われる。

 本発明に係る音声合成装置は、例えば、 補素片の数に応じ、異なる閾値を適用して( 図7~図9参照)、素片選択サブスコアによる候 絞込みを行ない、最終的に残った候補の中 ら最適素片を選択する。一般に候補素片の が多ければ、最適素片のサブスコアが高く る性質があるため(図6参照)、上記閾値によ 絞込みは、計算量の削減と音質向上の面の 方で有効に作用する。

 前記素片選択サブスコアとしては、単位 ブスコア又は接続サブスコアのいずれか一 を用いることができる。

 前記候補絞込み部70/73は、前記候補素片 数を基に閾値を求める閾値計算部を設ける ともできる。この場合、前記候補絞込み部70 /73は、この閾値と前記素片選択サブスコアを 基に候補絞込みを行うことができる。

 候補数が多いと目標値に近い素片が存在 る確率が向上するという知見に基づき、前 閾値計算部に、前記候補素片の数が多い場 に、前記候補素片の数が少ない場合の閾値 り大きな閾値を求めるよう動作させること できる。

 前記閾値計算部の閾値の計算に当たって 、素片選択サブスコアを用いることができ 。特に、最適素片の素片選択サブスコアの 計量に基づいて閾値を求めることとすれば より効率の良い閾値を得ることができる。

 例えば、前記候補絞込み部の前段に、候 素片の数を基に重み関数を選択する重み関 選択部と、前記重み関数と前記素片選択ス アを基に前記素片選択スコアを重み付けす 重み付け部とを配置する構成を採ることが きる。このとき、前記候補絞込み部70/73は 前記重み付けされた素片選択スコアを基に 補絞込みを行うことになる。

[第1の実施形態]
 次に、本発明の第1の実施形態について図面 を参照して詳細に説明する。
(1-1)第1の実施形態による音声合成装置の構成
 図2は、本発明の第1の実施形態の構成を示 ブロック図である。図2の言語処理部1、韻律 生成部2、素片選択部3内の接続スコア計算部1 3、最適素片検索部14、素片情報記憶部4及び 形生成部5は、それぞれ図25の言語処理部X1、 韻律生成部X2、接続スコア計算部X13、最適素 検索部X14、素片情報記憶部X4及び波形生成 X5に対応する。従って、本実施形態の音声合 成装置の候補数取得部200、第一単位サブスコ ア計算部60 1 ~第N単位サブスコア計算部60 N 、第一候補絞込み部70 1 ~第N候補絞込み部70 N 、第一閾値計算部80 1 ~第N閾値計算部80 N 、単位サブスコア集計部121が追加されている 点が、図25の一般的な規則合成型の音声合成 置との相違点である。

 図3は、図2の閾値計算部80 M の構成を示すブロック図である(但し、Mは1か らNまでの任意の整数)。図3を参照すると、閾 値計算部80 M は、テキスト記憶部800 M 、言語処理部801 M 、韻律生成部802 M 、素片選択部803 M 、素片情報記憶部804 M 、第M単位サブスコア計算部805 M 、最適素片サブスコア分析部807 M 、閾値関数生成部808 M 、閾値算出部809 M 、を備えて構成される。

 テキスト記憶部800 M には、最適素片の単位サブスコアの特徴を分 析・抽出する上で必要となる多量のテキスト が保存されている。

 適切な閾値を得るためには、言語処理部801 M 、韻律生成部802 M 、素片選択部803 M 、素片情報記憶部804 M は、それぞれ図2の言語処理部1、韻律生成部2 、素片選択部3、素片情報記憶部4と動作が同 であることが望ましい。そこで本実施形態 は、言語処理部801 M 、韻律生成部802 M 、素片選択部803 M 、素片情報記憶部804 M が、図2の言語処理部1、韻律生成部2、素片選 択部3、素片情報記憶部4とそれぞれ等価であ ものとして説明する。

 以下、上記した相違点を中心に、図2及び 図3のブロック図を参照しながら、第一の実 形態の音声合成装置の詳細な動作について 明する。

(1-2)第1の実施形態の音声合成装置の動作
 図4は、本発明の第1の実施形態の動作を説 するためのフローチャートである。図4のフ ーチャートを参照すると、候補数取得部200 、言語処理部1から供給された言語処理結果 と、素片情報記憶部4から供給された各素片 候補数から、該当する素片の候補数を取得 、第一閾値計算部80 1 ~第N閾値計算部80 N へ伝達する(ステップA1)。

 第一閾値計算部80 1 は、候補数取得部200から供給された候補数か ら、候補絞込みの基準値となる閾値を計算し 、第一候補絞込み部70 1 に伝達する(ステップA2)。

 第一単位サブスコア計算部60 1 は、言語処理部1から供給された言語処理結 と、韻律生成部2から供給された韻律情報と 素片情報記憶部に記憶された素片情報を基 第一単位サブスコアを計算し、第一候補絞 み部70 1 に伝達する(ステップA3)。

 第一候補絞込み部70 1 は、第一単位サブスコア計算部60 1 から供給された各候補素片の第一単位サブス コアと、第一閾値計算部80 1 から供給された閾値とを比較し、単位サブス コアが閾値を下回る候補素片を候補から除外 し、残された候補素片とそれらの単位サブス コアを第二単位サブスコア計算部60 2 に伝達する(ステップA4)。

 以下、第二閾値計算部、第二単位サブスコ 計算部、第二候補絞込み部から第N閾値計算 部、第N単位サブスコア計算部、第N候補絞込 部まで(最後の単位サブスコアの計算が終わ るまで)同様に、ステップA2からステップA4ま の処理を繰り返す(ステップA5)。最後の第N 補絞込み部70 N は、残された候補素片及びそれらの第一~第N 位サブスコアを単位サブスコア集計部121に 達する。

 単位サブスコア集計部121は、第N候補絞込み 部70 N から供給された候補素片とそれらの第一~第N 位サブスコアを基に、それぞれの候補素片 対応する単位スコアを求め、候補素片と共 接続スコア計算部13に伝達する(ステップA6)

 単位サブスコアから単位スコアを求める 法としては、例えば単位サブスコアの重み け総和を単位スコアとする方法が挙げられ 。即ち、単位サブスコアをCi、重み係数をwi とした場合、単位スコアCは以下の計算式[数1 ]で求めることができる。

 なお、すべての種類のサブスコアに対し 、閾値計算と候補絞込みを行う必要は無い 上述した候補数に応じて閾値を求める方法 は、ピッチや継続時間長、パワー、ケプス ラム、MFCCなどのサブスコアに対しては高い 効果が期待できる。これは、候補数が多いほ ど目標素片環境の目標値に近い候補素片が存 在する確率が高く、逆に候補数が少ない場合 には、目標値に近い候補素片が存在する確率 が低くなるためである。一方、該当・先行・ 後続の各音素名、ストレスの有無、アクセン ト核からの距離のサブスコアに関しては、ス コアが離散的であり、かつその値域も広くな いので、高い効果を期待することは難しい。

 ここで、上記したステップA2における閾 の求め方について説明する。図5は、図3の閾 値計算部の動作を説明するためのフローチャ ートである。

 図5のフローチャートを参照すると、言語処 理部801 M 、は、テキスト記憶部800 M から供給されたテキストに対して言語処理を 行い、言語処理結果を韻律生成部802 M へ伝達する(ステップA7)。

 韻律生成部802 M は、言語処理部801 M から供給された言語処理結果を基に、合成音 声の韻律情報を生成し、素片選択部803 M に伝達する(ステップA8)。

 素片選択部803 M は、言語処理部801 M から供給された言語処理結果と、韻律生成部 802 M から供給された韻律情報と、素片情報記憶部 804 M に記憶されている素片情報を基に、最適素片 を求め、第M単位サブスコア計算部805 M に伝達する(ステップA9)。

 第M単位サブスコア計算部805 M は、言語処理部801 M から供給された言語処理結果と、韻律生成部 802 M から供給された韻律情報と、素片情報記憶部 804 M に記憶されている素片情報を基に、素片選択 部803 M から供給された最適素片の第M単位サブスコ を計算し、最適素片サブスコア分析部807 M に伝達する(ステップA10)。

 最適素片サブスコア分析部807 M と図2の第M単位サブスコア計算部60 M との相違点は、第M単位サブスコア計算部60 M が候補素片すべての第M単位サブスコアを計 するのに対して、最適素片サブスコア分析 807 M は、素片選択部803 M で得られた最適素片のみの第M単位サブスコ を計算する点である。

 言語処理部801 M 、韻律生成部802 M 、素片選択部803 M 、素片情報記憶部804 M 、第M単位サブスコア計算部805 M の動作の詳細については、図2の言語処理部1 韻律生成部2、素片選択部3、素片情報記憶 4、第M単位サブスコア計算部60 M とそれぞれ等価であるため、説明を割愛する 。

 最適素片サブスコア分析部807 M は、素片情報記憶部804 M と、第M単位サブスコア計算部805 M から供給された最適素片の第M単位サブスコ を分析し、閾値関数を設計する上で基準と る分析値を閾値関数生成部808 M に伝達する(ステップA11)。

 最適素片サブスコア分析部807 M の目的は、最適素片の単位サブスコアを分析 して、効果的な候補絞込みのための閾値を算 出する閾値関数の設計に役立つ基準値や分析 値を求めることである。

 候補絞込みにおいて、なるべく多くの最 素片以外の素片を候補から除外することが 効果的な候補絞込み(すなわち小さな音質低 下で大きな計算量削減)の追求につながる。 たがって、最終的に選択される最適素片と 準的な素片の差異が明確になるようなサブ コアの特徴を得ることが重要である。上記 的を達成するため、例えば、多量の最適素 のサブスコアから平均や分散などの統計量 求めたり、度数分布を調査したりする方法 挙げることができる。

 本実施例では、最適素片サブスコア分析部8 07 M において、候補数別にスコアの度数分布を求 め、その度数分布から閾値関数生成部808 M に伝達する分析値を求める方法について説明 する。

 図6は、候補数別に求めたスコアの度数分 布の例である。k1とk2は0以上の整数で、k1はk2 よりも小さいとする。同図に示すように、候 補数が多いほど、高スコアの最適素片が多く 出現する傾向にある。これは、単位サブスコ アは目標値との差分や距離をスコア化したも のであることから、候補数が多いと目標値に 近い素片が存在する確率が向上するためであ る。逆に、候補数が少ないと、目標値に近い 素片が存在する確率が低くなるため、最適素 片であっても高スコアを達成できないことが 多い。この度数分布から、最適素片の出現確 率が十分低くなるスコア(棄却域)を求めるこ が可能である。

 図6の例では、上記スコア(棄却域)として、 補数がk1未満の場合はp1(未満)、候補数がk1 らk2の場合はp2(未満)、候補数がk2よりも大き い場合はp3(未満)とする。図6にも示すように p1,p2,p3の大小関係はp1<p2<p3となることが 一般的である。このp1,p2,p3、すなわち最適素 の出現確率が十分低くなる候補数別スコア 、候補数k1,k2とともに最適素片サブスコア 析部807 M の分析結果として閾値関数生成部808 M に伝達する。

 閾値関数生成部808 M は、最適素片サブスコア分析部807 M から供給された分析値を基に、候補数を与え ると閾値が求まる閾値関数を求め、閾値算出 部809 M に伝達する(ステップA12)。本実施例では、最 素片サブスコア分析部807 M から供給された分析値が前記k1,k2,p1,p2,p3であ として説明する。

 図7~図9は、k1,k2,p1,p2,p3を基に設計された閾 関数の例である。図7は、階段状の関数であ 、最適素片サブスコア分析部807 M の分析結果を直接反映した関数となっている 。

 また、候補数と閾値が比例関係になるこ を考慮して、図8のように、k1及びk2から少 離れた位置でp1,p2,p3を通過する折れ線関数と すれば、図7よりも効率の高い閾値を得るこ が期待できる。更に、候補数と閾値との比 関係を更に強調した図9のような関数を設計 ることも可能である。また、サブスコアの 類に応じてこれらを組み合わせて用いるこ ができる。

 閾値関数の設計は、すなわち図5のフロー チャートのステップA7からステップA12までの 理は、計算量削減のためにも音声合成処理 行う前に実施しておくほうが望ましい。ま 、閾値関数を設計する際には、候補数と閾 が比例関係にあることが条件として求めら る。従って、本実施例のように統計量を収 して設計しなくても、傾きを適当に設定し 単純な直線や折れ線関数でも類似の効果を ることが可能である。

 閾値算出部809 M は、閾値関数生成部808 M から供給された閾値関数と、図2の候補数取 部200から供給された候補数を基に閾値を算 し、図2の第M候補絞込み部70 M に伝達する(ステップA13)。閾値関数は、図7~ 9に示したように候補数の関数となっている 例えば、図7に示した関数が閾値関数として 与えられるとき、候補数がk1未満であれば、 出される閾値はp1となる。

(1-3)第1の実施形態による音声合成装置の効果
 本実施の形態によれば、音声合成装置は、 補数が多くなるほど最適素片のサブスコア 高くなる性質を利用して、候補数から候補 込みの閾値を求める。そして、候補数に応 て求めた閾値を基に、単位サブスコアが低 素片を候補対象から除外する。このため、 い確度で、高音質を達成できる見込みのあ 素片を残しつつ、最適素片に選択される可 性の低い素片を除外することが可能である 特に、候補数から閾値を求める閾値関数は 最適素片のサブスコアの統計量を基に決定 る。従って、本実施の形態で示した絞込み 導入しても、絞込み無しの状態で最適素片 あった素片が、候補素片から除外される可 性は十分低くなる。

[第2の実施形態]
 次に、本発明の第2の実施形態について図面 を参照して詳細に説明する。

(2-1)第2の実施形態の音声合成装置の構成
 図10は、本発明の第2の実施形態の音声合成 置の構成を示すブロック図である。図10に す本実施形態の構成では、第1の実施形態の 一候補絞込み部70 1 ~第N候補絞込み部70 N 及び第一閾値計算部80 1 ~第N閾値計算部80 N が、それぞれ第一候補絞込み部71 1 ~第N候補絞込み部71 N 及び第一重み関数選択部81 1 ~第N重み関数選択部81 N に置換されている。また上記に伴い、本実施 形態の構成では、第一重み付け部811 1 ~第N重み付け部811 N を新たに備えている。

 図11は、図10の重み関数選択部81 M の構成を示すブロック図である(但し、Mは1か らNまでの任意の整数)。図11に示す重み関数 択部81 M は、図3の閾値計算部80 M の閾値関数生成部808 M 及び閾値算出部809 M を、それぞれ重み関数生成部818 M 及び関数選択部852 M に置換し、重み関数記憶部851 M を新たに備えた構成となっている。

 以下、この相違点を中心に、図10及び図11 のブロック図を参照しながら、第2の実施形 の音声合成装置の詳細な動作について説明 る。

(2-2)第2の実施形態の音声合成装置の動作
 図12は、本発明の第2の実施形態の動作を説 するためのフローチャートである。図12の ローチャートを参照すると、候補数の取得 終えると(ステップA1)、第一重み関数選択部8 1 1 は、候補数取得部200から供給された候補数か ら、単位サブスコアの重み付けに用いる重み 関数を選択し、第一重み付け部811 1 及び候補絞込み部71 1 に伝達する(ステップB1)。

 第一単位サブスコア計算部60 1 は、言語処理部1から供給された言語処理結 と、韻律生成部2から供給された韻律情報と 素片情報記憶部に記憶された素片情報を基 第一単位サブスコアを計算し、第一重み付 部811 1 に伝達する(ステップA3)。

 第一重み付け部811 1 は、第一単位サブスコア計算部60 1 から供給された各候補素片の第一単位サブス コアと、第一重み関数選択部81 1 から供給された重み関数を基に、単位サブス コアに応じた重みを求めて、その重みを単位 スコアに重み付けする。そして、重み付けさ れた単位サブスコアを候補素片と共に第一候 補絞込み部71 1 に伝達する(ステップB2)。

 第一候補絞込み部71 1 は、第一重み付け部811 1 から供給された候補素片と、各候補素片の重 み付けされた第一単位サブスコアを基に、重 み付けされた単位サブスコアが所定の閾値を 下回る候補素片を候補から除外し、残された 候補素片とそれらの重み付けされた単位サブ スコアを第二単位サブスコア計算部60 2 に伝達する(ステップB3)。

 以下、第二重み関数選択部、第二単位サブ コア計算部、第二重み付け部、第二候補絞 み部から第N重み関数選択部、第N単位サブ コア計算部、第N重み付け部、第N候補絞込み 部まで(最後の単位サブスコアの計算が終わ まで)同様に、ステップB1からステップB3まで の処理を繰り返す(ステップA5)。最後の第N候 絞込み部71 N は、残された候補素片及びそれらの第一~第N 位サブスコアを単位サブスコア集計部121に 達する。

 図13は、図11の重み関数生成部818 M の動作を説明するためのフローチャートであ る。図13のフローチャートを参照すると、ス ップA7~A11までの動作は、上記した第1の実施 形態における閾値関数生成部の動作と同様で ある。次に、重み関数生成部818 M は、最適素片サブスコア分析部807 M から供給された分析値を基に、スコアを与え ると重みが求まる重み関数を候補数ごとに求 め、重み関数記憶部851 M に伝達する(ステップB4)。本実施形態では、 適素片サブスコア分析部807 M から供給された分析値が、第1の実施形態の 合と同様にk1,k2,p1,p2,p3であるとして説明する 。

 図14~図16は、k1,k2,p1,p2,p3を基に設計された 閾値関数の例である。図14は、候補数がk1以 の場合に使用する関数を表し、図15は候補数 がk1~k2の場合に使用する関数を表し、図16は 候補数がk2以上の場合に使用する関数を表し ている。

 図14を参照すると、p1’はp1よりも小さい任 の値で、スコアがp1よりも小さくなると重 が小さくなるように設定される。p1=p1’の場 合には、第1の実施形態と同等の効果が得ら ることになる。W10とW11は、0.0以上1.0以下の 意の実数で、W10<W11の関係を満たす。W10は 重み付け部及び候補絞込み部において、候 絞込み対象になる素片のサブスコアに重み けされる重みなので、0.0に十分近い値に設 すべきである。一般的には、W10とW11は、W10= 0.0,W11=1.0と設定される。なお、W10=W11である場 合には、スコアの値に関わらず常に同じ重み が与えられることになるので、重み付け部及 び候補絞込み部において絞込みが全く行われ ないことになる。以上の説明は、p1’及びW10, W11に限らず、図15、図16のp2’、p3’及びW20,W21 ,W30,W31にも同様に当てはまる。このように、 み関数生成部818 M では、候補数に応じて異なる重み関数を生成 する。

 関数選択部852 M は、重み関数記憶部851 M に記憶された重み関数の中から、図10の候補 取得部200から供給される候補数に対応した み関数を選択し、重み関数情報として第M重 み付け及び候補絞込み部71 M に伝達する(ステップB5)。前記の例に従えば 候補数がk1よりも少ない場合には、図14の重 関数を選択する。

(2-3)第2の実施の形態による音声合成装置の効 果
 本実施形態によれば、閾値ではなく重み付 されたスコアで候補の絞込みを行う音声合 装置が得られる。特に、第1の実施形態と比 較して、スコアが閾値に僅かに至らないため 、これまで候補から除外されていた素片が、 重み付けによりスコアは小さくなるものの候 補には残ることになる。従って、残された素 片が音質向上に貢献する可能性が出てくるた め、第1の実施形態よりも音質の向上が期待 きる。

[第3の実施形態]
 次に、本発明の第3の実施形態について図面 を参照して詳細に説明する。

(3-1)第3の実施形態の音声合成装置の構成
 図17は、本発明の第3の実施形態の音声合成 置の構成を示すブロック図である。図17に す本実施の形態による構成では、第1の実施 形態の音声合成装置の第二段以降の第二閾 計算部80 2 ~第N閾値計算部80 N が、第二閾値計算部82 2 ~第N閾値計算部82 N に置換された構成となっている。

 図18は、図17の第二~第N閾値計算部の構成を すブロック図である(但し、Mは2からNまでの 任意の整数)。図18に示す閾値計算部82 M は、図3の閾値計算部80 M と対比して、閾値補正部853 M を新たに備えた構成となっている。

 以下、この相違点を中心に、図17及び図18 のブロック図を参照しながら、第3の実施形 の音声合成装置の詳細な動作について説明 る。

(3-2)第3の実施の形態による音声合成装置の動 作
 図19は、本発明の第3の実施形態の動作を説 するためのフローチャートである。図19の ローチャートを参照すると、候補数の取得 終え(ステップA1)、これに基づく第一単位サ スコア計算部60 1 の計算が完了すると、第二閾値計算部82 2 は、候補数取得部200から供給された候補数と 、第一単位サブスコア計算部60 1 から供給された単位サブスコアを基に、候補 絞込みの基準値となる閾値を計算し、第二候 補絞込み部70 2 に伝達する(ステップC1)。以下の動作は、上 した第1の実施形態と同様である。

 図20は、図18の閾値計算部82 M の動作を説明するためのフローチャートであ る。図20のフローチャートを参照すると、ス ップA7~ステップS13までの動作は、上記した 1の実施形態と同様である。最後に閾値補正 部853 M は、図17の第一単位サブスコア計算部60 1 から第M-1単位サブスコア計算部60 M-1 までのすべてから供給される単位サブスコア を基に、閾値算出部809 M から供給される閾値を補正し、第M候補絞込 部70 M に伝達する(ステップC2)。閾値補正部853 M の主な目的は、これまで計算してきた単位サ ブスコアが高い素片が、候補から除外される ことを防ぐように閾値を補正することである 。

 従って、供給された単位サブスコアの中 スコアが所定の閾値を超えるものがある場 や、供給された単位サブスコアの総和が所 の閾値を超える場合には、閾値が小さくな ように補正する。また、サブスコアが大き ほど閾値を小さくする方法も有効である。 に供給されたサブスコアが全体的に小さい 合には、最適素片に選択される可能性が低 ので、閾値が大きくなるように補正して、 補から除外される可能性を高くすることも 効である。本実施例では、第一番目から第M -1番目までの全てのサブスコアを利用する方 を説明したが、特定の単位サブスコア(例え ば第一単位サブスコアのみ、第一から第三サ ブスコアまでのみ)を利用する方法も有効で る。

(3-3)第3の実施形態による音声合成装置の効果
 本実施形態によれば、音声合成装置は、第1 ~第M-1単位サブスコアの値に応じて、第M閾値 算部で計算される閾値の補正が行われる。 に、第1~第M-1単位サブスコアの中に高スコ の単位サブスコアが含まれている場合には 最適素片に選択される可能性が高くなるの 、閾値が低くなるように補正する。その結 、第1の実施形態と比較して、単位スコアの い素片が、第M単位サブスコアでの候補絞込 みにおいて候補から除外される頻度が減少す るので、第1の実施形態よりも音質の向上が 待できる。

[第4の実施形態]
 次に、本発明の第4の実施形態について図面 を参照して詳細に説明する。

(4-1)第4の実施形態による音声合成装置の構成
 図21は、本発明の第4の実施形態の合成音声 置の構成を示すブロック図である。図21の 語処理部1、韻律生成部2、素片選択部3内の 位スコア計算部11、最適素片検索部14、素片 報記憶部4及び波形生成部5は、それぞれ図25 の言語処理部X1、韻律生成部X2、単位スコア 算部X11、最適素片検索部X14、素片情報記憶 X4及び波形生成部X5に対応する。従って、本 施形態の音声合成装置の候補数取得部201、 一接続サブスコア計算部65 1 ~第N接続サブスコア計算部65 N 、第一候補絞込み部73 1 ~第N候補絞込み部73 N 、第一閾値計算部83 1 ~第N閾値計算部83 N 、接続サブスコア集計部122が追加されている 点が、図25の一般的な規則合成型の音声合成 置との相違点である。

 図22は、図21の閾値計算部83 M の構成を示すブロック図である(但し、Mは2か らNまでの任意の整数)。図22に示す閾値計算 83 M は、図3の第1の実施形態の閾値計算部80 M の第M接続サブスコア計算部805 M が、第M接続サブスコア計算部855 M に置換された構成となっている。

 以下、この相違点を中心に、図21のブロ ク図を参照しながら、第4の実施形態による 声合成装置の詳細な動作について説明する

(4-2)第4の実施の形態による音声合成装置の動 作
 図23は、本発明の第4の実施形態の動作を説 するためのフローチャートである。図23の ローチャートを参照すると、候補数取得部20 1は、単位スコア計算部11から、残された候補 素片数を取得し、第一閾値計算部83 1 ~第N閾値計算部83 N へ伝達する(ステップD1)。

 第一閾値計算部83 1 は、候補数取得部201から供給された候補数か ら、候補絞込みの基準値となる閾値を計算し 、第一候補絞込み部73 1 に伝達する(ステップD2)。

 第一接続サブスコア計算部65 1 は、単位スコア計算部11から供給された候補 片と、素片情報記憶部4に記憶された素片情 報を基に第一接続サブスコアを計算し、単位 スコア計算部11から供給された候補素片の単 スコアと併せて第一候補絞込み部73 1 に伝達する(ステップD3)。

 第一候補絞込み部73 1 は、第一接続サブスコア計算部65 1 から供給された各候補素片の第一接続サブス コアと、第一閾値計算部83 1 から供給された閾値とを比較し、接続サブス コアが閾値を下回る候補素片を候補から除外 し、残された候補素片とそれらの単位スコア 及び第一接続サブスコアを第二接続サブスコ ア計算部65 2 に伝達する(ステップD4)。

 以下、第二閾値計算部、第二接続サブスコ 計算部、第二候補絞込み部から第N閾値計算 部、第N接続サブスコア計算部、第N候補絞込 部まで(最後の接続サブスコアの計算が終わ るまで)同様に、ステップD2からステップD4ま の処理を繰り返す(ステップD5)。最後の第N 補絞込み部73 N は、残された候補素片及びそれらの単位スコ アと第一~第N接続サブスコアを接続サブスコ 集計部122に伝達する。

 接続サブスコア集計部122は、第N候補絞込み 部73 N から供給された候補素片とそれらの第一~第N 続サブスコアを基に、それぞれの候補素片 対応する接続スコアを求め、候補素片と単 スコアと共に最適素片検索部14に伝達する( テップD6)。接続サブスコアから接続スコア 求める方法としては、第一の実施形態の単 スコアの場合と同様に、接続サブスコアの み付け総和を接続スコアとする方法が挙げ れる。

 図24は、図22の閾値計算部83 M の動作を説明するためのフローチャートであ る。図24のフローチャートのステップA7~A9ま の処理及びステップA11~A13までの処理は、上 した第1の実施形態の各処理と同様である。 第M接続サブスコア計算部855 M は、素片情報記憶部804 M に記憶されている素片情報を基に、素片選択 部803 M から供給された最適素片の第M接続サブスコ を計算し、最適素片サブスコア分析部807 M に伝達する(ステップD7)。

 図21の第M接続サブスコア計算部65 M との相違点は、第M接続サブスコア計算部65 M が候補素片すべての第M接続サブスコアを計 するのに対して、第M接続サブスコア計算部8 55 M は、素片選択部803 M で得られた最適素片のみの第M接続サブスコ を計算する点である。第M接続サブスコア計 部855 M の動作の詳細については、図21の第M接続サブ スコア計算部65 M と等価であるため、説明を割愛する。

(4-3)第4の実施の形態による音声合成装置の効 果
 本実施形態によれば、単位サブスコアでは く接続サブスコアを用いて候補の絞込みを う音声合成装置を得ることができる。その 果、接続スコア全体の計算量を削減するこ が可能である。特に、単位スコアの計算量 少なく、接続サブスコアの種類及び計算量 多い場合には、上記した第1~第3の実施形態 比較して、高い計算量削減効果が期待でき 。

[第5の実施形態]
 上記した接続サブスコアを用いた候補の絞 みにおいて、上記した第2の実施形態の重み 付け関数の選択により、候補の数に応じたス コアの重み付けを行って、最適素片となる可 能性の高い候補を絞り込む方法を採用するこ とができる。この場合、第4の実施形態と比 して、スコアが閾値に僅かに至らないため これまで候補から除外されていた素片が、 み付けによりスコアは小さくなるものの候 には残ることになる。従って、残された素 が音質向上に貢献する可能性が出てくるた 、第4の実施形態よりも音質の向上が期待で る。

[第6の実施形態]
 上記した接続サブスコアを用いた候補の絞 みにおいて、上記した第3の実施形態の候補 の数に応じた閾値に、スコアによる補正を行 ってから、最適素片となる可能性の高い候補 を絞り込む方法を採用することができる。こ の場合、第4の実施形態と比較して、単位ス アの高い素片が、第M単位サブスコアでの候 絞込みにおいて候補から除外される頻度が 少するので、第4の実施形態よりも音質の向 上が期待できる。

 本発明は、上記した各実施形態に限定さ るものではなく、本発明の基本的技術的思 を逸脱しない範囲で、更なる変形・置換・ 整を加えることができる。例えば、上記し 実施形態では、[数1]を例示して、スコアCを 算出するものとして説明したが、特許文献1 2や非特許文献に示された各種のスコア(コス ト)算出式を用いることができる。

 また、上記した実施形態では、音声合成 置の構成及び動作を中心に説明したが、任 のコンピュータを上記音声合成装置の各手 として機能させるプログラム、上記音声合 装置の各手順を実行させるプログラムによ 、上記音声合成装置を得ることができる。

 本発明の全開示(請求の範囲を含む)の枠 において、さらにその基本的技術思想に基 いて、実施形態ないし実施例の変更・調整 可能である。また、本発明の請求の範囲の 内において種々の開示要素の多様な組み合 せないし選択が可能である。本発明は、請 の範囲を含む全開示、技術的思想にしたが て当業者であればなし得るであろう各種変 、修正を含むことは勿論である。