Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
SOUND SOURCE DIRECTION DETECTING METHOD, DEVICE, AND PROGRAM
Document Type and Number:
WIPO Patent Application WO/2008/146565
Kind Code:
A1
Abstract:
Enhanced sound source detection accuracy in a sound source direction detecting device having a control target which is in the state of emitting a noise is realized. The sound source direction detecting device comprises a means for computing the direction and index of the sound source from a received sound signal, a means for judging whether or not the received sound signal is a target sound from the state of the control target and the relative relation between the index and a predetermined threshold, and a means for, if the signal is the target sound, detecting the direction.The sound source direction detecting device judges to be either sound or noise depending on whether or not the control target is in the state of emitting the noise sound. When judging it to be the sound, the sound source direction detecting device detects the sound source direction.

Inventors:
SATO MIKI (JP)
Application Number:
PCT/JP2008/058261
Publication Date:
December 04, 2008
Filing Date:
April 30, 2008
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
NEC CORP (JP)
SATO MIKI (JP)
International Classes:
G01S3/801; B25J13/08; G01S3/86; G10L21/02; H04R1/40; H04R3/00; B25J19/02
Domestic Patent References:
WO2001095314A12001-12-13
WO2005076660A12005-08-18
Foreign References:
JP2002116794A2002-04-19
JP2004258289A2004-09-16
JPH05111090A1993-04-30
Attorney, Agent or Firm:
KATO, Asamichi (20-12 Shin-Yokohama 3-chome Kohoku-ku, Yokohama-sh, Kanagawa 33, JP)
Download PDF:
Claims:
 音を発生させる制御対象を持つ装置において、
 複数の受音手段により取得された受音信号から音源の方向を検出する音源方向検出方法であって、
 前記受音信号から音源の方向と指標を計算するステップと、
 前記制御対象の状態と、前記指標と所定の閾値の相対関係から受音信号が目的音であるか否か判定するステップと、
 目的音であれば前記方向を検出するステップと、
 を有する音源方向検出方法。
 前記受音信号が目的音であるか否か判定するステップにおいて、
 前記指標と前記閾値の相対関係が所定の閾時間以上継続すると目的音であると判定されることを特徴とする、
 請求項1記載の音源方向検出方法。
 前記閾値は、制御対象の状態に応じて変更可能なパラメータであることを特徴とする、
 請求項1記載の音源方向検出方法。
 前記閾時間は、制御対象の状態に応じて変更可能なパラメータであることを特徴とする、
 請求項2記載の音源方向検出方法。
 前記指標は、前記受音信号の大きさを示す値であることを特徴とする、
 請求項1記載の音源方向検出方法。
 前記指標は、前記受音信号と所定の参照信号との相関値であることを特徴とする、
 請求項1記載の音源方向検出方法。
 前記受音信号が目的音であるか否か判定するステップを行うか否か判定するステップを、
 さらに有することを特徴とする、
 請求項1記載の音源方向検出方法。
 方向を検出すると、一定時間次の検出を制限するステップを、
 さらに有することを特徴とする、
 請求項1記載の音源方向検出方法。
 前記受音信号から音源の方向と指標を計算するステップにおいて、
 さらに方向の信頼性を求め、前記信頼性が低ければ検出を制限することを特徴とする、
 請求項1記載の音源方向検出方法。
 音を発生させる制御対象を持つ装置に搭載されたコンピュータに、複数の受音手段により取得された受音信号から音源の方向を検出させる音源方向検出プログラムであって、
 前記受音信号から音源の方向と指標を計算する処理と、
 前記制御対象の状態と、前記指標と所定の閾値の相対関係から受音信号が目的音であるか否か判定する処理と、
 目的音であれば前記方向を検出する処理と、
 を前記コンピュータに実行させる音源方向検出プログラム。
 前記受音信号が目的音であるか否か判定する処理として、
 前記指標と前記閾値の相対関係が所定の閾時間以上継続すると目的音であると判定することを特徴とする、
 請求項10記載の音源方向検出プログラム。
 前記閾値は、制御対象の状態に応じて変更可能なパラメータであることを特徴とする、
 請求項10記載の音源方向検出プログラム。
 前記閾時間は、制御対象の状態に応じて変更可能なパラメータであることを特徴とする、
 請求項11記載の音源方向検出プログラム。
 前記指標は、前記受音信号の大きさを示す値であることを特徴とする、
 請求項10記載の音源方向検出プログラム。
 前記指標は、前記受音信号と所定の参照信号との相関値であることを特徴とする、
 請求項10記載の音源方向検出プログラム。
 前記受音信号が目的音であるか否か判定する処理を行うか否か判定する処理を、
 さらに前記コンピュータに実行させることを特徴とする、
 請求項10記載の音源方向検出プログラム。
 方向を検出すると、一定時間次の検出を制限する処理を、
 さらに前記コンピュータに実行させることを特徴とする、
 請求項10記載の音源方向検出プログラム。
 前記受音信号から音源の方向と指標を計算する処理において、
 さらに前記コンピュータに方向の信頼性を求めさせ、前記信頼性が低ければ検出を制限させることを特徴とする、
 請求項10記載の音源方向検出プログラム。
 音を発生させる制御対象を持ち、複数の受音手段により取得された受音信号から音源の方向を検出する音源方向検出装置であって、
 前記受音信号から音源の方向と指標を計算する手段と、
 前記制御対象の状態と、前記指標と所定の閾値の相対関係から受音信号が目的音であるか否か判定する手段と、
 目的音であれば前記方向を検出する手段と、
 を備える音源方向検出装置。
 前記受音信号が目的音であるか否か判定する手段は、
 前記指標と前記閾値の相対関係が所定の閾時間以上継続すると目的音であると判定することを特徴とする、
 請求項19記載の音源方向検出装置。
 前記閾値は、制御対象の状態に応じて変更可能なパラメータであることを特徴とする、
 請求項19記載の音源方向検出装置。
 前記閾時間は、制御対象の状態に応じて変更可能なパラメータであることを特徴とする、
 請求項20記載の音源方向検出装置。
 前記指標は、前記受音信号の大きさを示す値であることを特徴とする、
 請求項19記載の音源方向検出装置。
 前記指標は、前記受音信号と所定の参照信号との相関値であることを特徴とする、
 請求項19記載の音源方向検出装置。
 前記受音信号が目的音であるか否か判定する手段を、動作させるか否か判定する手段を、
 さらに備えることを特徴とする、
 請求項19記載の音源方向検出装置。
 方向を検出すると、一定時間次の検出を制限する手段を、
 さらに備えることを特徴とする、
 請求項19記載の音源方向検出装置。
 前記受音信号から音源の方向と指標を計算する手段は、
 さらに方向の信頼性を求め、前記信頼性が低ければ検出を制限することを特徴とする、
 請求項19記載の音源方向検出装置。
Description:
音源方向検出方法、装置及びプ グラム

[関連出願]
 本出願は、2007年5月30日に出願された日本特 許出願2007-143876に基づく優先権を主張するも であり、該日本出願の全部を引用により本 に繰込む。
 本発明は、音源方向検出方法、装置及びプ グラムに関し、特に、各種の制御対象を制 することにより、ユーザとのインタラクシ ン等を行う装置における音源方向検出方法 装置及びプログラムに関する。

 従来、ユーザの方向を検出するための音 方向検出手段を備え、ユーザとインタラク ョンを行うロボット装置が知られている。 源方向検出手段を備えたロボット装置を開 する特許文献としては、特開2006-181651号公 「対話型ロボット、対話型ロボットの音声 識方法および対話型ロボットの音声認識プ グラム」、特開2004-130427号公報「ロボット装 置及びロボット装置の動作制御方法」、特開 2003-326479号公報「自立行動ロボット」等が挙 られる。

 これら特許文献に記載のロボット装置は 音源方向検出手段により、発話を行ったユ ザの方向を検出し、音声認識のための受音 段の指向性や、画像認識のための撮像手段 画角をユーザに対し適切な方向に一致させ ように動作を行う。

 このような音源方向検出手段に用いられ 音源方向検出方法を開示する特許文献とし は、特開2006-166007号公報「音源方向検出方 、音源方向検出装置及び撮影装置」や特開 11-142499号公報「音源方向推定方法及びその 置」が挙げられる。前者の特開2006-166007号公 報には、複数のマイクロホンにより獲得され た信号から、各マイクロホンが受音した目的 音の音圧レベルの比を求め、この音圧レベル の比から音源方向を検出する手法が開示され ている。後者の特開平11-142499号公報には、複 数のマイクロホンにより獲得された信号から 、各マイクロホンが受音した目的音の到達時 間差を推定し、前記到達時間差から音源方向 を検出する手法が開示されている。

 また、本願発明者は、非特許文献「パー ナルロボットPaPeRoにおける音源方向検出」( 佐藤,山下,藤田,第19回日本ロボット学会学術 演会,2001年9月)にて、ロボット装置の動作速 度に応じて、音源方向検出を行う音量閾値を 変更するようにし、ロボット装置の動作音の 影響を回避できる構成を提案済みである。

特開2006-181651号公報

特開2004-130427号公報

特開2003-326479号公報

特開2006-166007号公報

特開平11-142499号公報 佐藤 幹 外2名、「パーソナルロボットP aPeRoにおける音源方向検出」、第19回日本ロ ット学会学術講演会、2001年9月18日-20日、1J28 、pp.281-282

 しかしながら、近年のロボット装置にお ては、動作部、スピーカ、プッシュスイッ 、接触センサ等、様々な制御対象の増加に い、ノイズ音の発生源が増加している。ロ ットの動作速度だけでなく、これら多数の 御対象から発せられるさまざまなノイズ音 影響を回避し、正確に音源方向を検出する とのできる方法が求められている。

 本発明は、上記事情に鑑みてなされたも であって、その目的とするところは、ノイ を発する状態を持つ制御対象を有する装置 おけるノイズ対策を実施し、音源方向検出 度を向上させることにある。

 本発明の第1の視点によれば、音を発生さ せる制御対象を持つ装置において、複数の受 音手段により取得された受音信号から音源の 方向を検出する音源方向検出方法であって、 前記受音信号から音源の方向と指標を計算す るステップと、前記制御対象の状態と、前記 指標と所定の閾値の相対関係から受音信号が 目的音であるか否かを判定するステップと、 目的音であれば前記方向を検出するステップ と、を有する音源方向検出方法が提供される 。

 本発明の第2の視点によれば、音を発生さ せる制御対象を持つ装置に搭載されたコンピ ュータに、複数の受音手段により取得された 受音信号から音源の方向を検出させる音源方 向検出プログラムであって、前記受音信号か ら音源の方向と指標を計算する処理と、前記 制御対象の状態と、前記指標と所定の閾値の 相対関係から受音信号が目的音であるか否か 判定する処理と、目的音であれば前記方向を 検出する処理と、を前記コンピュータに実行 させる音源方向検出プログラムが提供される 。

 本発明の第3の視点によれば、音を発生さ せる制御対象を持ち、複数の受音手段により 取得された受音信号から音源の方向を検出す る音源方向検出装置であって、前記受音信号 から音源の方向と指標を計算する手段と、前 記制御対象の状態と、前記指標と所定の閾値 の相対関係から受音信号が目的音であるか否 か判定する手段と、目的音であれば前記方向 を検出する手段と、を備える音源方向検出装 置が提供される。

 本発明によれば、ノイズを発する制御対 の影響を回避した音源方向の検出が可能と る。その理由は、制御対象の状態に応じて 入力された音が目的音であるかを動的に判 するよう構成したことにある。

 以下に、本発明の種々の展開可能形態を示 。
(形態1)
 本発明の第1の視点によれば、少なくとも2 上の受音手段からの受音信号と、それぞれ イズを発生する状態を持つ少なくとも2以上 制御対象からの状態信号とが入力され、前 受音信号及び状態信号に基づいて音源方向 検出する音源方向検出装置であって、前記 受音手段から入力された受音信号に基づい 音源方向及び所定の指標を算出するととも 、前記状態信号に基づいて前記受音信号が 的音であるか否かを判定するための目的音 定条件を更新し、前記所定の指標が、前記 的音判定条件を満たしているか否かにより 的音が入力されたか否かを判断し、目的音 判断された受音信号の音源方向を出力する 源方向検出部を備える音源方向検出装置と ることができる。
(形態2)
 前記音源方向検出部は、前記各受音手段か 入力された受音信号に基づいて音源方向及 所定の指標を計算する音源方向計算部と、 記状態信号の送信元の制御対象がノイズを 生する状態である場合に、目的音判定条件 して設定された閾値を増大させる更新条件 断部と、前記所定の指標が、前記閾値を上 った場合に、目的音が入力されたと判断し 前記計算された音源方向を出力させる目的 判断部と、を含む構成と、することができ 。
(形態3)
 前記更新条件判断部は、更に、前記状態信 の送信元の制御対象がノイズを発生する状 である場合に、目的音判定条件として設定 れた閾時間を増大させるものとし、前記目 音判断部は、前記所定の指標が、前記閾値 上回った状態が前記閾時間以上継続した場 に、目的音が入力されたと判断し、前記計 された音源方向を出力させるものとするこ ができる。
(形態4)
 前記更新条件判断部は、2以上の制御対象か ら状態信号が入力された場合、前記各状態信 号から求めた値の中の最大値を前記閾値とし て設定するものとすることができる。
(形態5)
 前記更新条件判断部は、2以上の制御対象か ら状態信号が入力された場合、前記各状態信 号から求めた値の中の最大値を前記閾時間と して設定するものとすることができる。
(形態6)
 前記更新条件判断部は、前記状態信号に基 いて、音源方向の出力を抑止する時間を示 マスク時間を設定し、該マスク時間が経過 るまで、音源方向の出力を抑止するものと ることができる。
(形態7)
 前記音源方向検出部は、更に、音源方向の 力後、所定の出力マスク時間が経過するま 、音源方向の出力を抑止する出力判断部を える構成とすることができる。
(形態8)
 前記音源方向計算部は、更に、算出した音 方向の信頼性を求め、前記音源方向の信頼 が低い場合は音源方向の出力を抑止するも とすることができる。
(形態9)
 前記所定の指標としては、前記受音信号の きさを示す値を用いることができる。
(形態10)
 前記所定の指標としては、前記受音信号と 定の参照信号との相関値を用いることがで る。
(形態11)
 更に、上記各形態の音源方向検出装置を搭 したロボット装置を得ることができる。

 続いて、本発明を実施するための最良の 態について、いくつかの実施例を挙げて説 する。

本発明の一実施例に係る音源方向検出 置の構成を表したブロック図である。 本発明の一実施例に係る音源方向検出 置による音源方向検出処理の流れを表した ローチャートである。 図2の更新条件判断処理の流れを表した フローチャートである。 図3のマスク判断処理の流れを表したフ ローチャートである。 図2の音声判断処理の流れを表したフロ ーチャートである。 図2の出力判断処理の流れを表したフロ ーチャートである。 本発明の第2の実施例に係る音源方向検 出装置による音声判断処理の流れを表したフ ローチャートである。 本発明の第3の実施例に係る音源方向検 出装置による出力判断処理の流れを表したフ ローチャートである。 本発明の第4の実施例に係るロボット装 置の構成を表したブロック図である。

符号の説明

1 受音部
2 音源方向検出部
3 制御部
4 制御対象部
101、102、10X 受音手段
201 音源方向計算部
202 状態監視部
203 更新条件判断部
204 音声判断部
205 出力判断部
401、402、40Y 制御対象
1001 ロボット頭部
1002 ロボット胴体部
1003 指向性マイクロホン
1004 音声認識回路
1101、1102 マイクロホン
1200 音源方向検出回路
1201 音源方向計算回路
1202 ロボット状態監視回路
1203 更新条件判断回路
1204 音声判断回路
1205 出力判断回路
1300 ロボット制御回路
1401 モータ
1402 スピーカ
1403 プッシュスイッチ
1404 接触センサ

[実施例1]
 図1は、本発明の第1の実施例に係る音源方 検出装置の構成を表したブロック図である 図1を参照すると、第1の実施例に係る音源方 向検出装置は、大きく分けて、受音部1と、 源方向検出部2と、制御部3と、制御対象部4 、により構成される。

 受音部1は、マイクロホン等のX個の受音 段101~10Xで構成され、これら受音手段101~10Xに より音響-電気変換された信号を生成する。 えば、時刻kにおける前記受音手段101、102が 成する信号X1(k)、X2(k)は、目的音源が発生し た音信号S(k)に対し、目的音源から各受音手 への音の到達時間n1、n2遅延した信号に相当 、次式で表される。

 制御対象部4は、モータ、スピーカ、プッ シュスイッチ、接触センサ等の動作音を発生 するY個の制御対象401~40Yで構成される。例え 、制御対象401、402は、制御部3からの制御信 号を受信すると、それぞれの機能に応じて動 作を実行した際に、実行状態を示す状態信号 Y1(k)~Y1(k)を出力する。

 以下、本実施例では、説明の簡単化のた 、受音手段の個数X及び制御対象の個数Yを れぞれX=2、Y=2とした場合について説明する

 音源方向検出部2は、音源方向計算部201と 、状態監視部202と、更新条件判断部203と、音 声判断部204と、出力判断部205と、で構成され 、受音手段101、102が生成する信号X1(k)、X2(k) 、制御対象部4が生成する状態信号Y1(k)、Y2(k) とを入力とし、後述する所定の条件を満たし た時に音源方向検出結果θfinalを出力する。

 制御部3は、音源方向検出部2から出力さ た音源方向検出結果θfinalに応じて、所望の 御対象を制御すべく制御信号を生成する。 えば、モータによりマイクロホンや本体の 向転換動作を行う動作や、スピーカから音 方向を検出したことを通知する発話を行う 作を実施可能である。

 次に、上記音源方向検出部2に配された各 部の動作について説明する。音源方向計算部 201は、受音手段101、102から出力された信号X1( k)、X2(k)から、方向値θと、指標として音量値 Vを算出し、方向値θを出力判断部205に、前記 音量値Vを音声判断部204に出力する。

 前記方向値θは、信号X1(k)、X2(k)の相互相 の最大値として求められる。受音手段101、1 02に目的音源が発生した音信号S(k)が到達する 時間差τ(=n1-n2)、受音手段間の距離M[m]、音速c [m/秒]を用いて、方向値θは、次式[数2]で表わ される。

 また、音響-電気変換された信号がサンプ リングレートf[Hz]の離散信号である場合は、 間差τに相当するサンプル数の差を用いて 方向値θは、次式[数3]で表わされる。

 また、上記手法に代えて、信号X1(k)、X2(k) より、音圧レベルの比を求め、前記音圧レベ ルの比から音源方向(方向値θ)を検出する特 文献4に記載の手法を用いることもできる。 の他、目的音源の方向を示す値を得られる のであれば、これらの手法に限られるもの はない。

 前記音量値Vは、前記受音手段101、102が生 成する信号X1(k)、X2(k)の時刻kにおける時間Lの 平均E(k)で表される(次式[数4]参照)。

 また上記音量値Vでは、信号X1(k)と信号X2(k )の平均を取っているが、信号X1(k)と信号X2(k) れぞれの時刻kにおける時間Lの平均値のど らか大きい方、又は、どちらか片方に固定 ておく構成としてもよい。また、その他入 された音信号の大きさや強度を示す値であ ば、これらの手法に限られるものではない

 状態監視部202は、制御対象401、402から出 された状態信号Y1(k)、Y2(k)から、状態値1、 態値2を生成し、更新条件判断部203に出力す 。前記状態値1、2は、例えば、状態信号Y1(k) 、Y2(k)の時刻kにおける時間Lの平均値、特定 閾値を超えているか否かや実行状態である 否かといった2値情報等、制御対象の状態を す値であればよい。

 また、状態監視部202を省略した構成も採 可能である。この場合、状態信号Y1(k)、Y2(k) は、そのまま更新条件判断部203に状態値1、 態値2として入力される。

 更新条件判断部203は、状態監視部202から 力される状態値1、状態値2から、更新判断 果と、目的音判定条件として音声判断パラ ータを生成し、音声判断部204に出力する。

 以下、本実施例では、更新判断結果は、 源方向の出力を行うべきか否かをTRUE、FALSE 2値で示す更新判断フラグによって出力され るものとする。また、音声判断パラメータと しては、音量値Vが特定の値よりも上回った とを検出するためのON音量閾値、前記音量値 Vが特定の値よりも下回ったことを検出する めのOFF音量閾値、前記音量値VがON音量閾値 上回ってからOFF閾値を下回るまでの時間が 定時間を越えたことを検出するための時間 値の3つの値が出力されるものとする。

 音声判断部(目的音判断部)204は、更新条 判断部203から出力された更新判断フラグがTR UEである場合、前記音源方向計算部201から出 された音量値Vと、前記更新条件判断部203か ら出力された音声判断パラメータと、から、 音声判断結果を生成し、出力判断部205に出力 する。本実施例では、音声判断結果は、音源 方向の出力を行うべきか否かをTRUE、FALSEの2 で示す音声判断フラグによって出力される のとする。

 出力判断部205は、前記音源方向計算部201 ら出力された方向値θと、音声判断部204か 出力された音声判断フラグがTRUEである場合 音源方向検出結果θfinalを生成し、制御部3 出力する。

 続いて、本実施例における音源方向検出 理の流れについて図面を参照して詳細に説 する。

 図2は、図1に示した音源方向検出装置の 源方向検出部2による処理の全体の流れを表 たフローチャートである。図2を参照すると 、まず、音源方向の検出が開始されると、音 源方向計算部201が、前述した方向値θ及び音 値Vを算出し、出力する(ステップS1)。

 次に、更新条件判断部203が、後に図3を参 照して説明する更新条件判断処理を行う(ス ップS2)。

 更新条件判断の結果、更新を行うべきと 断された場合(ステップS2の「TRUE」)、音声 断部204が、後に図5を参照して説明する音声 断処理を行う(ステップS3)。

 音声条件判断の結果、入力音が目的音で ると判断された場合(ステップS3の「TRUE」) 出力判断部205が、後に図6を参照して説明す 出力判断処理を行う(ステップS4)。

 出力判断の結果、音源方向の検出結果を 力すべきと判断された場合(ステップS4の「T RUE」)、出力判断部205は、音源方向計算部201 て計算された方向値θを音源方向検出結果と して制御部3に出力する(ステップS5)。

 一方、前記更新条件判断の結果、前記音 判断の結果、前記出力判断の結果のいずれ がFALSEの場合(ステップS2、S3、S4の「FALSE」) 出力判断部205による音源方向の検出結果の 力は行われない(ステップS6)。以降、検出が 終了されるまで、ステップS1に戻り、上述し 処理が繰り返し行われる。

 [更新条件判断処理]
 次に、上記した更新条件判断部203による更 条件判断処理について図面を参照して詳細 説明する。

 図3は、図2のステップS2の更新条件判断処 理の流れを表したフローチャートである。図 3を参照すると、更新条件判断部203は、まず マスク判断用情報を取得する(ステップS201) マスク判断用情報とは、状態監視部202から 力された状態値1、状態値2のことである。

 更新条件判断部203は、後に図4を参照して 説明するマスク判断処理にて、マスクを開始 するか否か(マスクフラグ)、仮マスク時間、 声判断パラメータを決定する(ステップS202) マスク判断の結果、マスクを開始すべきと 断した場合(ステップS202の「YES」)、更新条 判断部203は、マスク時間として、前記仮マ ク時間を設定し、マスク開始時刻を現在時 に更新する(ステップS203)。

 一方、マスク判断の結果、マスク開始不 と判断された場合(ステップS202の「NO」)、 スク時間、マスク開始時刻の更新は行われ い。

 次に、更新条件判断部203は、マスク開始 刻からの経過時間がマスク時間を超えてい か否かの判定を行う(ステップS204)。ここで マスク開始時刻からの経過時間が前記マス 時間を超えている場合(ステップS204の「YES )、更新条件判断部203は、更新判断フラグをT RUEに設定する(ステップS205)。

 一方、マスク開始時刻からの経過時間が スク時間を超えていない場合(ステップS204 「NO」)、更新条件判断部203は、更新判断フ グをFALSEに設定する(ステップS206)。

 最後に、更新条件判断部203は、前記更新 断フラグ及び音声判断パラメータの出力を う(ステップS207)。このように制御対象の状 に応じて決定された更新判断フラグによっ 、音声判断部204にて音声判断を行うか否か 決定される。

 [マスク判断処理]
 次に、上記した更新条件判断部203によるマ ク判断処理について図面を参照して詳細に 明する。

 図4は、図3のステップS202のマスク判断処 の流れを表したフローチャートである。図4 を参照すると、更新条件判断部203は、まず、 マスクを開始するか否かを示すマスクフラグ をFALSEに設定し、音声判断パラメータ(音量閾 値(ON)、音量閾値(OFF)、時間閾値)を通常値に 定する(ステップS2021)。ここで、通常値とは すべての制御対象が音を発生させない状態 音源方向検出を行う際に予め設定されてい 値(デフォルト値)のことを示す。

 次に、更新条件判断部203は、状態監視部2 02から出力された状態値が条件別マスク条件( 制御対象の状態別マスク条件)を満たすか否 の判定を行う(ステップS2022)。例えば、制御 象401の状態値1が動作中であることを示して おり、条件別マスク条件を満たす場合(ステ プS2022の「YES」)、更新条件判断部203は、マ クフラグをTRUEに設定し(ステップS2023)、音声 判断パラメータの更新処理を開始する。

 更新条件判断部203は、音声判断パラメー の更新処理として、まず、制御対象の状態 応じて予め設定された条件別音声判断パラ ータ(音量閾値(ON)’、音量閾値(OFF)’、時間 閾値’)と、現時点の音声判断パラメータ(音 閾値(ON)、音量閾値(OFF)、時間閾値)との比較 を行う(ステップS2024)。

 条件別音声判断パラメータが現在の音声 断パラメータよりも大きい値である場合(ス テップS2024の「YES」)、更新条件判断部203は、 音声判断パラメータを条件別音声判断パラメ ータの値に更新する(ステップS2025)。上記更 により、音声判断パラメータ(音量閾値(ON)、 音量閾値(OFF)、時間閾値)のうちの少なくとも 1つのパラメータが、大きな値に書き換えら るため、目的音の判定が厳格化されること なる。

 一方、制御対象の状態値が条件別マスク 件(制御対象の状態別マスク条件)を満たす 合であっても、条件別音声判断パラメータ 現在の音声判断パラメータよりも大きい値 ない場合(ステップS2024の「NO」)、音声判断 ラメータの更新は行われない。

 次に、更新条件判断部203は、制御対象の 態に応じて予め設定された条件別マスク時 (制御対象の状態別マスク時間)と、仮マス 時間との比較を行う(ステップS2026)。条件別 スク時間としては、例えば、制御対象401の 作開始後、精度の良い音源方向の検出が可 となる時間が設定される。

 条件別マスク時間が仮マスク時間よりも きい値である場合(ステップS2026の「YES」)、 更新条件判断部203は、仮マスク時間を条件別 マスク時間の値に更新する(ステップS2027)。 上により、仮マスク時間が各制御対象の状 を考慮した値に書き換えられるため、目的 の判定タイミングが最適化される。

 制御対象の状態値が条件別マスク条件(制 御対象の状態別マスク条件)を満たす場合で っても、条件別マスク時間が仮マスク時間 りも大きい値でない場合(ステップS2026の「NO 」)、仮マスク時間の更新は行われない。

 以上のように、すべての制御対象の状態 が条件別マスク条件(制御対象の状態別マス ク条件)を満たすか否かの確認が実行される( テップS2022~2028の「NO」)。ステップS2022の判 で、状態値が条件別マスク条件(制御対象の 状態別マスク条件)を満たしていない場合は ステップS2023~2027のマスクフラグ、音声判定 ラメータ、仮マスク時間の更新は行われな 。

 すべての制御対象の状態値が条件別マス 条件(制御対象の状態別マスク条件)を満た か否かの確認が完了すると(ステップS2028の YES」)、更新条件判断部203は、上記各制御対 の状態に応じて適宜更新されたマスクフラ 、音声判定パラメータ及び仮マスク時間を 力する(ステップS2029)。

 [音声判断処理]
 次に、上記した音声判断部204による音声判 処理について図面を参照して詳細に説明す 。

 図5は、図2のステップS3の音声判断処理の 流れを表したフローチャートである。図5を 照すると、音声判断部204は、まず、所定の 量が入力されている状態が継続しているか かを示す音量フラグの確認を行う(ステップS 301)。

 はじめは、音量フラグがFALSEであるため( テップS301の「NO」)、音声判断部204は、音量 値Vと音声判断パラメータの音量閾値(ON)との 較を行う(ステップS303)。

 音量値Vが音声判断パラメータの音量閾値 (ON)より大きい値でない場合(ステップS303の「 NO」)、音声判断部204は、音声判断フラグをFAL SEに設定し、出力する(ステップS308、S309)。

 一方、音量値Vが音声判断パラメータの音 量閾値(ON)より大きい値である場合(ステップS 303の「YES」)、音声判断部204は、音量フラグ TRUEに設定するとともに、音量ON時刻を現在 刻に更新する(ステップS304)。以上の音量フ グと音量ON時刻の更新により、次タイミング の音声判断処理において、ステップS301で音 フラグ=TRUEと判定され、所定の音量が所定時 間継続して入力されているか否かの判定が行 われる(ステップS301の「YES」~S307)。

 次タイミングにて、音量フラグがTRUEであ ることが確認されると(ステップS301の「YES」) 、音声判断部204は、音量値Vと音声判断パラ ータの音量閾値(OFF)との比較を行う(ステッ S302)。

 ここで、次タイミングの音量値Vが音声判 断パラメータの音量閾値(OFF)より大きい値で い場合(ステップS302の「NO」)、音声判断部20 4は、音量フラグをFALSEに戻すとともに(ステ プS305)、音声判断フラグをFALSEに設定し、出 する(ステップS308、S309)。

 一方、次タイミングの音量値Vが音声判断 パラメータの音量閾値(OFF)より大きい値であ 場合(ステップS302の「YES」)、音声判断部204 、ステップS304で更新した音量ON時刻からの 過時間が前記音声判断パラメータの時間閾 を超えているか否かの判定を行う(ステップ S306)。

 ここで、音量ON時刻からの経過時間が前 音声判断パラメータの時間閾値を超えてい い場合(ステップS306の「NO」)、音声判断部204 は、音声判断フラグをFALSEに設定し、出力す (ステップS308、S309)。

 一方、音量ON時刻からの経過時間が前記 声判断パラメータの時間閾値を超えている 合(ステップS306の「YES」)、音声判断部204は 音声判断フラグをTRUEに設定し、出力する(ス テップS307、S309)。

 このように制御対象の状態に応じて決定 れた音声判断パラメータによって、検出さ た音源方向が目的音のものであるか否かを 断する音声判断処理が行われる。

 なお、上記した図5のフローチャートの例 では、音声判断パラメータの音量閾値として 、ON、OFFの2つの閾値と、時間閾値とを用いる ものとして説明したが、上記音量閾値のいず れか一方又は時間閾値を省略することも可能 である。より簡単には、例えば、音量値が任 意に定める音量閾値よりも大きい値である場 合に音声判断フラグをTRUEに設定し、音量値 前記任意に定める音量閾値よりも大きい値 ない場合に音声判断フラグをFALSEに設定する 方式も採用することができる。同様に、時間 閾値のみを省略し、音量値が音量閾値(ON)よ も大きく、次タイミングの音量値が音量閾 (OFF)よりも大きい値である場合に音声判断フ ラグをTRUEとし、その他の場合、音声判断フ グをFALSEとするといった方式も採用すること ができる。

 [出力判断処理]
 次に、上記した出力判断部205による出力判 処理について図面を参照して詳細に説明す 。

 図6は、図2のステップS4の出力判断処理の 流れを表したフローチャートである。図6を 照すると、出力判断部205は、まず、前回の 力時刻からの経過時間が、所定の出力マス 時間を超えているか否かを確認する(ステッ S401)。

 ここで、前回の出力時刻からの経過時間 前記出力マスク時間を超えている場合(ステ ップS401の「YES」)、出力判断部205は、出力時 を現在時刻に更新し(ステップS402)、音源方 計算部201から出力された方向値θを音源方 検出結果として出力する(ステップS403)。

 一方、前回の出力時刻からの経過時間が 記出力マスク時間を超えていない場合(ステ ップS401の「NO」)、音源方向検出結果の出力 行われない(ステップS404)。

 以上説明したように、本発明の第1の実施 例に係る音源方向検出装置によれば、制御対 象部4がノイズを発生させる状態である場合 、誤った音源方向が検出されることを回避 ることが可能となる。その理由は、受音部1 より取得された受音信号から音源の方向値 と音量値Vを算出し、制御対象の状態値に応 て、目的音であるか否かの判定をするか否 、指標(音量値V)と比較する音声判断パラメ タやマスク時間を決定し、これらから目的 であると判定されたときに、音源方向の検 結果を出力するよう構成したことにある。

 また、本発明の第1の実施例に係る音源方 向検出装置によれば、目的音が継続する場合 に、音源方向検出結果の出力が制限され、制 御部の処理負荷を軽減することが可能となる 。その理由は、音源方向検出結果の出力を行 った後に、出力マスク時間が経過するまで次 の出力を行わないよう構成したことにある。

 なお、上記した実施例では、受音手段の 数Xを2とした構成としているが、受音手段 2以上の任意の個数とすることもできる。ま 、2個の受音手段を一対とした受音手段の組 を複数組用意し、前記各受音手段の組毎に算 出した方向値から、多数決処理等により一つ の方向値を算出して出力する構成とすること も可能である。

 制御対象の個数Yについても同様であり、 2以上の任意の個数Y個の制御対象について、 れぞれ条件別マスク条件、条件別音声判断 ラメータ、条件別マスク時間を設定すると もに、各状態値を取得し、図4のマスク判断 処理におけるステップS2022からS2028の処理をY 繰り返すことにより、適切なマスク設定及 音声判断パラメータの設定を行うことが可 となる。

 また、先にも述べたとおり、指標として 、上記した音量値Vのほか、すべての受音手 段が生成する信号の時刻kにおける時間Lの平 値、最大値、または、どれか一つの受音手 の生成する信号の値等を用いることが可能 ある。

 また、図2のフローチャートでは、更新条 件判断及び出力判断の結果がFALSEの場合に(ス テップS2~S4の「FALSE」)、一律にステップS1に り、再度、音源方向の計算を行うものとし いるが、更新条件判断の結果がFALSEの場合( テップS2の「FALSE」)及び出力判断の結果がFAL SEの場合(ステップS4の「FALSE」)は、音源方向 算部201が方向値の算出を省略し、音量値の 算出するようにすることも可能である。

[実施例2]
 続いて、上記した第1の実施例の音声判断処 理に変更を加えた本発明の第2の実施例につ て説明する。本発明の第2の実施例は、上記 た第1の実施例の音源方向検出部2の各部の 作に変更を加えたほかは、同様であるので 以下、その相違点を中心に説明する。以下 本実施例でも、受音手段の個数X及び制御対 の個数YをそれぞれX=2、Y=2であるものとして 説明する。

 再度、図1を参照すると、本実施例に係る 音源方向検出装置の音源方向検出部2の音源 向計算部201は、受音手段101、102から出力さ た信号X1(k)、X2(k)から、方向値θを算出する ともに、指標として音量値に代り音量信号V (k)を算出し出力する。

 音量信号V’(k)は、次式のとおり、前記受 音手段101、102が生成する信号X1(k)、X2(k)の時 kにおける平均信号e(k)で表される。

 上式では、信号X1(k)と信号X2(k)の平均を用 いているが、信号X1(k)と信号X2(k)の大きい方 または、どちらか一方のみを音量信号V’(k) してもよい。

 更新条件判断部203は、音声判断パラメー の値として、前記音量信号を用いた目的音 断を行うための音声判断パラメータを出力 る。第1の実施例と同様に、音声判断パラメ ータは制御対象の状態に応じて、例えば、音 量信号V’(k)と特定の参照信号R(k)の相関値が 定の値を上回ったことを検出するための相 閾値が設定される。その他は、第1の実施例 の更新条件判断部203と同様であるため説明は 省略する。

 上記参照信号R(k)としては、目的音源が発 する音信号(以下、目的信号と記す)の特徴を つ信号であり、音量信号V’(k)と目的信号と の相関値により類似度が求められる信号が用 いられる。例えば、人の音声信号等を用いる ことができる。また、目的音の音信号の周波 数パターン等のパターンを表すものとしても よい。

 音声判断部204は、音源方向計算部201が生 する音量信号V’(k)と、更新条件判断部203が 生成する更新判断結果と音声判断パラメータ から、音声判断結果を生成し、出力判断部205 に出力する。本実施例においても、音声判断 結果は、音源方向の出力要否を、TRUE、FALSEの 2値で示す音声判断フラグによって出力され ものとする。

 [音声判断処理2]
 次に、上記した本発明の第2の実施例の音声 判断部204による音声判断処理について図面を 参照して詳細に説明する。

 図7は、本発明の第2の実施例の音声判断 204による音声判断処理の流れを表したフロ チャートであり、図2のステップS3に相当す 。図7を参照すると、音声判断部204は、まず 音量信号V’(k)と予め設定された参照信号R(k )との相互相関値を算出する(ステップS311)。

 次に、音声判断部204は、算出した相互相 値と音声判断パラメータとして設定された 関閾値とを比較する(ステップS312)。

 ここで、前記相関値が前記音声判断パラ ータの相関閾値より大きい値である場合(ス テップS312の「YES」)、音声判断部204は、音声 断フラグをTRUEに設定し、出力する(ステッ S313、S315)。

 一方、前記相関値が音声判断パラメータ 相関閾値より大きい値でない場合(ステップ S312の「NO」)、音声判断部204は、音声判断フ グをFALSEに設定し、出力する(ステップS314、S 315)。

 以上のような構成及び動作により、本発 の第2の実施例に係る音源方向検出装置にお いても、制御対象部4がノイズを発生させる 態である場合に、誤った音源方向検出を行 ことを回避することが可能となる。

 なお、本実施の形態では、参照信号R(k)は 、目的信号の特徴を持つ信号としたが、前記 参照信号R(k)を、目的音源が発する音以外の 信号の特徴を持つ信号(例えば、制御対象特 のノイズの特徴を持つ信号)とし、前記ステ ップS313と前記ステップS314における、音声判 フラグのTRUE/FALSEの設定値を入れ替えた構成 としてもよい。

[実施例3]
 続いて、上記した第1の実施例の出力判断処 理に変更を加え、方向不定の場合も音源方向 検出結果を出力するようにした本発明の第3 実施例について説明する。本発明の第3の実 例は、上記した第1の実施例の音源方向検出 部2の各部の動作に変更を加えたほかは、同 であるので、以下、その相違点を中心に説 する。

 再度、図1を参照すると、本実施例に係る 音源方向検出装置の音源方向検出部2の音源 向計算部201は、受音手段101、102から出力さ た信号X1(k)、X2(k)から、方向を特定できる場 は方向値θを出力し、方向を特定できない 合は、方向不定値を出力する。前記方向を 定できるか否かは、受音手段101、102から入 される信号X1(k)、X2(k)の相互相関の最大値が 定の閾値以下であるか否かによって判定さ 、信号X1(k)、X2(k)の相互相関の最大値が所定 の閾値以下である場合は、方向値θに代えて 向不定値が出力される。

 出力判断部205は、音源方向計算部201が生 する方向値θ又は方向不定値と、音声判断 204から出力された音声判断結果(現在値、前 値)から、音源方向検出結果を生成し、制御 部3に出力する。

 その他、状態監視部202、更新条件判断部2 03、音声判断部204の構成及び動作は、上記し 第1の実施形態と同様であるので省略する。

 [出力判断処理2]
 次に、上記した本発明の第3の実施例の出力 判断部205による出力判断処理について図面を 参照して詳細に説明する。

 図8は、本発明の第3の実施例の出力判断 205による出力判断処理の流れを表したフロ チャートであり、図2のステップS4に相当す 。図8を参照すると、出力判断部205は、まず 前回の出力時刻からの経過時間が、所定の 力マスク時間を超えているか否かを確認す (ステップS411)。

 ここで、前回の出力時刻からの経過時間 前記出力マスク時間を超えている場合(ステ ップS411の「YES」)、出力判断部205は、音声判 部204から出力された音声判断結果がTRUE/FALSE のいずれであるかを確認する(ステップS412)。

 ステップS412にて音声判断結果がTRUEであ た場合(ステップS412の「YES」)、出力判断部20 5は、更に、音声判断部204から出力された前 の音声判断結果がTRUE/FALSEのいずれであった を確認する(ステップS413)。

 ステップS413にて前回の音声判断結果がTRU Eであった場合(ステップS413の「YES」)、出力 断部205は、音源方向計算部201からの出力が 向値であるか方向不定値であるかを確認す (ステップS415)。

 ステップS413にて前回の音声判断結果がFAL SEであった場合(ステップS413の「NO」)、出力 断部205は、音声ON時刻を現在時刻に更新し、 出力回数を0に設定した上で(ステップS414)、 源方向計算部201からの出力が方向値である 方向不定値であるかを確認する(ステップS415 )。

 ステップS415にて音源方向計算部201からの 出力が方向値であった場合(ステップS415の「Y ES」)、出力判断部205は、出力時刻を現在時刻 に更新し、前記出力回数に1を加算し(ステッ S416)、音源方向計算部201から出力された方 値θを音源方向検出結果として出力する(ス ップS417)。

 ステップS415にて音源方向計算部201からの 出力が方向不定値であった場合(ステップS415 「NO」)、出力判断部205は、音源方向検出結 の出力を行わない(ステップS418)。

 ステップS412にて音声判断結果がFALSEであ た場合(ステップS412の「NO」)、出力判断部20 5は、音声判断部204から出力された前回の音 判断結果がTRUE/FALSEのいずれであったかを確 する(ステップS419)。

 ステップS419にて前回の音声判断結果がTRU Eであった場合(ステップS419の「YES」)、出力 断部205は、ステップS414で更新した音声ON時 からの経過時間が予め定める不定判断時間 超えているか否かの判定を行う(ステップS420 )。

 ステップS420にて音声ON時刻からの経過時 が前記不定判断時間を超えている場合(ステ ップS420の「YES」)、出力判断部205は、前記出 回数が0であるか否かを確認する(ステップS4 21)。

 ステップS421にて出力回数が0であった場 (ステップS421の「YES」)、出力判断部205は、 源方向検出結果として、方向不定である旨 出力する(ステップS422)。

 ステップS411にて出力マスク時間を超えて いない場合(ステップS411の「NO」)、ステップS 419にて前回の音声判断結果がFALSEであった場 (ステップS419の「NO」)、ステップS420にて音 ON時刻からの経過時間が前記不定判断時間 超えていない場合(ステップS420の「NO」)、ス テップS421にて出力回数が0でなかった場合(ス テップS421の「NO」)はいずれも、出力判断部20 5は、音源方向検出結果の出力を行わない(ス ップS418)。

 以上のような構成及び動作により、本発 の第3の実施例に係る音源方向検出装置にお いては、上記した第1、第2の実施例の効果に えて、算出した方向値の信頼性が低い場合 、方向不定値を出力することが可能となる

 またその際に、出力判断部205は、前記方 不定値が不定判断時間以上継続したときの 、方向不定として音源方向検出結果を出力 るので、検出結果の信頼性が低い場合は、 源方向検出結果の出力が制限され、制御部3 の処理負荷を軽減することが可能となる。

 なお、本実施例においては、音源方向計 部201が方向不定値を出力し、出力判断部205 これを制御部3に出力するものとして説明し たが、方向不定値が出力された場合には、出 力判断部205は音源方向検出結果を出力しない 構成とすることも可能である。

[実施例4]
 続いて、本発明をユーザとのインタラクシ ンを行うロボット装置に適用した本発明の 4の実施例について説明する。

 図9は、本発明の第4の実施例に係るロボッ 装置の構成を表したブロック図である。
図9を参照すると、本発明の第4の実施例に係 ロボット装置は、ロボット頭部1001と、ロボ ット胴体部1002と、指向性マイクロホン1003と 音声認識回路1004と、マイクロホン1101と、 イクロホン1102と、音源方向検出回路1200と、 ロボット制御回路1300と、上記した第1の実施 の制御対象401~40Yに相当するモータ1401と、 ピーカ1402と、プッシュスイッチ1403と、接触 センサ1404と、を備える。

 音源方向検出回路1200は、音源方向計算回 路1201と、ロボット状態監視回路1202と、更新 件判断回路1203と、音声判断回路1204と、出 判断回路1205と、を備えて構成される。音源 向計算回路1201、ロボット状態監視回路1202 更新条件判断回路1203、音声判断回路1204、出 力判断回路1205は、上記した第1の実施例の音 方向検出部2の音源方向計算部201と、状態監 視部202と、更新条件判断部203と、音声判断部 204と、出力判断部205とにそれぞれ相当する。

 ロボット頭部1001は、ロボット胴体部1002 対して相対動作可能に設置される。

 指向性マイクロホン1003は、ロボット頭部 1001に設置され、到来する音響信号を音響-電 変換した信号X0(k)を出力する。

 音声認識回路1004は、前記信号X0(k)を入力 して、音声認識結果を出力する。

 マイクロホン1101は、到来する音響信号を 音響-電気変換した信号X1(k)を出力する。マイ クロホン1102は、到来する音響信号を音響-電 変換した信号X2(k)を出力する。マイクロホ 1101、1102は、上記した第1の実施例の受音手 101~10Xにそれぞれ相当する。

 音源方向検出回路1200は、前記信号X1(k)、X 2(k)と、モータ1401が生成する回転速度信号M(k) と、スピーカ1402が生成する再生音量信号S(k) 、プッシュスイッチ1403が生成するスイッチ 状態信号P(k)と、接触センサ1404が生成する接 状態信号T(k)と、を入力として、音源方向検 出結果を出力する。

 ロボット制御回路1300は、前記音声認識結 果と、前記音源方向検出結果を入力とし、ロ ボット装置の行動制御信号を出力する。ロボ ット制御回路1300は、上記した第1の実施例の 御部3に相当する。

 行動制御信号とは、例えば、モータ1401の 駆動信号、スピーカ1402の音声出力信号等の 制御対象を制御するための信号である。

 モータ1401は、前記行動制御信号(駆動信 )を入力とし、前記ロボット頭部1001を前記ロ ボット胴体部1002に対して相対動作させ、回 速度信号M(k)を出力する。

 スピーカ1402は、前記行動制御信号(音声 力信号)を入力とし、音を発生し、再生音量 号S(k)を出力する。

 プッシュスイッチ1403は、スイッチが押さ れているか否かを示すスイッチ状態信号P(k) 出力する。

 スイッチ状態信号P(k)は、以下のように表さ れる。
P(k)=0 (スイッチが押されていないとき)
P(k)=1 (スイッチが押されているとき)

 接触センサ1404は、人または物が接触して いるか否かを示す接触状態信号T(k)を出力す 。

 接触状態信号T(k)は、以下のように表される 。
T(k)=0 (接触していないとき)
T(k)=1 (接触しているとき)

 音源方向検出回路1200の各構成部について 説明する。音源方向計算回路1201は、前記信 X1(k)、X2(k)を入力とし、方向信号θ(k)と音量 号V(k)を出力する。

 ロボット状態監視回路1202は、モータ1401 生成する回転速度信号M(k)と、スピーカ1402が 生成する再生音量信号S(k)と、プッシュスイ チ1403が生成するスイッチ状態信号P(k)と、接 触センサ1404が生成する接触状態信号T(k)と、 入力として、モータ状態信号Y1(k)と、スピ カ状態信号Y2(k)と、プッシュスイッチ状態信 号Y3(k)と、接触センサ状態信号Y4(k)と、を出 する。

 モータ状態信号Y1(k)は、以下のように表さ る。ただし、α、βは定数である。
Y1(K)=αM(k)+β

 スピーカ出力信号Y2(k)は、以下のように表 れる。ただし、γは定数である。
Y2(k)=0 (S(k)<γのとき)
Y2(k)=1 (S(k)≧γのとき)

 プッシュスイッチ状態信号Y3(k)、接触セ サ状態信号Y4(k)は、それぞれスイッチ状態信 号P(k)、接触状態信号T(k)をそのまま用いるこ ができる。

 更新条件判断回路1203は、前記モータ状態 信号Y1(k)と、前記スピーカ状態信号Y2(k)と、 記プッシュスイッチ状態信号Y3(k)と、接触セ ンサ状態信号Y4(k)と、を入力とし、更新判断 果と音声判断パラメータを出力する。

 音声判断パラメータとしては、上記した 1の実施例と同様に、ON音量閾値Th_onと、OFF 量閾値Th_offと、時間閾値Th_timeとの3つの閾値 が設定される。

 前記ON音量閾値Th_onと、OFF音量閾値Th_offと、 時間閾値Th_timeと、仮マスク時間T_maskは、予 定められた以下の値に設定される。
Th_on=Th_on_Normal
Th_off=Th_off_Normal
Th_time=Th_time_Normal
T_mask=0

 但し、σ、Th_on_Normal、Th_off_Normal、Th_time_No rmal、T_mask_Normalは、定数である。また、Th_on_N ormal、Th_off_Normalは前記音量信号V(k)が取りう 範囲内の値であり、Th_time_Normal、T_mask_Normal 正の値である。

 更新条件判断回路1203においては、前記ON音 閾値Th_onと、OFF音量閾値Th_offと、時間閾値Th _timeと、仮マスク時間T_maskは、前記モータ状 信号Y1(k)と、前記スピーカ状態信号Y2(k)と、 前記プッシュスイッチ状態信号Y3(k)と、接触 ンサ状態信号Y4(k)との各信号がそれぞれ以 の条件を満たす時に更新される。
Y1(k)>M_lo
Y2(k)=1
Y3(k)=1
Y4(k)=1

 ただし、M_loは定数であり、前記回転速度 信号M(k)が取りうる範囲に応じて決定されるY1 (k)が取りうる範囲内の値である。

 例えば、Y1(K)>M_loを満たすとき、前記ON音 閾値Th_onと、OFF音量閾値Th_offと、時間閾値Th _timeと、仮マスク時間T_maskは、それぞれ以下 値に更新される。
Th_on=Y1(k)+σ (M_hi>Y1(k)>M_loのとき)
Th_on=Th_on_M (Y1(k)≧M_hiのとき)
Th_off=Y1(k)-σ (M_hi>Y1(k)>M_loのとき)
Th_off=Th_off_M (Y1(k)≧M_hiのとき)
Th_time=Th_time_M
T_mask=T_mask_M

 ただし、σ、Th_on_M、Th_off_M、Th_time_M、T_mas k_Mは、定数である。また、Th_on_M、Th_off_Mは前 記音量信号V(k)が取りうる範囲内の値であり Th_time_M、T_mask_Mは正の値である。

 また、M_hiはM_hi>M_loを満たす定数であり 、前記回転速度信号M(k)が取りうる範囲に応 て決定されるY1(k)が取りうる範囲内の値であ る。

 また、Y2(k)=1を満たすとき、前記ON音量閾値T h_onと、OFF音量閾値Th_offと、時間閾値Th_timeと 仮マスク時間T_maskは、それぞれ以下の値に 新される。
Th_on=Th_on_S
Th_off=Th_off_S
Th_time=Th_time_S
T_mask=T_mask_S

 ただし、Th_on_S、Th_off_S、Th_time_S、T_mask_S 定数である。Th_on_S、Th_off_Sは前記音量信号V( k)が取りうる範囲内の値であり、Th_time_S、T_ma sk_Sは正の値である。

 また、Y3(k)=1を満たすとき、前記ON音量閾値T h_onと、OFF音量閾値Th_offと、時間閾値Th_timeと 仮マスク時間T_maskは、それぞれ以下の値に 新される。
Th_on=Th_on_P
Th_off=Th_off_P
Th_time=Th_time_P
T_mask=T_mask_P

 ただし、Th_on_P、Th_off_P、Th_time_P、T_mask_P 定数である。Th_on_P、Th_off_Pは前記音量信号V( k)が取りうる範囲内の値であり、Th_time_P、T_ma sk_Pは正の値である。

 また、Y4(k)=1を満たすとき、前記ON音量閾値T h_onと、OFF音量閾値Th_offと、時間閾値Th_timeと 仮マスク時間T_maskは、それぞれ以下の値に 新される。
Th_on=Th_on_T
Th_off=Th_off_T
Th_time=Th_time_T
T_mask=T_mask_T

 ただし、Th_on_T、Th_off_T、Th_time_T、T_mask_T 定数である。Th_on_T、Th_off_Tは前記音量信号V( k)が取りうる範囲内の値であり、Th_time_T、T_ma sk_Tは正の値である。

 上記Y1(k)>M_lo、Y2(k)=1、Y3(k)=1、Y4(k)=1の条 件を複数満たす時は、第1の実施例の図4にて 明したように、前記ON音量閾値Th_onと、OFF音 量閾値Th_offと、時間閾値Th_timeと、仮マスク 間T_maskは、それぞれ、条件を満たしたもの 中の最大値に更新される。

 音声判断回路1204は、前記音量信号V(k)と 前記更新判断結果と、前記音声判断パラメ タと、を入力とし、音声判断結果を出力す 。本実施例においても、音声判断結果は、 源方向の出力要否を、TRUE、FALSEの2値で示す 声判断フラグによって出力されるものとす 。

 出力判断回路1205は、前記方向信号θ(k)と 前記音声判断結果を入力とし、音源方向検 結果θfinalを出力する。

 以上の構成よりなるロボット装置は、上 した第1の実施例で図2~図6を参照して説明し たように動作する。ロボット装置が有するモ ータの駆動音、スピーカの発生音、プッシュ スイッチの押下音、接触センサへの接触音が 発生した場合は、音源方向検出のための音声 判断の閾値の変更と、マスク処理を行うこと により、ロボット装置が発するノイズ音の影 響による誤検出が回避される。

 更に、本実施例に係るロボット装置は、 ーザが発話した時にはタイミングが遅れる となく検出結果を出力し、ユーザが発話を けた時には処理の負荷を軽減することが可 となる。

 また、音源方向検出結果の方向に指向性 イクロホン1003の指向性の方向を一致させる ようにロボット頭部を動作させることにより 、ユーザの音声に対する音声認識率が向上し 、ロボット装置の正確な動作を実現する。

 なお、本実施例における、指向性マイク ホン1003と音声認識回路1004を、例えばカメ などの撮像装置に置き換えることにより、 話しているユーザの正確な撮像を実現する とが可能であり、撮像した画像信号を画像 識回路に出力することにより、発話してい ユーザを認識するロボット装置も実現する とが可能である。

 以上、本発明の好適な実施形態を説明した 、本発明の権利範囲は、上記した実施例に って制限されるものではない。例えば、ユ ザとインタラクションを行うロボット装置 他に、監視カメラ、テレビ会議システム等 音の方向に応じてカメラやマイクロホンの きを駆動する各種音源方向検出装置全般に 用することが可能である。ユーザとのイン ラクション性や、音源方向の検出後に行わ る音声認識処理やユーザの撮像処理の精度 上にも貢献することが可能となる。
 以上の記載は、実施例に基づいて行ったが 本発明は、上記実施例に限定されるもので ない。
 本発明の全開示(請求の範囲を含む)の枠内 おいて、更にその基本的技術思想に基づい 、実施態様ないし実施例の変更・調整が可 である。また本発明の請求の範囲(クレーム) の枠内において、種々開示要素の多様な組合 せ・置換ないし選択が可能である。
 本発明の更なる課題・目的及び展開形態は クレームを含む本発明の全開示事項からも 明らかにされる。