Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR PROCESSING SOUND SIGNALS FOR A COMMUNICATION TERMINAL AND COMMUNICATION TERMINAL IMPLEMENTING SAID METHOD
Document Type and Number:
WIPO Patent Application WO/2006/003340
Kind Code:
A3
Abstract:
The invention concerns a method for processing voice signals (320, 322, 324) for a communication terminal (330) using voice recognition means (302) comparing said voice signals to data stored in a base (304) so as to identify the data corresponding to said signals, said identified data being transmitted to management means (312) for triggering an action. According to the invention, said method is characterized in that since the voice signals can be provided by different sound acquisition systems (305, 307, 309), separate voice recognition means are used for each acquiring system.

Inventors:
PARISEL ARNAUD (FR)
LEJAY FREDERIC (FR)
Application Number:
PCT/FR2005/050450
Publication Date:
September 13, 2007
Filing Date:
June 16, 2005
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
CIT ALCATEL (FR)
PARISEL ARNAUD (FR)
LEJAY FREDERIC (FR)
International Classes:
G10L15/28
Foreign References:
US5970446A1999-10-19
US6032115A2000-02-29
Other References:
ANASTASAKOS A ET AL: "Adaptation to new microphones using tied-mixture normalization", ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 1994. ICASSP-94., 1994 IEEE INTERNATIONAL CONFERENCE ON ADELAIDE, SA, AUSTRALIA 19-22 APRIL 1994, NEW YORK, NY, USA,IEEE, vol. i, 19 April 1994 (1994-04-19), pages I - 433, XP010133502, ISBN: 0-7803-1775-0
SMOLDERS J ET AL: "On the importance of the microphone position for speech recognition in the car", ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 1994. ICASSP-94., 1994 IEEE INTERNATIONAL CONFERENCE ON ADELAIDE, SA, AUSTRALIA 19-22 APRIL 1994, NEW YORK, NY, USA,IEEE, vol. i, 19 April 1994 (1994-04-19), pages I - 429, XP010133503, ISBN: 0-7803-1775-0
Attorney, Agent or Firm:
VIGAND, Régis (54 rue La Boétie, PARIS, FR)
Download PDF:
Claims:
REVENDICATIONS
1. Procédé de traitement de signaux vocaux (320, 322, 324, 428, 430, 432, 618, 624) pour un terminal de communication (300, 400, 600) mettant en oeuvre des moyens (302, 402, 602) de reconnaissance vocale comparant ces signaux vocaux à des données stockées dans une base (304, 404, 614) afin d'identifier les données correspondant à ces signaux, ces données identifiées étant transmises à des moyens (312, 412, 616) de gestion pour déclencher une action, caractérisé en ce que, les signaux vocaux pouvant être fournis par différents systèmes (305, 307, 309, 405, 407, 409, 607, 609) d'acquisition sonore, on utilise des moyens de reconnaissance vocale distincts pour chaque système d'acquisition. 2. Procédé selon la revendication 1 caractérisé en ce qu'on inclue dans la base (304) de données des sous-bases (314, 316, 318) indépendantes, chaque sous- base (314, 316, 318) étant associée à un système (305, 307, 309) d'acquisition sonore de telle sorte que les moyens de reconnaissance vocale utilisent prioritairement la sous-base (314, 316, 318) associée au système (305, 307, 309) d'acquisition sonore utilisé pour effectuer la comparaison. 3. Procédé selon la revendication 2 caractérisé en ce que la comparaison entre un signal (320, 322, 324) et les données stockées est effectuée successivement pour chacune des sous-bases (314, 316, 318) jusqu'à ce qu'un taux de reconnaissance requis soit atteint par cette comparaison. 4. Procédé selon la revendication 2 ou 3 caractérisé en ce qu'on effectue une procédure d'apprentissage de la reconnaissance vocale avec différents systèmes (305, 307, 309) de reconnaissance vocale de façon à générer les sous-bases (314, 316, 318) spécifiques à chaque système de reconnaissance vocale. 5. Procédé selon la revendication 1 caractérisé en ce qu'on intègre dans les moyens de reconnaissance vocale du terminal de communication au moins deux filtres (414, 416, 418) de signaux sonores, chacun des filtres étant spécifique à un système (405, 407, 409) d'acquisition sonore du terminal de communication. 6. Procédé selon la revendication 5 caractérisé en ce que les filtres (414, 416, 418) ont des caractéristiques de filtrage prédéterminées. 7. Procédé selon la revendication 5 ou 6 caractérisé en ce que les signaux (422, 424, 426) délivrés par les filtres (414, 416, 418) sont traités de façon identiques par les moyens de reconnaissance vocale vis-à-vis de la base (404) de données. 8. Procédé selon la revendication 1 caractérisé en ce que les moyens de reconnaissance vocale contiennent des moyens (604) de filtrage fixe associés à un premier système (607) de reconnaissance vocale et des moyens (612) de filtrage dynamique associés à un second système (609) de filtrage, ces moyens (612) de filtrage dynamique détectant les caractéristiques du filtrage fixe de façon à délivré un signal analogue au signal délivré par ce filtrage fixe. 9. Terminal de communication (300, 400, 600) traitant des signaux vocaux (320, 322, 324, 428, 430, 432, 618, 624) à l'aide de moyens de reconnaissance vocale comparant ces signaux vocaux à des données stockées dans une base (304, 404, 614) afin d'identifier les données correspondant à ces signaux, ces données identifiées étant transmises à des moyens (312, 412, 616) de gestion pour déclencher une action, caractérisé en ce que, les signaux vocaux pouvant être fournis par différents systèmes (305, 307, 309, 405, 407, 409, 607, 609) d'acquisition sonore, il comprend des moyens de reconnaissance vocale distincts pour chaque système d'acquisition. 10. Terminal de communication selon la revendication 9, caractérisé en ce que la base de données (304, 404, 614) est située à l'extérieur du terminal de communication dans un serveur (700) . 1 1. Terminal de communication selon la revendication 9 caractérisé en ce qu'il comprend, dans la base (304, 404, 614) de données, des sous-bases (314, 316, 318) indépendantes, chaque sous-base étant associée à un système (305, 307, 309) d'acquisition sonore de telle sorte que les moyens de reconnaissance vocale utilise prioritairement la sous-base associée au système d'acquisition sonore utilisé par l'utilisateur pour effectuer la comparaison. 12. Terminal de communication selon la revendication 1 1 caractérisé en ce qu'il comprend des moyens pour effectuer la comparaison entre un signal (320, 322, 324) et les données stockées de façon successive pour chacune des sous-bases jusqu'à ce qu'un taux de reconnaissance requis soit atteint par cette comparaison. 13. Terminal de communication selon la revendication 1 1 ou 12 caractérisé en ce qu'il comprend des moyens pour effectuer une procédure d'apprentissage de la reconnaissance vocale avec différents systèmes (305, 307, 309) de reconnaissance vocale de façon à générer les sous-bases (314, 316, 318) spécifiques à chaque système de reconnaissance vocale. 14. Terminal de communication selon la revendication 9 caractérisé en ce qu'il comprend dans les moyens de reconnaissance vocale du terminal de communication au moins deux filtres (414, 416, 418) de signaux sonores, chacun des filtres étant spécifique à un système (405, 407, 409) d'acquisition sonore du terminal de communication. 15. Terminal de communication selon la revendication 14 caractérisé en ce que les filtres (414, 416, 418) ont des caractéristiques de filtrage prédéterminées et fixes. 16. Terminal de communication selon la revendication 14 ou 15 caractérisé en ce qu'il comprend des moyens pour que les signaux filtrés (422, 424, 426) soient traités de façon identique par les moyens de reconnaissance vocal vis-à-vis de la base (404) de données. 17. Terminal de communication selon la revendication 9 caractérisé en ce que les moyens de reconnaissance vocale contiennent des moyens de filtrage fixe (604) associés à un premier système (607) de reconnaissance vocale et des moyens (612) de filtrage dynamiques associés à un second système (609) de filtrage, ces moyens 612 de filtrage dynamiques détectant les caractéristiques du filtrage fixe de façon à délivré un signal analogue au signal délivré par ce filtrage fixe. 18. Terminal de communication selon l'une des revendications 9 à 17 caractérisé en ce qu'un de ces systèmes d'acquisition sonore comprend un microphone. 19. Terminal de communication selon l'une des revendication 9 à 18 caractérisé en ce qu'un de ces systèmes d'acquisition de données est un kit mains-libres piéton, un kit mains-libres pour un véhicule ou un système de reconnaissance intégré au terminal de communication.
Description:
PROCEDE DE TRAITEMENT DE SIGNAUX SONORES POUR UN TERMINAL DE COMMUNICATION ET TERMINAL DE COMMUNICATION METTANT EN œUVRE CE PROCEDE.

La présente invention se rapporte à un procédé de traitement de signaux sonores pour un terminal de communication et à un terminal de communication mettant en œuvre ce procédé, notamment pour utiliser ce terminal de communication avec différents systèmes d'acquisition sonore. Cette invention peut notamment être utilisée dans la téléphonie mobile. On connaît des terminaux de communication mettant en oeuvre des fonctions nécessitant une reconnaissance vocale pour, par exemple, déclencher un appel par la prononciation du nom de l'appelé ou pour mettre en route certaines fonctions telles que l'affichage d'un calendrier. Les moyens de reconnaissance vocale, notamment les moyens de traitement et de stockage de l'information, sont limités dans un terminal de communication cause des restrictions en poids, en coût et en encombrement que doivent respecter les concepteurs de ces terminaux de communication, notamment dans le cas des terminaux de communication portables. Par ailleurs, un même terminal de communication, et donc un même ensemble de moyens de reconnaissance vocale, peut être utilisé avec différents systèmes d'acquisition sonore, incluant notamment différents microphones et/ou moyens de connexion au terminal de communication, comme détaillé ci-dessous. La figure 1 représente schématiquement le fonctionnement de la reconnaissance vocale dans un exemple de l'art antérieur. Un terminal de communication 100, incluant des moyens 108 internes de reconnaissance vocale, utilise alternativement différents systèmes d'acquisition sonore : un système 101 incluant notamment un microphone 102 interne, un système 103 d'un kit mains-libres piéton incluant notamment un microphone 104 externe au terminal de communication 100 ou un système 105 d'un kit mains-libres de voiture incluant notamment un microphone 106 externe au terminal de communication 100. Ces moyens de reconnaissance comparent des paramètres extraits d'un signal 1 14, 1 16 ou 1 18, transmis respectivement par un des systèmes 101 , 103 ou 105, avec des paramètres contenus dans une base de données 1 10 interne au terminal de communication et représentant chacun une donnée, comme par exemple un nom, ou une fonction. A cet effet, cette opération met généralement en oeuvre une note de reconnaissance, ou 'score' en anglais, pour chaque comparaison et choisit l'ensemble des paramètres mémorisé ayant la meilleure note de reconnaissance lorsque celle-ci dépasse un certain seuil de validation. Si un ensemble de paramètres stockés est suffisamment proche des paramètres extraits du signal reçu, alors cet ensemble est transmis à des moyens 1 12 de gestion du terminal de communication pour réaliser une opération, telle que d'effectuer un appel. Cette proximité est aussi appelée taux de reconnaissance vocale d'un terminal de communication. Il est admis que ce taux de succès doit être supérieur à 95% pour que le procédé de reconnaissance vocale soit valable. La base de données 1 10 se construit notamment par un enregistrement en usine de séquences dites multi-locuteurs car, pour une même séquence, elles intègrent des différences sonores potentielles entre différentes personnes. Elle peut aussi se construire par une procédure dite d'apprentissage qui implique que le propre utilisateur associe un son à une donnée ou une fonction du terminal de communication par l'intermédiaire de fonctions propres au terminal de communication 100. Selon une constatation propre à l'invention, il apparaît que l'utilisateur peut utiliser le terminal de communication 100 avec différents systèmes 101 , 103 ou 105 d'acquisition sonore de telle sorte que chacun de ces systèmes introduit sa propre distorsion au signal émis par l'utilisateur 102 (notamment sa distorsion harmonique, sa distorsion propre des volumes ou sa sensibilité aux bruits ambiants et aux échos). De ce fait, le taux de reconnaissance vocale d'un terminal de communication est souvent jugé insuffisant pour que l'utilisateur utilise la reconnaissance vocale de son terminal de communication si ce terminal de communication est utilisé avec un système d'acquisition du signal sonore différent de celui avec lequel la procédure d'apprentissage a été réalisée ou sur la base duquel les pré-enregistrements multi-locuteurs ont été réalisés. C'est pourquoi l'invention concerne un procédé de traitement de signaux vocaux pour un terminal de communication mettant en oeuvre des moyens de reconnaissance vocale comparant ces signaux vocaux à des données stockées dans une base afin d'identifier les données correspondant à ces signaux, ces données identifiées étant transmises à des moyens de gestion pour déclencher une action, caractérisé en ce que, les signaux vocaux pouvant être fournis par différents systèmes d'acquisition sonore, on utilise des moyens de reconnaissance vocale distincts pour chaque système d'acquisition. Grâce à cette invention, le taux de reconnaissance vocale est rendu satisfaisant pour différents systèmes d'acquisitions sonores du terminal de communication puisque le traitement des signaux est adapté à chaque système d'acquisition. Un utilisateur peut donc utiliser de façon satisfaisante la fonction de reconnaissance vocale avec l'ensemble des systèmes d'acquisition sonore pouvant être utilisés vis-à-vis de son terminal de communication. Dans un mode de réalisation, on inclue dans la base de données des sous- bases indépendantes, chaque sous-base étant associée à un système d'acquisition sonore de telle sorte que les moyens de reconnaissance vocale utilise prioritairement la sous-base associée au système d'acquisition sonore utilisé par l'utilisateur pour effectuer la comparaison. Selon un mode de réalisation, la comparaison entre un signal et les données stockées est effectuée successivement pour chacune des sous-bases jusqu'à ce qu'un taux de reconnaissance requis soit atteint par cette comparaison. Dans un mode de réalisation, on effectue une procédure d'apprentissage de la reconnaissance vocale avec différents systèmes de reconnaissance vocale de façon à générer les sous-bases spécifiques à chaque système de reconnaissance vocale. Selon un mode de réalisation, on intègre dans les moyens de reconnaissance vocale du terminal de communication au moins deux filtres de signaux sonores, chacun des filtres étant spécifique à un système d'acquisition sonore du terminal de communication. Dans un mode de réalisation, les filtres ont des caractéristiques de filtrage prédéterminées. Dans un mode de réalisation, les signaux délivrés par les filtres sont traités de façon identique par les moyens de reconnaissance vocale vis-à-vis de la base de données. Selon un mode de réalisation, les moyens de reconnaissance vocale contiennent des moyens de filtrage fixe associés à un premier système de reconnaissance vocale et des moyens de filtrage dynamiques associés à un second système de filtrage, ces moyens 612 de filtrage dynamiques détectant les caractéristiques du filtrage fixe de façon à délivré un signal analogue au signal délivré par ce filtrage fixe. L'invention concerne également un terminal de communication traitant des signaux vocaux à l'aide de moyens de reconnaissance vocale comparant ces signaux vocaux à des données stockées dans une base afin d'identifier les données correspondant à ces signaux, ces données identifiées étant transmises à des moyens de gestion pour déclencher une action, caractérisé en ce que, les signaux vocaux pouvant être fournis par différents systèmes d'acquisition sonore, il comprend des moyens de reconnaissance vocale distincts pour chaque système d'acquisition. Dans un mode de réalisation, le terminal de communication est caractérisé en ce que la base de données est située à l'extérieur du terminal de communication dans un serveur. Dans un mode de réalisation, le terminal de communication comprend, dans la base de données, des sous-bases indépendantes, chaque sous-base étant associé à un système d'acquisition sonore considéré de telle sorte que les moyens de reconnaissance vocale utilise prioritairement la sous-base associée au système d'acquisition sonore utilisé par l'utilisateur pour effectuer la comparaison. Selon un mode de réalisation, le terminal de communication comprend des moyens pour effectuer la comparaison entre un signal et les données stockées de façon successive pour chacune des sous-bases jusqu'à ce qu'un taux de reconnaissance requis soit atteint par cette comparaison. Selon un mode de réalisation, le terminal de communication comprend des moyens pour effectuer une procédure d'apprentissage de la reconnaissance vocale avec différents systèmes de reconnaissance vocale de façon à générer les sous-bases spécifiques à chaque système de reconnaissance vocale. Dans un mode de réalisation, le terminal de communication comprend dans les moyens de reconnaissance vocale au moins deux filtres de signaux sonores, chacun des filtres étant spécifique à un système d'acquisition sonore du terminal de communication. Selon un mode de réalisation, le terminal de communication comprend des filtres qui ont des caractéristiques de filtrage fixes et prédéterminées. Dans un mode de réalisation, le terminal de communication comprend des moyens pour que les signaux délivrés par les filtres soient traités de façon identique par les moyens de reconnaissance vocale vis-à-vis de la base de données. Selon un mode de réalisation, le terminal de communication comprend des moyens de reconnaissance vocale qui contiennent des moyens de filtrage fixe associés à un premier système de reconnaissance vocale et des moyens de filtrage dynamiques associés à un second système de filtrage, ces moyens de filtrage dynamiques détectant les caractéristiques du filtrage fixe de façon à délivré un signal analogue au signal délivré par ce filtrage fixe. Dans un mode de réalisation, le terminal de communication comprend un microphone. Selon un mode de réalisation, un de ces systèmes d'acquisition de données est un kit mains-libres piéton, un kit mains-libres pour un véhicule ou un système de reconnaissance intégré au terminal de communication. D'autres caractéristiques et avantages de l'invention apparaîtront avec la description effectuée ci-dessous, à titre non limitatif, en référence aux figures ci-jointes sur lesquelles: - La figure 1 déjà décrite représente un exemple de connu de reconnaissance vocale pour terminal de communication, La figure 2 est une représentation schématique des applications de mise en oeuvre de l'invention, La figure 3 est un schéma d'une première réalisation de l'invention, - La figure 4 est un schéma d'un second exemple de l'invention, La figure 5 est un diagramme montrant une correction spectrale introduite dans différentes réalisations de l'invention, et La figure 6 est une représentation schématique d'une troisième réalisation de l'invention. La figure 2 représente schématiquement la mise en oeuvre du procédé de reconnaissance vocale conforme à l'invention pour trois systèmes d'acquisition sonore d'un même terminal de communication 204 mobile, mis en œuvre par un utilisateur 202. Dans ces cas, on a considéré que l'étape dite d'apprentissage a été réalisée pour la reconnaissance vocale, l'utilisateur pouvant déclencher avec sa voix, ou tout autre signal sonore reconnaissable, une fonction du terminal de communication. - Par exemple, l'utilisateur 202 commande à son terminal de communication 204, au travers de sa voix 203, la réalisation d'un appel vers un correspondant par la simple mention du prénom de ce correspondant. Le cas d'utilisation 200 de la reconnaissance vocale du terminal de communication 204 mobile est mis en œuvre par exemple avec un système 206 d'acquisition sonore intégré au terminal de communication 204 et comprenant un microphone. Comme déjà décrit, les moyens de reconnaissance vocale du terminal de communication comparent les paramètres du signal transmis alors par le système 206 avec les ensembles de paramètres stockés dans la base de données. Si la comparaison est un succès, alors le terminal de communication 204 déclenche l'appel vers le correspondant souhaité. - L'utilisateur 202 peut ensuite décider de mettre son terminal de communication 204 à la ceinture ou dans une poche, dans un cas d'utilisation 210 du terminal de communication 204 mobile avec un système 212 d'acquisition sonore, appelé couramment kit mains-libres piéton, intégrant notamment un microphone 216, proche de la bouche de l'utilisateur 202, et d'une oreillette 214 et les câbles et les moyens de connexion les reliant au terminal de communication 204. L'utilisateur peut, grâce à l'invention, prononcer le nom de son correspondant au travers du microphone 216 et commander avec succès l'appel de ce correspondant. - L'utilisateur 202 peut ensuite décider de mettre en oeuvre son terminal de communication 204 à l'aide d'un autre système d'acquisition 228 sonore dans une voiture 220, dans un cas d'utilisation 218 du terminal de communication 204 mobile avec un kit mains-libres de voiture, intégrant notamment un microphone 230 et les câbles et les moyens de connexion 222 les reliant au terminal de communication 204. L'utilisateur prononce le nom de son correspondant au travers du microphone 230 et commande ainsi l'appel vers ce correspondant. Il apparaît ainsi qu'un utilisateur 202 peut utiliser la fonction de reconnaissance vocale de son terminal de communication 204 avec divers systèmes 206, 212 ou 228 d'acquisition sonore, ce qui ne présente pas un problème de reconnaissance vocale lorsqu'un procédé conforme à l'invention est pris en compte, trois modes de réalisations préférés de l'invention étant décrits ci-dessous : Une première réalisation est représentée schématiquement sur la figure 3 incluant un terminal de communication 300 équipé notamment de moyens 302 de reconnaissance vocale, d'une base 304 de données d'ensembles de paramètres, chacun desdits ensembles correspondant à une fonction à reconnaître, d'un système 305 interne d'acquisition sonore incluant notamment un microphone 306 intégré et de moyens 312 de gestion du terminal de communication 300. Ce terminal de communication peut aussi utiliser un système 307 d'acquisition sonore, correspondant par exemple au kit mains-libres piétons, incluant un microphone 308 et un système 309 d'acquisition sonore, correspondant par exemple au kit mains-libres voiture, comprenant notamment un microphone 310. Puis, l'utilisateur réalise la procédure d'apprentissage de la reconnaissance vocale avec les différents systèmes 305, 307 et 310 intégrants différents microphones 306, 308 et 310. En outre, le terminal de communication comprend des moyens pour détecter le système d'acquisition sonore utilisé et inhiber les autres systèmes. Ainsi, dans une première opération, un utilisateur réalise le procédé d'apprentissage avec le microphone 306 intégré de son terminal de communication 300, par exemple en sélectionnant sur son terminal de communication la fonction à laquelle il souhaite associer une séquence de sons puis en prononçant cette séquence de sons une ou plusieurs fois. On génère ainsi un signal 320, dépendant des caractéristiques du système 305. Les moyens 302 de reconnaissance vocale extraient un ensemble de paramètres de ce signal 320 qui est alors mémorisé dans une sous-base, ou partition, 314 de la base de données 304. - Puis, dans une seconde opération, l'utilisateur met en place le système 307 incluant un autre microphone 308, du kit mains-libres, et réalise aussi le procédé d'apprentissage avec le microphone 308 pour la fonction précédemment traitée. Les moyens 302 de reconnaissance vocale extraient un ensemble de paramètres du signal 322, dépendant du système 307, qui est mémorisé dans une partition 316 de la base de données 304. - Enfin, dans une troisième opération, l'utilisateur met en place le système 309 incluant un autre microphone 310 du kit mains-libres de voiture, et il réalise encore une fois le procédé d'apprentissage pour la même donnée ou la même fonction que précédemment. Les moyens 302 de reconnaissance vocale extraient un ensemble de paramètres du signal 324, transmis alors par le système 309, qui est alors mémorisé dans une partition 318 de la base de données 304. D'autres systèmes d'acquisition sonores peuvent être associés de façon analogue si l'utilisateur va les mettre en route. Dans ce cas, les ensembles de paramètres obtenus par la procédure d'apprentissage sont stockés dans une nouvelle partition associée à chacun des autres microphones. En conclusion, différents ensembles de paramètres (un par système d'acquisition sonore utilisé) sont associés à une même fonction : ils sont stockés dans des partitions de la base de données 304, chaque partition étant associée à un système donné et intègre donc les caractéristiques de transmission du signal dudit système. Ensuite, quand l'utilisateur veut utiliser la reconnaissance vocale, le terminal de communication reconnaît le système utilisé, une telle reconnaissance étant déjà utilisée pour diminuer l'écho ou le bruit ambiant. Finalement, il compare les paramètres extraits par les moyens 302 du signal 320, 322 ou 324 aux ensemble de paramètres qui sont stockées dans la partition correspondante au système utilisé. Ainsi, on diminue par trois le nombre de comparaisons nécessaires. Cette réalisation est susceptible de nombreuses variantes. Une variante utilise la comparaison de la séquence prononcée par l'utilisateur avec la partition utilisée à ce moment précis. Si les comparaisons ne satisfont pas au taux de reconnaissance requis, alors les comparaisons se poursuivent dans d'autres partitions jusqu'à aboutir ou ne pas trouver de correspondances satisfaisante en mémoire. Une deuxième réalisation de l'invention est représentée schématiquement dans la figure 4 qui illustre un terminal de communication 400 contenant notamment des moyens 402 de reconnaissance vocale, une base de données 404, des moyens 412 de gestion du terminal de communication et un système 405 d'acquisition sonore incluant notamment un microphone 406. Le terminal de communication peut aussi fonctionner avec deux autres systèmes d'acquisition sonore incluant deux autres microphones : un système 407 incluant notamment un microphone 408, ledit système 407 étant par exemple un kit mains-libres, et un système 409 incluant notamment un microphone 410, ledit système 409 étant par exemple un kit mains-libre de voiture. Dans cette réalisation, les caractéristiques de transmission de signal des différents systèmes 405, 407 et 409 d'acquisition du signal sonore associés au terminal de communication 400 sont connues avant l'utilisation desdits systèmes. En effet, les différents systèmes 405, 407 et 409 d'acquisition du signal sonore associés au terminal de communication 400 se comportent comme des filtres. On intègre alors dans les moyens 402 de reconnaissance vocale : des moyens 414 de filtrage associés au système 405 interne au terminal de communication 400 d'acquisition du signal sonore, des moyens 416 de filtrage associés au système 407 externe au terminal de communication 400 d'acquisition du signal sonore, - des moyens 418 de filtrage associés au système 409 externe au terminal de communication 400 d'acquisition du signal sonore. Plus en détail, la figure 5 est un exemple d'adaptation des caractéristiques spectrales par filtrage inverse qui est un filtrage particulier pouvant être celui utilisé dans cette réalisation. Cette figure 5 représente trois courbes reliant l'atténuation, par exemple en dB, en ordonnées 502 en fonction de la fréquence en abscisses 504. La courbe 506 représente la réponse en fréquence d'un système 405, 407 ou 409 d'acquisition du signal sonore. La courbe 508 représente la réponse en fréquence d'un des moyens 414, 416 ou 418 respectivement de filtrage associé au système 405, 407 ou 409. Ainsi, on obtient en sortie des moyens de filtrage inverse une réponse 510 plate qui ne dépend pas de la fréquence dans la bande passante requise et qui ne dépend pas du système d'acquisition sonore utilisé. Si l'on applique ces filtrages inverses à chaque système d'acquisition, on obtient des signaux comparables en sortie des différents moyens de filtrage inverse. Dans cette réalisation, il suffit donc de réaliser le procédé d'apprentissage en utilisant un seul système d'acquisition ou de réaliser les enregistrements multi-locuteurs en ne tenant compte que des caractéristiques d'un système d'acquisition, notamment le système 405 interne. De fait, l'ensemble des paramètres correspondant mémorisé dans la base de données 404 peut être comparé de façon homogène par des moyens 420 de reconnaissance vocale à un des signaux 422, 424 ou 426 entrants dans lesdits moyens 420 de reconnaissance vocale, indépendamment du fait que lesdits signaux 422, 424 ou 426 aient été traités dans les moyens 414, les moyens 416 ou les moyens 418 de filtrage à partir des signaux 428, 430 ou 432 respectivement. Cette réalisation est susceptible de nombreuses variantes comme par exemple d'extérioriser les moyens 414 de filtrage vis-à-vis du système 405 interne. Une troisième réalisation de l'invention est représentée sur la figure 6. Dans cette réalisation, un terminal de communication 600 contient notamment des moyens 602 de reconnaissance vocale, une base de données 614, des moyens 616 de gestion du terminal de communication et des moyens 607 d'acquisition du signal sonore, ces dits moyens 607 comprenant notamment un microphone 608. Un autre système 609 d'acquisition du signal sonore peut être connecté au terminal de communication 600 si tel est le souhait de l'utilisateur. Ce système 609 peut être notamment un kit mains-libres ou un kit mains-libres de voiture. Les moyens 602 de reconnaissance vocale comprennent : - Des moyens 604 de traitement du signal pour le système 607 d'acquisition du signal sonore, - Des moyens 612 de filtrage adaptatif, - Des moyens 606 d'algorithme mettant en œuvre un algorithme de reconnaissance vocale avec la base de données 614. Les moyens 612 de filtrage adaptatifs permettent de détecter les caractéristiques de traitement de signal du système 609 par la comparaison, pendant un temps où l'utilisateur ne parle pas, d'un signal 618 provenant du système 609 avec un signal 622 afin d'identifier le filtrage 612 afin d'identifier le filtrage 612 délivrant un signal 620 analogue au signal 622. En d'autres termes, on effectue une double écoute du milieu ambiant au travers du système 607 et du système 609, de façon alternative ou simultanée en fonction des réalisations. Un variante de cette réalisation est d'opérer cette double écoute, non pas dans l'étape d'apprentissage mais de façon systématique dans l'étape de fonctionnement, notamment à des intervalles de temps donnés ou à chaque appel ou réception d'appel. Une fois les paramètres 612 calculés, ils doivent être conservés pour la phase de reconnaissance afin de traiter le signal 618. Le signal 618 adapté devient un signal 620 qui peut alors être traité par les moyens 606 d'algorithme pour en extraire les paramètres nécessaire audit algorithme et, ensuite, comparer ces paramètres aux ensembles de paramètres mémorisées dans la base de données 614. Sur la figure 6, on a aussi représenté des moyens 604 qui traitent un signal 624 provenant du système 607 d'acquisition du signal sonore pour l'adapter aussi à des niveaux prédéterminés et le transformer en un signal 622.

Sur la figure I1 le terminal de communication mobile 300, 400, 600 émet et reçoit des communications dans un réseau de radiocommunication. La base de données 304, 404, 614 est située à l'extérieur du terminai de communication mobile dans un serveur 700 situé également dans le réseau de radiocommunication.