Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD OF MEASURING ANNOYANCE CAUSED BY NOISE IN AN AUDIO SIGNAL
Document Type and Number:
WIPO Patent Application WO/2006/087490
Kind Code:
A1
Abstract:
The invention relates to a method of calculating an objective appraisal (NOB) of annoyance caused by noise in an audio signal processed with a noise reduction function. The inventive method comprises a first step consisting in obtaining a pre-defined test audio signal (x[m]) containing a noise-free wanted signal, a noisy signal (xb[m]) obtained by adding a pre-defined noise signal to the test signal (x[m]) and a processed signal (y[m]) obtained by applying the noise reduction function to the noisy signal (xb[m]). Said method is characterised in that it includes a step (a3, a4) consisting in taking frame loudness measurements for the noisy signal (xb[m]) and the processed signal (y[m]) and frame tonality coefficient measurements for the processed signal (y[m]).

Inventors:
LE FAUCHEUR NICOLAS (FR)
GAUTIER-TURBIN VALERIE (FR)
Application Number:
PCT/FR2006/050126
Publication Date:
August 24, 2006
Filing Date:
February 13, 2006
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
FRANCE TELECOM (FR)
LE FAUCHEUR NICOLAS (FR)
GAUTIER-TURBIN VALERIE (FR)
International Classes:
G10L19/00; G10L21/02; G10L21/0208; G10L25/69
Foreign References:
US6651041B12003-11-18
Other References:
RIX A W ET AL: "The perceptual analysis measurement system for robust end-to-end speech quality assessment", ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 2000. ICASSP '00. PROCEEDINGS. 2000 IEEE INTERNATIONAL CONFERENCE ON 5-9 JUNE 2000, PISCATAWAY, NJ, USA,IEEE, vol. 3, 5 June 2000 (2000-06-05), pages 1515 - 1518, XP010507639, ISBN: 0-7803-6293-4
BEERENDS J G ET AL: "Perceptual Evaluation of Speech Quality (PESQ), the new ITU standard for end-to-end speech quality assessment. Part II - Psychoacoustic model", AES: JOURNAL OF THE AUDIO ENGINEERING SOCIETY, June 2001 (2001-06-01), XP002206026
JOHNSTON J D: "TRANSFORM CODING OF AUDIO SIGNALS USING PERCEPTUAL NOISE CRITERIA", IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS, IEEE INC. NEW YORK, US, vol. 6, no. 2, 1 February 1988 (1988-02-01), pages 314 - 323, XP002003779, ISSN: 0733-8716
Attorney, Agent or Firm:
Urbillac, Chantal (38-40 Rue Du Général Leclerc, Issy Les Moulineaux Cedex 9, FR)
Download PDF:
Claims:
REVENDICATIONS
1. Procédé de calcul d'une note objective (NOB) de la gêne due au bruit dans un signal audio traité par une fonction de réduction de bruit, ledit procédé comprenant une étape préalable d'obtention d'un signal audio prédéfini de test (x[m]) contenant un signal utile dépourvu de bruit, d'un signal bruité (xb[m]), obtenu en additionnant un signal de bruit prédéfini audit signal de test (x[m]), et d'un signal traité (y[m]), obtenu par application de la fonction de réduction de bruit audit signal bruité (xb[m]), ledit procédé étant caractérisé en ce qu'il inclut une étape (a3, a4) de mesures de sonie de trames dudit signal bruité (xb[m]) et dudit signal traité (y[m]), et de mesures de coefficients de tonalité de trames dudit signal traité (y[m]).
2. Procédé selon la revendication 1 , caractérisé en ce qu'il comprend les étapes de : Calcul (a3) de densités de sonie moyenne & (m) de trames du signal traité (y[m]), de densités de sonie moyenne respectives ~Sxb(m _ parole) & 5 V (m _ par vie) de trames de signal utile "m_parole" respectivement du signal bruité (xb[m]) et du signal traité (y[m]), de densités de sonie moyenne Sγ(m_bruit)àe trames de bruit "m_bruit" du signal traité (y[m|), et de coefficients de tonalité aγ(m_bruit) àe trames de bruit "m_bruiî" du signal traité (y[m]}, Calcul (a5, a6) d'une note objective (NOB) de Ia gêne due au bruit dans le signal traité (y[mj), à partir desdites densités de sonie moyenne et desdits coefficients de tonalité calculés, et de coefficients de pondération prédéfinis.
3. Procédé selon la revendication 2, caractérisé en ce que l'étape de calcul (a3) de densités de sonie moyenne et de coefficients de tonalité est suivie d'une étape de calcul (a4) des moyennes 5Y , 5,» _ parole , Sr __ parole , Sr _bruu et CCY bruit desdites densités de sonie moyenne et desdits coefficients de tonalité sur l'ensemble des trames concernées des signaux correspondants, et en ce que la note objective (NOB) de la gêne due au bruit est calculée selon l'équation suivante: NOi? = ^ ωfacteur(i) + ωo , 1=1 OÙ r , . . . facteur(1 )= , Γ , ,,... Sr bruit facteur(2)= = Sr _ parole facteur(3)= Ecart_type [S.v>(m _ parole) Sγ(m _ parole) J , l'opérateur "Ecart_type (v(m))" désignant Pécarttype de la variable v sur l'ensemble des trames d'indice m, facteur(4)= ar_bruu , facteur(5)= Ecart_type (ar(m _ bruit)) , et les coefficients ωi à K>Q sont déterminés de manière à obtenir une corrélation maximale entre les données subjectives issues d'une base de données de tests subjectifs et les notes objectives (NOB) calculées par ledit procédé pour îes signaux de tests, bruités et traités (x[m], xb[m], y[m]) correspondants utilisés lors desdîts tests subjectifs.
4. Procédé de calcul d'une note objective (NOB) de la gêne due au bruit dans un signal audio, ledit procédé comprenant une étape préalable d'obtention d'un signai aodîo prédéfini de test (x[m]) contenant un signa! utile dépourvu de bruit, et d'un signal bruité (xb[m]), obtenu en additionnant un signal de bruit prédéfini audit signa! de test (x[m]), ledit procédé étant caractérisé en ce qu'il inclut une étape (b3, b4) de mesures de sonie et de mesures de coefficients de tonalité de trames dudit signal bruité (xb[m]).
5. Procédé selon la revendication 4, caractérisé en ce qu'il comprend les étapes de : Calcul (b3) de densités de sonie moyenne £.»(/«) de trames du signal bruité (xb[m]), de densités de sonie moyenne Sχb(m_ parole) de trames de signal utile "m_parole" du signal bruité (xb[m]), de densités de sonie moyenne s,vj(m _bmit) àe trames de bruit "m_bruit" du signal bruité (xb[m]), et de coefficients de tonalité dxb{m_ bruit) de trames de bruit "m_bruit" du signal bruité (xb[m]), Calcul (b5, bδ) d'une note objective (NOB) de la gêne due au bruit dans le signal bruité (xb[m]), à partir desdites densités de sonie moyennes et desdits coefficients de tonalité calculés, et de coefficients de pondération prédéfinis.
6. Procédé selon la revendication 5, caractérisé en ce que l'étape de calcul (b3) de densités de sonie moyenne et de coefficients de tonalité est suivie d'une étape de calcul (b4) des moyennes s^, , s,» ^αro/e, S.» _>ι«γ et ŒM ^ brun desdites densités de sonie moyenne et desdits coefficients de tonalité sur l'ensemble des trames concernées des signaux correspondants, et en ce que ladite note objective (NOB) de la gêne due au bruit est calculée selon l'équation suivante: ,¥05 = Y ωf, acteur(i) • COS OU , . . . S Xb brun facteur(1 )== — == Sxb facteur(3)= a.v,_bruu , facteur(4)= Ecaύjype (aχb(m _bruit)) , l'opérateur "Ecart_type (v(m))" désignant l'écarttype de la variable v sur l'ensemble des trames d'indice m, et les coefficients ωi à ω5 sont déterminés de manière à obtenir une corrélation maximale entre les données subjectives issues d'une base de données de tests subjectifs et les notes objectives (NOB) calculées par ledit procédé pour les signaux de tests et les signaux bruités (x[m], xb[m]) correspondants utilisés lors desdits tests subjectifs.
7. Procédé selon l'une quelconque des revendications 1 à 6, caractérisé en ce que ladite étape de calcul (a3, b3, a4, b4) de densités de sonie et de coefficients de tonalité est précédée d'une étape (a2, b2) de détection d'activité vocale sur le signal de test, de manière à déterminer si une trame courante d'indice m du signal bruité (xb[m]), et du signal traité (y[m]) dans le cas des revendications 1 à 3, est une trame "m_bruit" contenant seulement du bruit, ou une trame "mj>arole" contenant de la parole, dite trame de signal utile.
8. Procédé selon l'une quelconque des revendications 1 à 7, caractérisé en ce que l'étape de calcul (a6, b6) de la note objective (NOB) est suivie d'une étape de calcul (a7, b7) d'une note objective sur l'échelle MOS (NOB_MOS) de Ia gêne due au bruit» calculée selon l'équation suivante: NOB _ MOS = £ K (NOB)''1 , dans laquelle les coefficients λi à /»4 sont déterminés de manière à ce que ladite nouvelle note objective obtenue (NOBJvIOS) caractérise la gêne due au bruit sur fécheϋβ MOS.
9. Procédé selon l'une quelconque des revendications 1 à 8, caractérisé en ce que, dans l'étape de calcul (a3, b3, a4, b4) de densités de sonie et de coefficients de tonalité, le calcul de la densité de sonie moyenne Su (m) d'une trame d'indice m quelconque d'un signal audio donné u, comprend les étapes suivantes : fenêtrage (d ), par exemple de type Hanning, de la trame d'indice m et obtention d'une trame fenêtrée u_w[m], application (c2) d'une transformée de Fourier rapide à la trame fenêtrée u_w[m] et obtention d'une trame correspondante U(m,f) dans le domaine fréquentiel, calcul (c3) de la densité spectrale de puissance yu On,!") de la trame U(m,f), application (c4) à la densité spectrale de puissance γ,j (m,f) d'une conversion de l'axe des fréquences à l'échelle des Barks et obtention d'une densité spectrale de puissance By(In, b) sur l'échelle des Barks, convolution (c5) de la densité spectrale de puissance sur l'échelle des Barks, BL (m,b) , avec la fonction d'étalement couramment utilisée en psychoacoustique et obtention d'une densité spectrale étalée sur l'échelle des Barks, Eu(m,b), calibration (c6) de la densité spectrale étalée sur l'échelle des Barks, Eu (In5I)) , par les facteurs respectifs d'échelonnement en puissance et d'échelonnement en sonie couramment utilisés en psychoacoustique, conversion de la grandeur ainsi obtenue sur l'échelle des phones puis conversion sur l'échelle des soπes de la grandeur précédemment convertie en phones, et obtention en conséquence d'un nombre B de valeurs de densité de sonie, SL (m.b) . de Ia trame d'indice m pour la bande critique b, B étant Ie nombre de bandes critiques considérées dans i'échβlfe des Barks et l'indice b variant de 1 à B , calcul (c7) de la densité de sonie moyenne SL (m) de la trame d'indice m à partir desdites B valeurs de densités de sonie SL! (m,b) , selon l'équation suivante : Su(m) = i ∑Su(m,b) B b=l .
10. Procédé selon l'une quelconque des revendications 1 à 9, caractérisé en ce que, dans l'étape de calcul (a3, b3, a4, b4) de densités de sonie et de coefficients de tonalité, le calcul du coefficient de tonalité α(m) d'une trame d'indice m quelconque d'un signal audio donné u, comprend les étapes suivantes : fenêtrage (d ), par exemple de type Haπning, de la trame d'indice m et obtention d'une trame fenêtrée u_w[m], application (c2) d'une transformée de Fourier rapide à la trame fenêtrée u_w[m] et obtention d'une trame correspondante U(m,f) dans le domaine fréquentiel, calcul (c3) de la densité spectrale de puissance γ^m,!") de la trame U(m,f), calcul (c8) du coefficient de tonalité α(m) selon l'équation suivante: où * symbolise l'opérateur de multiplication dans l'espace des nombres réels, f représente l'indice fréquentiel de Ia densité spectrale de puissance, et N désigne la taille de la transformée de Fourier rapide. , Equipement de test destiné à évaluer une note objective de la gêne due au bruit dans un signa! audîo, caractérisé en ce qu'il comporte des moyens adaptés à mettre en œuvre un procédé selon l'une quelconque des revendications 1 à 10.
11. Equipement de test selon la revendication 11 , caractérisé en ce qu'il inclut des moyens informatiques et un programme d'ordinateur, ledit programme comportant des instructions adaptées à mettre en œuvre ledit procédé, lorsqu'il est exécuté par lesdits moyens informatiques.
12. Programme d'ordinateur sur un support d'informations, caractérisé en ce qu'il comporte des instructions adaptées à la mise en œuvre d'un procédé selon l'une quelconque des revendications 1 à 10, lorsque le programme est chargé et exécuté dans un système informatique.
Description:
Procédé de mesure de Ia gêne due au bruit dans un signal audio

La présente invention se situe de manière générale dans les domaines du traitement du signal de parole et de la psychoacoustique. Plus précisément l'invention concerne un procédé et un dispositif d'évaluation objective de la gêne due au bruit dans des signaux audio.

L'invention permet notamment de noter objectivement la gêne due au bruit dans un signal audio traité par une fonction de réduction de bruit. Dans le domaine de la transmission de signaux audio, une fonction de réduction de bruit, aussi appelée fonction de suppression de bruit ou de débruitage, a pour objectif de réduire le niveau de bruit de fond dans une communication vocale, ou ayant au moins une composante vocale. Elle présente un intérêt spécifique lorsque l'un des interlocuteurs de cette communication est immergé dans un milieu bruité qui nuit fortement à l'intelligibilité de sa voix. Les algorithmes de réduction de bruit sont basés sur une estimation en continu du niveau du bruit de fond à partir du signal incident et d'une détection d'activité vocale permettant de distinguer les périodes de bruit seul de celles avec du signal de parole utile. Un filtrage du signal de parole incident, correspondant au signal de parole bruité, est ensuite effectué de façon à réduire la contribution du bruit déterminée à partir de l'estimée du bruit.

La gêne due à la présence de bruit dans un signal audio traité par une telle fonction de réduction de bruit est évaluée aujourd'hui de manière subjective seulement en se basant sur l'exploitation de résultats de tests mis en œuvre selon le document "Recommandation UIT-T P.835 (11/2003)", Cette évaluation est faîte sur une échelle de type MOS, d'après l'anglais Mean Opinion Score, qui donne une note de un à cinq de la gêne due au bruit, appelée "background noise" dans ce même document.

L'inconvénient majeur de cette technique d'évaluation est la nécessité de mettre en œuvre des tests subjectifs, cette mise en œuvre étant très lourde et très coûteuse. En effet chaque contexte particulier, c'est-à-dire un type de signal incident associé à un type de bruit et une fonction de réduction de bruit, nécessite de mettre un panel de personnes en situation d'écoute réelle d'échantillons de parole afin de leur demander de noter la gêne due au bruit selon une échelle de type MOS.

C'est pourquoi le développement de méthodes objectives alternatives pouvant compléter ou suppléer les méthodes subjectives est un sujet de grand intérêt. L'illustration la plus frappante de ce phénomène est le modèle de qualité d'écoute, en constante évolution, contenu dans le document "Recommandation UIT-T P.862 (02/2001 )", Néanmoins ce modèle ne s'applique pas à l'évaluation de la gêne due au bruit. L'invention concerne en effet des signaux de parole dans lesquels la gêne due au bruit peut être importante, ceci avant ou après traitement de ces signaux par une éventuelle fonction de réduction de bruit.

Il est de plus à noter que bien qu'en général l'invention sera utilisée pour évaluer la gêne due au bruit en sortie d'un équipement de communication implémentant une fonction de réduction de bruit, l'invention s'applique aussi aux signaux bruités non traités par une telle fonction. Le cas d'utilisation de l'invention sur un signal audio bruité quelconque est donc un cas particulier du cas plus général d'utilisation de l'invention sur un signal audio traité par une fonction de réduction de bruit.

La présente invention a pour but de résoudre les inconvénients de la technique antérieure en fournissant un procédé et un dispositif de calcul objectif d'une note équivalente à la note subjective telle qu'indiquée dans le document "Recommandation UIT-T P.835", caractérisant Ia gêne due à la présence de bruit dans un signal audio. Le procédé selon l'invention varie suivant que l'invention est utilisé sur un signal audio bruité quelconque ou sur un signal audio traité par une fonction de réduction de bruit, notamment dans les paramètres de calcul de la note objective selon l'invention. Afin de bien

décrire ces deux cas d'utilisation, deux modes de réalisation pouvant aussi être considérés comme deux procédés distincts sont présentés. Cependant le second mode de réalisation, s'appliquant à un signal audio bruité quelconque, et plus général que le premier mode de réalisation, se déduit aisément de celui-ci.

A cette fin, l'invention propose un procédé de calcul d'une note objective de la gêne due au bruit dans un signal audio traité par une fonction de réduction de bruit, ledit procédé comprenant une étape préalable d'obtention d'un signal audio prédéfini de test contenant un signal utile dépourvu de bruit, d'un signal bruité, obtenu en additionnant un signal de bruit prédéfini audit signal de test, et d'un signal traité, obtenu par application de la fonction de réduction de bruit audit signal bruité, ledit procédé étant caractérisé en ce qu'il inclut une étape de mesures de sonie de trames dudit signal bruité et dudit signal traité, et de mesures de coefficients de tonalité de trames dudit signal traité.

Ce procédé a l'avantage d'une mise en œuvre simple, immédiate et rapide contrairement aux tests subjectifs. On rappellera ici que l'expression "sonie psychoacoustique" peut être définie comme le caractère de la sensation auditive lié à la pression acoustique et à la structure du son. En d'autres termes, il s'agit de la force sonore d'un son ou d'un bruit en tant que sensation auditive (cf. Office de la langue française, 1988). La sonie est représentée par une échelle de sonie psychoacoustique (en sones). D'autre part, la densité de sonie, encore désignée par "intensité subjective", est une mesure particulière de Ia sonie.

Selon une caractéristique préférée, ce procédé selon l'invention comprend les étapes de ;

- Calcul de densités de sonie moyenne Sr(Vn) de trames du signal traité, de densités de sonie moyenne respectives parole) et s-djn parole) d& trames de signai utile "m_parole" respectivement du

signal bruité et du signal traité, de densités de sonie moyenne ~ Sr{m _bruit) de trames de bruit "m_bruit" du signal traité, et de coefficients de tonalité ar(m bruit) de trames de bruit "m_bruit" du signal traité, - Calcul d'une note objective de la gêne due au bruit dans le signal traité, à partir desdites densités de sonie moyenne et desdits coefficients de tonalité calculés, et de coefficients de pondération prédéfinis.

Selon une caractéristique préférée, l'étape de calcul de densités de sonie moyenne et de coefficients de tonalité est suivie d'une étape de calcul des moyennes &- , &«, pam ie , Sr pamie , 5V bn,u et ar _ brun desdites densités de sonie moyenne et desdits coefficients de tonalité sur l'ensemble des trames concernées des signaux correspondants, et la note objective de la gêne due au bruit est calculée selon l'équation suivante: s NOB - ]jT ωfacteur(i) + o& ,

où fartrurHY- 1 ^-*"" ' '

X . /n\ Sr bruit facteur(2)= -=- -

SY _ parole facteur(3)= Ecart_type _ parole) - Sr(m _ parole)) , l'opérateur

"Ecart_type (v(m))" désignant Pécart-type de la variable v sur l'ensemble des trames d'indice m, facteur(4)= ar_bru,t , facteur(5)= Ecart_type (m (m _ bruit)) , et les coefficients coi à ωe sont déterminés de manière à obtenir une corrélation maximale entre les données subjectives issues d'une base de données de tests subjectifs et tes notes objectives calculées par ledit procédé pour les signaux de tests, bruités et traités correspondants utilisés lors desdîts tests subjectifs.

Les coefficients de cette combinaison linéaire ont l'avantage de pouvoir être recalculés si de nouvelles données de tests subjectifs modifient de manière sensible la corrélation précédemment établie. Ceci permet d'améliorer un modèle objectif alimenté par le procédé selon l'invention, de calcul de la gêne due au bruit dans un signal audio traité par une fonction de réduction de bruit, par une simple reconfiguration des paramètres du procédé.

L'invention concerne aussi un procédé de calcul d'une note objective de la gêne due au bruit dans un signal audio, ledit procédé comprenant une étape préalable d'obtention d'un signal audio prédéfini de test contenant un signal utile dépourvu de bruit, et d'un signal bruité, obtenu en additionnant un signal de bruit prédéfini audit signal de test, ledit procédé étant caractérisé en ce qu'il inclut une étape de mesures de sonie et de mesures de coefficients de tonalité de trames dudit signal bruité.

Ce procédé a les mêmes avantages que le procédé précédent, mais s'applique à un signal audio bruité quelconque.

Selon une caractéristique préférée, ce procédé selon l'invention comporte les étapes de:

- Calcul de densités de sonie moyenne ~ s xh ( m )àe trames du signal bruité, de densités de sonie moyenne S χb{m_ parole) de trames de signal utile "m_parole" du signal bruité, de densités de sonie moyenne

S.χ!,(m_bruit)àe trames de bruit "m_bruit" du signal bruité, et de coefficients de tonalité a,u(m_bruit) àe trames de bruit "m_bruit" du signal bruité,

- Calcul d'une note objective de la gêne due au bruit dans le signal bruité, à partir desdites densités de sonie moyennes et desdits coefficients de tonalité calculés, et de coefficients de pondération prédéfinis.

Selon une caractéristique préférée, l'étape de calcul de densités de sonie moyenne et de coefficients de tonalité est suivie d'une étape de calcul

des moyennes s M , S x b ^ parole, S M ^ brmt et axi, bmn desd ' ûes densités de sonie moyenne et desdits coefficients de tonalité sur l'ensemble des trames concernées des signaux correspondants, et en ce que ladite note objective de la gêne due au bruit est calculée selon l'équation suivante:

4

NOB = ]T ωf acteur (i) + ωs ,

r . I Λ \ S Xb bruit facteur(1 )= — =

S Xb Sxb bruit facteur(2)=

S Xh _ parole facteur(3)= cκ»_w , facteur(4)= Ecart Jy pe(aχb(m_ bruit)), l'opérateur "Ecart type (v(m))" désignant l'écart-type de la variable v sur l'ensemble des trames d'indice m, et les coefficients ωi à ωs sont déterminés de manière à obtenir une corrélation maximale entre les données subjectives issues d'une base de données de tests subjectifs et les notes objectives calculées par ledit procédé pour les signaux de tests et les signaux bruités correspondants utilisés lors desdits tests subjectifs.

Comme pour le procédé précédent, les coefficients de cette combinaison linéaire ont l'avantage de pouvoir être recalculés si de nouvelles données de tests subjectifs modifient de manière sensible la corrélation précédemment établie. Ceci permet d'améliorer un modèle objectif alimenté par Ie procédé selon l'invention, de calcul de la gêne due au bruit dans un signal audio, par une simple reconfiguration des paramètres du procédé.

Selon une caractéristique préférée de ces deux procédés selon l'invention, l'étape de calcul de densités de sonie et de coefficients de tonalité est précédée d'une étape de détection d'activité vocale sot le signal de test, de manière à déterminer si une trame courante du signal bruité, et du signa! traité dans le cas du premier procédé, est une trame "m_bruit" contenant

seulement du bruit, ou une trame "m_parole" contenant de la parole, dite trame de signal utile.

Cette étape de détection d'activité vocale permet de séparer très simplement les différents types de trames du signal bruité, et du signal traité dans le cas du premier procédé, par l'utilisation du signal de test.

Selon une caractéristique préférée de ces deux procédés selon l'invention, l'étape de calcul de la note objective est suivie d'une étape de calcul d'une note objective sur l'échelle MOS de la gêne due au bruit, calculée selon l'équation suivante:

4 NOB _ MOS = ∑λ t (NOB)'- 1 ,

dans laquelle les coefficients λi à λ 4 sont déterminés de manière à ce que ladite nouvelle note objective obtenue caractérise la gêne due au bruit sur l'échelle MOS.

Le fait d'utiliser une fonction polynomiale d'ordre 3 permet d'obtenir une note objective sur l'échelle MOS très proche de la note subjective MOS que donnerait un groupe d'auditeurs dans le cadre d'un test subjectif conforme à la "Recommandation UIT-T P.835".

Selon une caractéristique préférée de ces deux procédés selon l'invention, l'étape de calcul de densités de sonie et de coefficients de tonalité, le calcul de la densité de sonie moyenne Su (m) d'une trame d'indice m quelconque d'un signal audio donné u, comprend les étapes suivantes :

- fenêtrage, par exemple de type Hanning, de la trame d'indice m et obtention d'une trame fenêtrée u_w[m],

- application d'une transformée de Fourier rapide à la trame fenêtrée u_w[m] et obtention d'une trame correspondante U(m,f) dans le domaine fréquentiei,

- calcul de la densité spectrale de puissance γ { (m, f) de la trame U(m,f),

application à la densité spectrale de puissance γ υ (m, f) d'une conversion de l'axe des fréquences à l'échelle des Barks et obtention d'une densité spectrale de puissance B, j (m,b) sur l'échelle des Barks,

- convolution de la densité spectrale de puissance sur l'échelle des Barks, B Li (m,b) , avec la fonction d'étalement couramment utilisée en psychoacoustique et obtention d'une densité spectrale étalée sur l'échelle des Barks, Eu(m,b),

- calibration de la densité spectrale étalée sur l'échelle des Barks, E 1J (m, b) , par les facteurs respectifs d'échelonnement en puissance et d'échelonnement en sonie couramment utilisés en psychoacoustique, conversion de la grandeur ainsi obtenue sur l'échelle des phones puis conversion sur l'échelle des sones de la grandeur précédemment convertie en phones, et obtention en conséquence d'un nombre B de valeurs de densité de sonie, S 1 , (m, b) , de la trame d'indice m pour la bande critique b, B étant le nombre de bandes critiques considérées dans l'échelle des Barks et l'indice b variant de 1 à B ,

- calcul de la densité de sonie moyenne Su (m) de la trame d'indice m à partir desdites B valeurs de densités de sonie S υ (m, b) , selon l'équation suivante : Su (m) = -^ ∑S u (m,b) t> b=l

Selon une caractéristique préférée de ces deux procédés selon l'invention, dans l'étape de calcul de densités de sonie et de coefficients de tonalité, Ie calcul du coefficient de tonalité α(m) d'une trame d'indice m quelconque d'un signal audio donné u, comprend ies étapes suivantes : - fenêtrage, par exemple de type Hanning, de la trame d'indice m et obtention d'une trame fenêtrée u_w[m],

application d'une transformée de Fourier rapide à Ia trame fenêtrée u__w[m] et obtention d'une trame correspondante U(m,f) dans le domaine fréquentiel, calcul de la densité spectrale de puissance γu (m,f) de la trame U(m,f), calcul du coefficient de tonalité α(m) selon l'équation suivante:

* symbolise l'opérateur de multiplication dans l'espace des nombres réels, f représente l'indice fréquentiel de la densité spectrale de puissance, et N désigne la taille de la transformée de Fourier rapide.

L'invention concerne également un équipement de test destiné à évaluer une note objective de la gêne due au bruit dans un signal audio, caractérisé en ce qu'il comporte des moyens adaptés à mettre en œuvre l'un ou l'autre des procédés selon l'invention. Selon une caractéristique préférée, l'équipement de test inclut des moyens informatiques et un programme d'ordinateur, ledit programme comportant des instructions adaptées à mettre en oeuvre l'un ou l'autre desdits procédés, lorsqu'il est exécuté par lesdits moyens informatiques.

L'invention concerne encore un programme d'ordinateur sur un support d'informations » comportant des instructions adaptées à la mise en œuvre de l'un ou l'autre des procédés selon l'invention, lorsque le programme est chargé et exécuté dans un système informatique.

Les avantages de cet équipement de test ou de ce programme d'ordinateur sont identiques à ceux mentionnés pius haut en relation avec les procédés de l'invention,

D'autres caractéristiques et avantages apparaîtront à la lecture de modes de réalisation préférés décrits en référence aux figures dans lesquelles: - la figure 1 représente un environnement de test destiné à calculer une note objective de la gêne due au bruit dans un signal audio traité par une fonction de réduction de bruit, selon un premier mode de réalisation de l'invention,

- la figure 2 est un organigramme illustrant un procédé de calcul d'une note objective de la gêne due au bruit dans un signal audio traité par une fonction de réduction de bruit selon un premier mode de réalisation du procédé selon l'invention,

- la figure 3 est un organigramme illustrant un procédé de calcul d'une note objective de la gêne due au bruit dans un signal audio selon un second mode de réalisation du procédé selon l'invention,

- la figure 4 est un organigramme illustrant le mode de calcul de la densité de sonie moyenne et du coefficient de tonalité d'une trame de signal audio selon l'invention.

Deux modes de réalisation du procédé selon l'invention sont décrits dans la suite, le premier étant appliqué à un signal audio traité par une fonction de réduction de bruit, et le second étant appliqué à un signal audio bruité quelconque. Le principe du procédé selon l'invention est le même dans ces deux modes de réalisation, en particulier le procédé de calcul est exactement le même, mais dans le second mode de réalisation ie signa! audio traité par une fonction de réduction de bruit est pris égal au signa! bruité. Le second mode de réalisation peut en effet être considéré comme un cas particulier du premier mode de réalisation, avec une fonction de réduction de bruit inhibée. Sefon ie premier mode de réalisation du procédé l'invention, la gêne due à Ia présence de bruit dans un signal audio traité par une fonction de

réduction de bruit est évaluée de manière objective dans un environnement de test représenté à la figure 1. Un tel environnement de test comprend une source de signaux audio SSA délivrant un signal audio de test x(n) ne contenant que du signal utile, c'est-à-dire dépourvu de bruit, par exemple un signal de parole, et une source de bruit SB délivrant un signal de bruit prédéfini.

Aux fins de test, ce signal de bruit prédéfini est ajouté au signal de test x(n) choisi, comme représenté par l'opérateur d'addition AD. Le signal audio résultant de cette addition de bruit au signal de test x(n) est noté xb(n) et est désigné par l'expression "signal bruité".

Le signal bruité xb(n) constitue alors le signal d'entrée d'un module

MRB de réduction de bruit mettant en œuvre une fonction de réduction de bruit délivrant en sortie un signal audio y(n) désigné par l'expression "signal traité". Le signal traité y(n) est donc un signal audio contenant du signal utile et un bruit résiduel.

Le signal traité y(n) est ensuite délivré à un équipement de test EQT mettant en œuvre un procédé d'évaluation objective de la gêne due au bruit dans le signal traité, selon l'invention. Typiquement le procédé selon l'invention est implémenté dans l'équipement de test EQT sous la forme d'un programme d'ordinateur. En plus ou en remplacement de moyens logiciels, l'équipement de test EQT comporte éventuellement des moyens matériels électroniques pour implémenter le procédé selon l'invention. Outre le signal y(n), l'équipement de test EQT reçoit en entrée le signal de test x(n) et le signal bruité xb(n). L'équipement de test EQT délivre en sortie un résultat d'évaluation

RES 5 qui est une note objective NOBJvIOS de Sa gêne due à !a présence de bruit dans le signal traité y(n). Le mode de calcul de cette note objective NQBJvIOS sera décrit plus bas.

Les signaux audio précités x(n), xb(n) et y(n) sont des signaux échantillonnés dans un format numérique, n désignant un échantillon

quelconque. Ces signaux sont par exemple supposés échantillonnés à la fréquence d'échantillonnage de 8 kHz (kilo Hertz).

Dans le mode de réalisation décrit et représenté ici, le signal de test x(n) est un signal de parole dépourvu de bruit. Le signal bruité xb(n) représente alors le signal vocal initial x(n) dégradé par un environnement bruité (bruit de fond ou bruit ambiant), et le signal y(n) représente le signal xb(n) après réduction de bruit.

Selon un exemple de mise en oeuvre de l'invention, le signal x(n) est généré dans une chambre anéchoïque. Cependant, le signal x(n) peut être aussi généré dans une pièce "calme" ayant un temps de réverbération "moyen", inférieur à 0,5 seconde.

Le signal bruité xb(n) est obtenu en ajoutant une contribution prédéterminée de bruit au signal x(n). Le signal y(n) est obtenu soit en sortie d'un algorithme de réduction de bruit implanté sur un ordinateur personnel, soit à la sortie d'un équipement réseau réducteur de bruit et dans ce dernier cas, le signal y(n) est prélevé au niveau d'un codeur MIC (modulation par impulsion et codage).

En référence à la figure 2, le procédé de calcul de la note objective NOB_MOS de la gêne due au bruit dans le signal traité y(n) selon l'invention est représenté sous la forme d'un algorithme comportant des étapes ai à a7.

Dans une première étape ai , les signaux x(n), xb(n) et y(n) sont respectivement découpés en fenêtres temporelles successives appelées trames. Chaque trame de signal, notée m, contient un nombre prédéterminé d'échantillons du signal, l'étape ai consiste donc en un changement de cadence de chacun de ces signaux. Les signaux x(n), xb(n) et y{n) passés en cadence trames produisent respectivement les signaux x[m], xb[m], et y[m].

Dans une seconde étape a2, une détection d'activité vocale (DAV) est effectuée sur le signal x[m] de manière à déterminer si chaque trame respective courante d'indice m des signaux xb[m] et y[m]. est une trame contenant seuiemenî du bruit, notée "m bruit", ou une trame contenant de ia

parole, c'est-à-dire du signal utile, et notée "m_parole". Cette détermination se fait par comparaison des signaux xb[m] et y[m] avec le signal de test x[m] dénué de bruit. Chaque trame de silence de x[m] correspond en effet à une trame de bruit pour les signaux xb[m] et y[m], tandis que chaque trame de parole de x[m] correspond à une trame de parole pour les signaux xb[m] et y[m].

Comme représenté sur la figure 2, en sortie de l'étape a2, trois types de trames sont sélectionnés à partir des signaux x[m], xb[m] et y[m] :

- les trames de parole du signal bruité xb[m], notées xb[m_parole], - les trames de parole du signal traité y[m], notées y[m_parole],

- les trames de bruit du signal traité y[m], notées y[m_bruit].

Dans une troisième étape a3, des mesures de sonie sont effectuées sur au moins des ensembles de trames y[m_bruit], y[m_parole], xb[m_parole] issues de l'étape précédente a2, et au moins un ensemble de trames du signal y[m] en sortie de l'étape ai . Par exemple si on utilise 8 secondes de signal de test échantillonné à 8kHz, on pourra travailler sur 250 trames y[m] de 256 échantillons de signal y(n). De plus les coefficients de tonalité d'au moins un ensemble de trames y[m_bruit] sont mesurées.

Plus précisément, à cette étape, on calcule les densités de sonie moyennes ~ b (m_ parole) , ~ S ~ γ{m_ parole) , ~ Sγ{m) , et £y( m _bruit) de respectivement chacune des trames xb[m_parole], y[m_parole], y[m] et y[rn_bruit] des ensembles de trames considérés. De même les coefficients de tonalité a > - (m bruit) de chacune des trames y[m_bruit] de l'ensemble considéré de trames y[m__bruit] sont calculés. Le calcul d'une densité de sonie moyenne Su (m) et d'un coefficient de tonalité α(m) d'une trame d'indice m quelconque d'un signal audio donné u, sera détaillé plus loin en liaison avec la figure 4.

Dans une quatrième étape a4. on calcule les moyennes respectives

~ S «•_ rarok S natoie S ^ et 5% fu t des densités de sonse moyenne Sv,(w _ parole) • ~ S< (m _ parole) ~ Sï(m) et ~ S,(m _brtut) précédemment calculées

sur les ensembles respectifs considérés des trames xb[m_parole], y[m_parole], y[m] et y[m_bruit]. La moyenne ccr_bruitàes coefficients de tonalité a,γ{m bruit) précédemment calculés sur l'ensemble considéré de trames y[m_bruit] est également calculée.

Dans une cinquième étape a5, on calcule cinq facteurs facteur(i), i étant un entier variant de un à cinq, caractéristiques de la gêne due au bruit dans le signal y(n), selon les formules suivantes; r , , . . Sr bruit facteur(1)= — = — ,

Sr e t . t n \ Sï bruit facteur(2)= —

SY _ parole facteur(3)= Ecart_type parole)) , l'opérateur

"Ecart_type (v(m))" désignant l'écart-type de la variable v sur l'ensemble des trames m, facteur(4)= ar_bmt , facteu r(5)= Ecart_type (m (m _ bruit)) . Dans une sixième étape a6, le calcul d'une note objective intermédiaire

NOB est obtenue par combinaison linéaire des cinq facteurs calculés à l'étape a5, suivant l'équation suivante:

5

NOB - ∑ o)fi acteur(ï) + <y« ,

M où les coefficients ωi à ω % sont des coefficients de pondération prédéfinis. Ces coefficients ont été déterminés de manière à obtenir une corrélation maximale entre les données subjectives issues d'une base de données de tests subjectifs, et les notes objectives NOB calculées par cette combinaison linéaire en utilisant les signaux de tests, bruités et traités x[m], xb[m] et y[m] utilisés lors de ces mêmes tests subjectifs. La base de données de tests subjectifs est par exempte une base de données de notes obtenues avec des groupes d'auditeurs conformément à ia "Recommandation UiT-T P.835™, dans laquelle ces notes sont appelées notes "background noise".

II est à noter que l'obtention des coefficients de pondération par l'utilisation d'une base de données de tests subjectifs n'est pas indispensable à chaque étape de calcul d'une note objective NOB. En effet, ces coefficients doivent être obtenus préalablement à la première utilisation du procédé, et peuvent être les mêmes pour toutes les utilisations du procédé. Ces coefficients sont néanmoins amenés à évoluer lorsque de nouvelles données subjectives viendront alimenter la base de données de tests subjectifs utilisée.

Enfin dans une dernière étape a7, une note objective NOB_MOS de la gêne due au bruit dans le signal traité y(n) sur l'échelle MOS est calculée en utilisant par exemple une fonction polynomiale d'ordre 3, suivant l'équation suivante:

NOB _ MOS = ∑ X 1 (NOB) w ,

où les coefficients λi à λ 4 sont déterminés de manière à ce que la note objective obtenue NOB_MOS caractérise la gêne due au bruit sur l'échelle MOS, c'est-à-dire sur une échelle de 1 à 5.

Selon un second mode de réalisation du procédé l'invention, la gêne due à la présence de bruit dans un signal audio bruité quelconque est évaluée de manière objective. On utilise le même environnement de test qu'à la figure 1 , mais en ôtant le module MRB de réduction de bruit. La source de signaux audio SSA délivre un signal audio de test x(n) ne contenant que du signal utile, auquel est ajouté un signal de bruit prédéfini généré par la source de bruit SB, pour obtenir en sortie de l'opérateur d'addition AD un signal bruité xb(n). Le signal de test x(n) et le signai bruité xb(n) sont alors directement envoyés à l'entrée de l'équipement de test EQT mettant en œuvre un procédé d'évaluation objective de la gêne due au bruit dans le signal bruité xb(n) selon l'invention, Comme dans le premier mode de réalisation, fes signaux x(n) et xb(n) sont supposés échantillonnés â la fréquence d'échantillonnage 8 kHz,

L'équipement de test EQT délivre en sortie un résultat d'évaluation RES, qui est une note objective NOB_MOS de la gêne due à la présence de bruit dans le signal bruité xb(n).

En référence à Ia figure 3, le procédé de calcul de la note objective NOB-MOS de la gêne due au bruit dans le signal bruité xb(n) selon l'invention est représenté sous la forme d'un algorithme comportant des étapes b1 à b7.

Ces étapes sont similaires aux étapes ai à a7 précédemment décrites dans le premier mode de réalisation, et seront donc un peu moins détaillées. Il est en effet à noter que si l'on applique les étapes de calcul a3 à a7 avec le signal y(n) égal au signal xb(n) dans le cas du premier mode de réalisation, on aboutit au deuxième mode de réalisation.

Dans une première étape b1 , les signaux x(n) et xb(n) sont découpés en trames x[m] et xb[m] d'indice temporel m.

Dans une seconde étape b2, une détection d'activité vocale est effectuée sur le signal x[m] de manière à déterminer si chaque trame courante d'indice m du signal bruité xb[m] est une trame contenant seulement du bruit, notée "m_bruit", ou une trame contenant aussi de la parole, notée "m_parole". Deux types de trames sont donc sélectionnés à partir des signaux x[m] et xb[m] en sortie de l'étape b2: - les trames de parole du signal bruité xb[m], notées xb[m_parole],

- et les trames de bruit du signal bruité xb[m], notées xb[m_bruit]. Dans une troisième étape b3, des mesures de sonie sont effectuées sur au moins des ensembles de trames xb[m_bruit] et xb[m_parole] issues de l'étape précédente b2, et au moins un ensemble de trames du signal xb[m] en sortie de i'étape b1. De plus les coefficients de tonalité d * au moins un ensemble de trames κb[m_bruit] sont mesurées.

Plus précisément, à cette étape, on calcule les densités de sortie moyennes Si/.(»i) , ~ Sxb(m _ parole) et ~ Sχb(m _hruit) de respectivement chacune des trames xb[m], xb[m_parole] et xb[m_bruit] des ensembles de trames considérés. De même ies coefficients de tonalité a-Mm bruit) de chacune

des trames xb[m_bruit] de l'ensemble considéré de trames xb[m_bruit] sont calculés.

Dans une quatrième étape b4, on calcule les moyennes respectives

~ Sy, , ÏSλb _ parole , et IM des densités de sonie moyenne ~ s. Α ( m ) , ~ Sxb(m parole) et ~ s.xb(m bruit) précédemment calculées sur les ensembles respectifs considérés des trames xb[m], xb[m_parole] et xb[m_bruit]. La moyenne des coefficients de tonalité a.w(m _bruit) précédemment calculés sur l'ensemble considéré de trames xb[m_bruit] est également calculée. Dans une cinquième étape b5, on calcule quatre facteurs facteur(i), i étant un entier variant de un à quatre, caractéristiques de la gêne due au bruit dans le signal bruité xb(n), selon les formules suivantes: i i. / A \ S Xb bruit facteur(1 )= — == ,

S Xb x i. / <-ιs S Xb bruit facteur(2)= =-

Sxb _ parole facteu r(3 )= cCxt __ bmu , facteur(4)= l'opérateur "Ecart_type (v(m))" désignant l'écart-type de la variable v sur l'ensemble des trames m.

Dans une sixième étape b6, le calcul d'une note objective intermédiaire NOB est obtenue par combinaison linéaire des quatre facteurs calculés à l'étape b5, suivant l'équation suivante:

NOB = ]T ohfacteur(i) -r ωs ,

où les coefficients ωi à ωs sont des coefficients de pondération prédéfinis. Ces coefficients ont été déterminés de manière à obtenir une corrélation maximale entre les données subjectives issues d'une base de données de tests subjectifs, et îes notes objectives NOB calculées par cette combinaison linéaire en utilisant les signaux de tests et îes signaux bruités x[m] et xb[m] utilisés lors de ces mêmes tests subjectifs. Tout comme pour

l'étape a6, l'obtention des coefficients de pondération par l'utilisation d'une base de données de tests subjectifs n'est pas indispensable à chaque étape de calcul d'une note objective NOB.

Enfin dans une dernière étape b7, une note objective NOBJVlOS de la gêne due au bruit dans le signal bruité xb(n) sur l'échelle MOS est calculée en utilisant par exemple une fonction polynomiale d'ordre 3, suivant l'équation suivante:

NOB _ MOS = ]T λ i (NOB)'-' , i-\ où les coefficients λi à λ 4 sont déterminés de manière à ce que la note objective obtenue NOB_MOS caractérise la gêne due au bruit sur l'échelle MOS, c'est-à-dire sur une échelle de 1 à 5.

Le calcul de densité de sonie moyenne et du coefficient de tonalité d'une trame d'un signal audio, utilisé dans les étapes a3 et b3, est maintenant décrit en relation avec la figure 4, selon un mode de réalisation préféré de l'invention.

Le calcul selon l'invention de la densité de sonie moyenne Su (m) d'une trame d'indice m quelconque d'un signal audio donné u[m], comprend les étapes d à c7 représentées à la figure 4 et exposées ci-après. Le calcul selon l'invention du coefficient de tonalité α(m) d'une trame d'indice m quelconque d'un signal audio donné u[m], comprend les étapes d , c2, c3 et c8 représentées à la figure 4 et exposées ci-après.

Dans ce qui suit, on considère une trame d'indice m quelconque d'un signai u[m], sachant que tout ou partie des trames du signal considéré subissent le même traitement. Le signal u[mj représente n'importe lequel des signaux x[m], xb[m], ou y[m] définis plus haut.

A Ia première étape d » on applique à ia trame d'indice m du signal u[mj un fenêtrage, par exemple un fenêtrage de type Hannîng, Hamming ou équivalent. On obtient alors une trame fenêtrée u_w[m].

A l'étape suivante c2, on applique à la trame fenêtrée u_w[m], une transformée de Fourier rapide (FFT) et on obtient en conséquence une trame correspondante U(m,f) dans le domaine fréquentiel.

A l'étape suivante c3, on calcule la densité spectrale de puissance γy (m, f) de la trame U(m,f). Un tel calcul est connu de l'homme du métier et ne sera pas, par conséquent, détaillé ici.

A l'issue de l'étape c3, pour le signal y[m_bruit] de l'étape a3 ou le signal xb[m_bruit] de l'étape b3, on passe par exemple à l'étape c8 pour le calcul du coefficient de tonalité, puis à l'étape c4 pour le calcul de la densité de sonie moyenne Su (m) , puisque pour ces deux signaux les deux calculs sont nécessaires. Pour les autres signaux des étapes a3 et b3 on passe à l'étape c4 pour le calcul de la densité de sonie moyenne Su (m) . Il est à noter que le calcul du coefficient de tonalité est indépendant du calcul de la densité de sonie moyenne Su (m) , les deux calculs peuvent donc s'effectuer en parallèle ou l'un après l'autre.

A l'étape c4, on applique à la densité spectrale de puissance γu(m,f) obtenue à l'étape précédente, une conversion de l'axe des fréquences à l'échelle des Barks, et on obtient en conséquence une densité spectrale de puissance, B, j (m,b) , sur l'échelle des Barks, appelée aussi spectre de Bark. Pour une fréquence d'échantillonnage de 8kHz, 18 bandes critiques doivent être considérées. Ce type de conversion est connu de l'homme du métier, le principe de cette conversion Hertz/Bark consiste à additionner toutes les contributions fréquentielfes présentes dans la bande critique considérée de ('échelle des Barks. Ensuite, à l'étape cδ, on applique à Ia densité spectrale de puissance sur l'échelle des Barks, By (m, b) , une convolution avec la fonction d'étalement couramment utilisée en psycho-acoustique, et on obtient en conséquence une densité spectrale étalée sur l'échelle des Barks » notée E L , (m,b) . Cette

fonction d'étalement a été formulée mathématiquement et une expression possible est:

101oglO(£(è)) = 15.81 + 7.5 *(b + 0.474) - 17.5 * y (1 + Φ + 0.474) 2 ) , où E(b) est la fonction d'étalement appliquée à la bande critique b considérée dans l'échelle des Barks et * symbolise l'opérateur de multiplication dans l'espace des nombres réels. Cette étape permet de prendre en compte l'interaction des bandes critiques adjacentes.

A l'étape suivante c6, on convertit la densité spectrale étalée

E 1J (m, b) obtenue précédemment en densités de sonie exprimées en sones. Pour cela, on opère une calibration de la densité spectrale étalée sur l'échelle des Barks, Ey (m, b) , par les facteurs respectifs d'échelonnement en puissance et d'échelonnement en sonie couramment utilisés en psychoacoustique. Le document "Recommandation UIT-T P.862", sections 10.2.1.3 et 10.2.1.4, donne un exemple d'une telle calibration par les facteurs précités. On convertit ensuite sur l'échelle des phones la grandeur obtenue. La conversion sur l'échelle des phones est effectuée en s'appuyant sur les courbes d'isosonie (courbes de Fletcher) conformément à la norme NF ISO 226 "Lignes isosoniques normales". On effectue alors une conversion sur l'échelle des sones de la grandeur précédemment convertie en phones. La conversion en sones est effectuée conformément à la loi de Zwicker selon laquelle : f N(phonc)-4Û x ;

N(sone) = 2^ 10 '

Pour obtenir plus d'information sur Ia conversion phone/sone, on pourra se reporter au document "PSYCHOACOUSTiQUE, L'oreille récepteur d'information", de E. Zwicker et R. Feldtkeller, édition Masson, 1981.

A l'issue de l'étape c6, on dispose d'un nombre B de valeurs de densité de sonie, S 1 ; (m, b) , de la trame d'indice m pour ia bande critique b, B étant le nombre de bandes critiques considérées dans l'échelle des Barks et l'indice b variant de 1 à B.

Enfin, à l'étape c7, on calcule la densité de sonie moyenne Su (m) de la trame d'indice m à partir desdites B valeurs de densité de sonie, selon l'équation suivante :

Sϋ(m) = ^ ∑Su(m,b)

B b=i Autrement dit, la densité de sonie moyenne Su (m) selon l'invention d'une trame d'indice m, est donc la moyenne des B valeurs de densité de sonie S LI (m,b) , de la trame d'indice m pour une bande critique b considérée.

Ces deux dernières étapes c6 et c7 correspondent à une conversion du domaine des Barks vers le domaine des Sones, permettant de calculer une intensité subjective moyenne, c'est-à-dire telle que perçue par l'oreille humaine.

En outre à l'étape c8, le coefficient de tonalité α(m) de la trame d'indice m est calculé selon l'équation suivante:

* symbolise l'opérateur de multiplication dans l'espace des nombres réels, f représente l'indice fréquentiel de la densité spectrale de puissance, et N désigne la taille de la transformée de Fourier rapide. Ce calcul est effectué selon le principe défini par J. D. Johnston dans son article "Transform coding of audio signais using perceptual noise criteria" du journal "IEEE Journa! on selected areas in communications » vol.6, n°2, February 1988".

Le coefficient de tonalité α d'un signal de base est une mesure permettant de montrer si certaines fréquences pures ressortent de ce signal. II est équivalent à une densité tonale. En effet, plus le coefficient de tonalité α est proche de 0, plus Ie signal est assimilé à du bruit, A l'inverse, plus le coefficient de tonalité α est proche de 1 , plus le signal est à composante

tonale majoritaire. Un coefficient de tonalité α proche de 1 atteste donc de la présence de signal utile, ou signal de parole.