[0001] La présente invention concerne de manière générale des procédé et dispositif de suppression
d'un signal de bruit dans un signal de parole, typiquement pour une application à
la radiotéléphonie main-libre. Elle a trait également à un système mettant en oeuvre
un tel dispositif en combinaison avec un annuleur d'écho.
[0002] Dans un environnement bruité, le signal électrique résultant d'une conversion acousto-électrique
d'un signal de parole est mélangé à un signal de bruit. Dès lors que le niveau du
signal de bruit dans cet environnement est élevé, par exemple dans l'habitacle d'un
véhicule, il est nécessaire de mettre en oeuvre des traitements visant à supprimer
le signal de bruit dans le signal électrique de parole. Typiquement, deux types de
traitement de suppression de bruit sont distingués selon la technique antérieure :
le traitement par soustraction spectrale et le traitement dit par banc de filtres.
[0003] Le traitement par banc de filtres, tel que décrit dans le brevet américain
US-A-4 628 529, consiste en une étape de séparation du signal d'entrée en une pluralité de signaux
temporels représentatifs chacun d'une bande de fréquences prédéterminée respective,
une étape d'estimation d'un rapport signal sur bruit pour chacun de ces signaux temporels,
une étape de pondération de ces signaux temporels par des coefficients respectifs
qui sont chacun fonction de l'un respectif des rapports signal sur bruit pour le signal
temporel considéré, et une étape d'addition de ces signaux temporels pondérés en un
signal résultant consistant en un signal de parole dans lequel le signal de bruit
est supprimé. Typiquement, chacun des rapports signal sur bruit est estimé en fonction
de la variation de la puissance du signal temporel considéré dans sa bande de fréquences
respective. Un tel traitement par banc de filtres nécessite des moyens de calcul considérables
en raison du fait que toutes les étapes de séparation, estimation, pondération et
addition précitées sont réalisées dans le domaine temporel. En pratique, dans un radiotéléphone,
les moyens de calcul étant limités, en termes de Millions d'Instructions Par Seconde
(Mips), par la capacité du processeur de traitement de signal numérique (DSP en terminologie
anglo-saxonne pour Digital Signal Processor), il est alors proposé de réduire le traitement
de suppression de signal de bruit à des bandes de fréquences grossières, et donc réduire
la finesse, ou précision, de ce traitement.
[0004] Le traitement par soustraction spectrale recourt pour sa part au domaine fréquentiel,
typiquement par utilisation de transformée de Fourier Rapide FFT (Fast Fourier Transform
en terminologie anglo-saxonne). Il présente l'inconvénient principal d'induire une
distorsion non linéaire dans le signal de parole traité qui résulte de la perte d'information
de phase de ce signal. En effet ce traitement par soustraction spectrale produit une
telle distorsion car il applique aux échantillons résultant de la Transformée de Fourier
Rapide du signal de parole bruité à traiter des fonctions de module au carré qui suppriment
l'information de phase, rendant ainsi ce traitement non linéaire. En outre, le défaut
de linéarité du traitement par soustraction spectrale empêche son utilisation efficacement
en combinaison avec un traitement d'annulation d'écho, telle que proposée par l'invention,
car le dispositif d'annulation d'écho est perturbé dans son fonctionnement par cette
perte d'information de phase.
[0005] Un premier objectif de la présente invention est de fournir un procédé de suppression
de bruit dans un signal de parole qui a pour avantage de réduire considérablement
la puissance de calcul nécessaire en termes de Nombre d'Instructions par Seconde,
comparativement à un traitement par banc de filtres.
[0006] Un second objectif de l'invention est de fournir un procédé n'induisant pas une distorsion
non linéaire dans le signal de parole à traiter, par contraste avec le traitement
par soustraction spectrale.
[0007] Un autre objectif de l'invention est de fournir un système comprenant un dispositif
de suppression de bruit mettant en oeuvre les étapes du procédé, en combinaison avec
un dispositif d'annulation d'écho.
[0008] A cette fin, un procédé de suppression d'un signal de bruit dans un signal de parole
bruité qui est échantillonné est caractérisé selon l'invention par les étapes de :
- traitement fréquentiel numérique dudit signal de parole bruité, pour produire des
coefficients temporels de filtrage, et
- traitement temporel numérique dudit signal de parole bruité en fonction desdits coefficients
de filtrage, en un signal de parole dans lequel ledit signal de bruit est sensiblement
supprimé.
[0009] Le procédé définit, pour un cycle de traitement donné, les étapes de traitement fréquentiel
numérique de:
- extraction d'une pluralité de composantes énergétiques fréquentielles dans ledit signal
de parole bruité,
- estimation, pour chacune des composantes énergétiques fréquentielles extraites, d'un
rapport entre un niveau d'énergie du signal de parole bruité et un niveau d'énergie
du signal de bruit,
- détermination d'un gain respectif pour ladite chacune des composantes énergétiques
fréquentielles extraites, en fonction dudit rapport estimé entre le niveau d'énergie
du signal de parole bruité et le niveau d'énergie du signal de bruit pour ladite chacune
sélectionnée des composantes fréquentielles, et
- synthèse desdits coefficients de filtrage en fonction desdits gains.
[0010] De préférence, l'étape d'extraction de composantes énergétiques fréquentielles comprend
les sous-étapes de
- production de K groupes comprenant chacun une pluralité de composantes fréquentielles,
respectivement pour K blocs entrelacés du signal de parole bruité, avec K entier,
et
- calcul d'une moyenne énergétique de K composantes fréquentielles de même rang respectivement
dans les K groupes, en l'une respective des composantes énergétiques fréquentielles
extraites.
[0011] Typiquement, l'étape de calcul est précédée, pour chacun des K groupes de composantes
fréquentielles, par une étape de sélection d'une partie des composantes fréquentielles
ayant des rangs prédéterminés respectifs dans ledit chacun des groupes, ladite partie
sélectionnée présentant un caractère de symétrie par rapport au complémentaire de
cette partie parmi la pluralité des composantes fréquentielles extraites. Par ailleurs,
les étapes de production et synthèse sont mises en oeuvre respectivement au moyen
de Transformée de Fourier Rapide et Transformée de Fourier Inverse.
[0012] Un dispositif pour la mise en oeuvre du procédé comprend, pour chacun de cycles de
traitement successifs,:
- des moyens pour extraire une pluralité de composantes énergétiques fréquentielles
dans ledit signal de parole bruité,
- des moyens pour estimer, pour chacune des composantes énergétiques fréquentielles
extraites, un rapport entre un niveau d'énergie du signal de parole bruité et un niveau
d'énergie de signal de bruit,
- des moyens pour déterminer un gain respectif pour ladite chacune des composantes énergétiques
fréquentielles extraites, en fonction dudit rapport estimé entre le niveau d'énergie
du signal de parole bruité et le niveau d'énergie du signal de bruit pour ladite chacune
sélectionnée des composantes fréquentielles,
- des moyens pour synthétiser lesdits coefficients de filtrage en fonction desdits gains,
et
- des moyens de filtrage temporel dudit signal de parole bruit en fonction desdits coefficients
de filtrage, en un signal de parole dans lequel ledit signal de bruit est sensiblement
supprimé.
[0013] L'invention fournit également deux variantes de système combiné d'annulation d'écho
et de suppression de bruit. Selon une première variante, le système comprend:
- un dispositif de suppression de bruit pour supprimer un signal de bruit dans un signal
de parole à transmettre, en un signal de parole débruité,
- un annuleur d'écho comprenant un premier moyen pour produire un signal d'écho estimé
en fonction d'un signal de parole donné et d'un signal de différence, et un second
moyen pour soustraire ledit signal d'écho estimé audit signal de parole débruité,
en ledit signal de différence.
[0014] In est caractérisé en ce que ledit dispositif de suppression de bruit est sous la
forme de:
- un moyen de traitement fréquentiel numérique dudit signal de parole à transmettre,
pour produire des coefficients temporels de filtrage, et
- un premier moyen de traitement temporel numérique pour traiter ledit signal de parole
à transmettre en fonction desdits coefficients de filtrage, en ledit signal de parole
débruité dans lequel ledit signal de bruit est sensiblement supprimé, et en ce que
ledit système comprend en outre:
- un second moyen de traitement temporel numérique, strictement similaire audit premier
moyen de traitement temporel, pour traiter un signal de parole reçu d'un terminal
distant en fonction desdits coefficients de filtrage, en ledit signal de parole donné.
[0015] Selon une seconde variante, le système comprend
- un annuleur d'écho comprenant un premier moyen pour produire un signal d'écho estimé
en fonction d'un signal de parole reçu d'un terminal distant et d'un signal de différence,
et un second moyen pour soustraire ledit signal d'écho estimé à un signal de parole
à transmettre, en ledit signal de différence,
[0016] Il est caractérisé en ce qu'il comprend en outre:
- un dispositif de suppression de bruit pour supprimer un signal de bruit dans le signal
de différence, en un signal de parole débruité, ledit dispositif de suppression de
bruit étant sous la forme de:
- un moyen de traitement fréquentiel numérique pour traiter ledit signal de parole à
transmettre, afin de produire des coefficients temporels de filtrage, et
- un moyen de traitement temporel numérique pour traiter ledit signal de différence
en fonction desdits coefficients de filtrage, en un signal de parole débruité dans
lequel ledit signal de bruit est sensiblement supprimé.
[0017] D'autres caractéristiques et avantages de la présente invention apparaîtront puis
clairement à la lecture de la description suivante, en référence aux dessins annexés
correspondants dans lesquels :
- la figure 1 montre sous la forme d'un bloc-diagramme un dispositif selon l'invention
de suppression de bruit dans un signal de parole;
- la figure 2 schématise des étapes de traitement mises en oeuvre dans un circuit du
dispositif de la figure 1;
- la figure 3 montre, sous forme de bloc-diagramme, une première réalisation selon l'invention
d'un système mettant en oeuvre le dispositif de la figure 1 en combinaison avec un
annuleur d'écho; et
- la figure 4 montre, sous forme de bloc-diagramme, une seconde réalisation selon l'invention
d'un système mettant en oeuvre le dispositif de la figure 1 en combinaison avec un
annuleur d'écho
[0018] En référence à la figure 1, un dispositif selon l'invention de suppression d'un signal
de bruit dans un signal de parole 1 comprend un circuit d'échantillonnage la, une
unité de traitement fréquentiel 100, et un circuit de traitement temporel 14. L'unité
de traitement fréquentiel 100 comprend en cascade un circuit d'extraction de composantes
énergétiques 10, un circuit d'estimation de rapport signal sur bruit 11, un circuit
de calcul de gain 12 et un circuit de synthèse de coefficients de filtrage 13. Le
circuit de traitement temporel 14 est un filtre temporel, de type filtre à réponse
impulsionnelle finie (FIR Filter en terminologie anglo-saxonne pour Finite Impulse
Response Filter).
[0019] Le circuit d'échantillonnage la échantillonne à une fréquence F=1/T un signal analogique
de parole bruité s(t) constitué d'un signal de bruit additionné à un signal de parole.
Le signal de parole bruité échantillonné s(nT) résultant de cet échantillonnage est
appliqué, d'une part, à une entrée du circuit d'extraction de composantes énergétiques
10 dans l'unité de traitement fréquentiel 100, et, d'autre part, à une entrée du filtre
temporel 14. La figure 2 schématise les traitements effectués dans le circuit 10 qui
reçoit le signal de parole bruité s(nT). Ce signal de parole bruité échantillonné
s(nT) se présente sous la forme de trames successives d'échantillons, quatre d'entr'elles
T(n-2), T(n-1), T(n) et T(n+1) étant représentées à une première ligne de la figure
2. Une trame T(n) est formée, selon la réalisation décrite, par M = 128 échantillons,
notés e(n)
m, l'indice m variant entre ○ et 127. Pour chaque trame de rang n, T(n), associée à
un cycle de traitement donné du procédé selon l'invention, sont produits K=3 blocs
d'échantillons B(1), B(2) et B(3), K étant un nombre entier. Ces K=3 blocs d'échantillons
sont formés selon la réalisation décrite à partir, d'une part, de cette trame de rang
n, T(n), et, d'autre part, des 2 trames T(n-2) et T(n-1), de rangs respectifs (n-2)
et (n-1). Les K=3 blocs d'échantillons B(1) à B(3) sont entrelacés et comprennent
chacun 2.M= 256 échantillons successifs dans les trames T(n-2) à T(n), à compter de
K=3 premiers échantillons respectifs de rangs 0 et M/2=64 dans la trame T(n-2) et
de rang ○ dans la trame T(n-1). Les groupes respectifs de 2.M échantillons formant
les blocs B(1), B(2) et B(3) sont notés b(1)
i, b(2)
i; et b(3)
i, i variant de 0 à (2.M - 1)=255. A ces groupes respectifs d'échantillons b(1)
i, b(2)
i, b(3)
i,
0 ≤
i ≤
255, sont appliquées respectivement trois transformées de Fourier rapides identiques
selon les étapes notées 100a, 100b, et 100c. Ces étapes de transformée de Fourier
rapide peuvent éventuellement être précédées par une opération de fenétrage temporel.
Par ces transformées de Fourier rapides, à chacun des K=3 groupes d'échantillons b(1)
i, b(2)
i et b(3)
i, est associé l'un respectif de K=3 groupes de composantes fréquentielles, notés E(1)
i, E(2)
i et E(3)
i, l'indice i variant de 0 à 255. L'étape notée 101 dans cette figure 2 vise à simplifier
la mise en oeuvre des traitements ultérieurs en sélectionnant seulement une partie
des composantes fréquentielles dans chaque groupe E(1)
i à E(3)
i, 0 ≤i ≤255. Cette étape se fonde sur la propriété suivante. La Transformée de Fourier
Rapide d'un signal réel présente une pseudo-symétrie. En effet, en sachant que les
échantillons formant le signal de parole sont réels, chaque groupe de composantes
fréquentielles E(k)
i, k= 1, 2 ou 3, peut s'écrire sous la forme:

L'étape de traitement 101 sélectionne, dans chaque groupe E(k=1)
i, E(k=2)
i et E(k=3)
i,
0 ≤
i ≤
255, une partie des composantes fréquentielles le constituant, à savoir les composantes
fréquentielles E(k)
o à E(k)
128 de rang 0 à 128, qui forment un groupe de composantes fréquentielles sélectionnées.
Ces 129 premières composantes fréquentielles sélectionnées sont suffisantes pour décrire
chaque groupe E(k)
i,
0 ≤
i ≤
255, de façon complète puisque les autres composantes fréquentielles dans le groupe,
à savoir les 127 dernières composantes E(k)
129 à E(k)
255, se déduisent par symétrie. Les composantes fréquentielles E(k)
O à E(k)
128 qui sont sélectionnées dans chaque groupe présentent en effet un caractère de symétrie
par rapport au complémentaire E(k)
129 à E(k)
255 de ces composantes sélectionnées parmi toutes les composantes fréquentielles dans
le groupe qui sont produites initialement. En sortie du traitement 101, sont ainsi
produites les composantes fréquentielles E(k)
O à E(k)
128 pour chaque groupe. Selon l'étape 102, les 129 composantes fréquentielles sélectionnées
dans chaque groupe sont décimées par 2, en vue de ne retenir qu'une composante sur
deux parmi chaque groupe de composantes sélectionné. Cette décimation par deux 102
vise à écarter sélectivement une composante sur deux, relative à une fréquence donnée,
en vue d'inhiber l'effet d'interaction que produit sur cette composante chacune des
deux composantes fréquentielles situées à deux fréquences respectives de part et d'autre
de ladite fréquence donnée. En pratique, sont retenues les 65 composantes fréquentielles
E(k)
i, avec i=1, 3, 5,.., 127,128, sachant que la composante fréquentielle E(k)
0 ne présente aucun intérêt à être retenue puisqu'il s'agit d'une composante continue.
A des fins de simplification de notation, ces composantes fréquentielles E(k)
i, avec i=1, 3, 5,..,127,128 sont notées E(k)
j, avec
0 ≤
j ≤
64. En résultat des étapes 101 et 102, est ainsi produite pour chaque groupe initial
de composantes E(1)
i, E(2)
i et E(3)
i,
0 ≤
i ≤
255, un groupe de composantes sélectionnées et décimées.
[0020] Selon l'étape 103, il est opéré un calcul de la moyenne énergétique de chaque triplet
de K=3 composantes fréquentielles de même rang j dans les K=3 groupes de composantes
fréquentielles sélectionnées et décimées E(1)
j, E (2)
j et E(3)
j, l'indice j variant de 0 à 64, pour produire 65 composantes énergétiques moyennées
Em
j, j variant de 0 à 64. Ce calcul comprend l'élévation au carré du module de chaque
composante fréquentielle de même rang j dans les K=3 groupes de composantes sélectionnées
et décimées, en K=3 composantes énergétiques, puis la moyenne de ces K=3 composantes
énergétiques.
[0021] Ainsi le dispositif 10 extrait pour un cycle relatif à une trame T(n) de traitement
du signal de parole bruité s(nT), 65 composantes énergétiques Em
j, chacune représentative d'une énergie, ou puissance, du signal de parole bruité s
(nT) pour la fréquence, ou bande de fréquence, considérée. In est à noter que toutes
les étapes 100, 101 et 102 décrites relativement à la figure 2, bien qu'améliorant
la mise en oeuvre du procédé selon l'invention, peuvent être réduites à une seule
étape consistant en l'application d'une unique transformée de Fourier FFT aux M =
128 échantillons de la trame T(n) retenue pour le cycle de traitement considéré. En
outre, l'étape de sélection 101 peut ou bien être opérée ou bien ne pas être opérée,
et cela directement sur les composantes fréquentielles résultant du(des) traitement(s)
FFT.
[0022] En revenant à la figure 1, les 65 composantes énergétiques Emj,
0 ≤
j ≤
64, sont appliquées à une entrée du circuit d'estimation de rapport signal sur bruit
11. Pour chacune de ces 65 composantes énergétiques extraites Em
j, le circuit 11 estime un rapport de signal sur bruit SNR
j entre le signal de parole bruité s(nT) et un signal de bruit inclus dans ce signal
de parole bruité, pour la composante énergétique considérée Em
j. Un tel rapport signal sur bruit est donné par:

dans laquelle l'exposant n repère le cycle de traitement relatif à la trame T(n) de
rang n et B
j dénote une composante d'énergie de bruit dans la composante énergétique Em
j de rang j.
[0023] En pratique, une telle estimation du rapport signal sur bruit se base sur le calcul
de la composante d'énergie de bruit estimée dans chaque composante énergétique donnée.
Elle utilise par exemple le rapport entre la composante énergétique Em
jn extraite et la composante énergétique de bruit B
jn-1 calculée précédemment au cours d'un cycle de traitement ayant précédé le cycle considéré
de traitement de suppression de signal de bruit dans la trame T(n). Plus ce rapport
est élevé, plus il traduit l'existence d'un signal de parole pour la composante énergétique
fréquentielle Em
jn considérée, auquel cas la composante de bruit B
j(n-1) calculée relativement à la composante énergétique Em
j(n-1) pour le rang (n-1) est maintenue en la composante de bruit B
jn. Plus ce rapport est faible, plus il traduit le fait que la composante énergétique
se résume à un signal de bruit, auquel cas la composante de bruit B
jn varie par calcul en conséquence. Le circuit 11 attribue un rapport signal sur bruit
SNR
j,
0 ≤
j ≤
64, à chaque composante énergétique extraite Emj,
0 ≤
j ≤
64, selon un algorithme d'estimation utilisant un tel principe. En fonction de ces 65
rapports signal sur bruit SNR
j, le circuit 12 calcule pour chacun d'eux, un gain G
j, prenant par exemple une valeur comprise sensiblement entre 0 et 1, qui est directement
lié au rapport signal sur bruit SNR
j pour la composante fréquentielle correspondante. Pour une composante énergétique
fréquentielle donnée Em
j, plus le rapport SNR
j du signal de parole bruité s (nT) sur signal de bruit est élevé, plus le gain G
j est faible, et plus le rapport SNR
j du signal de parole bruité sur le signal de bruit est faible, plus le gain G
j est élevé. Ainsi est atténuée la composante de signal de bruit pour chaque composante
énergétique fréquentielle Em
j. Ces gains G
j sont tels que la pondération des composantes énergétiques Em
j respectivement par ces gains donnerait un spectre discret de composantes énergétiques
fréquentielles pondérées, qui serait représentatif du signal de parole bruité s(nT)
dans lequel le signal de bruit est sensiblement supprimé.
[0024] Une sortie du circuit 12 produisant les gains G
j est appliquée à une entrée du circuit de synthèse des coefficients de filtrage 13.
Ce circuit 13 comprend un premier circuit (non représenté) de duplication des 65 gains
calculés Gj, en conformité avec l'équation donnée en (1). Ce circuit reçoit 65 gains,
notés G
0, G
1,..,G
64, et produit 128 gains pouvant s'écrire sous la forme d'un groupe de gains G
j, j compris entre 0 et 127, tel que suit:

[0025] Un second circuit (non représenté) dans le circuit de synthèse 13, sous la forme
d'une Transformée de Fourier Inverse TFD
-1, synthétise 128 coefficients C(nT) du filtre 14 par transformée de Fourier inverse
des 128 gains G
j. Ces coefficients notés C(nT), au nombre de 128, sont appliquées à une première entrée
de commande du filtre 14, typiquement filtre FIR. Une seconde entrée du filtre 14
reçoit le signal de parole bruité s(nT). Le filtre 14 opère une convolution des coefficients
C(nT) avec les 128 échantillons de la trame T(n), en une trame débruitée de 128 échantillons
formant partie du signal de parole débruité s*(nT). Le procédé résultant du dispositif
décrit ci-dessus est naturellement "adaptatif" en ce sens que les coefficients C(nT)
appliqués à l'entrée de commande du filtre FIR 14 sont modifiés pour chaque trame
T(n), de rang n donné, en fonction des traitements 10, 11, 12 et 13 des échantillons
formant le signal de parole à traiter.
[0026] En résumé de ce qui précède, la caractéristique principale du procédé de suppression
de bruit selon l'invention est d'utiliser, d'une part, un traitement fréquentiel numérique
100 du signal de parole bruité, pour produire des coefficients temporels de filtrage
C(nT), et, d'autre part, un traitement temporel numérique 14 du signal de parole bruité
s (nT) en fonction des coefficients de filtrage C(nT), pour produire un signal de
parole s*(nT) dans lequel le signal de bruit est sensiblement supprimé.
[0027] En référence à la figure 3, un système combiné de suppression de bruit et d'annulation
d'écho selon une première variante de l'invention qui est inclus dans un terminal,
typiquement un radiotéléphone main-libre, comprend un microphone 2, un haut parleur
4, un dispositif de suppression de bruit selon l'invention 1, tel que décrit précédemment,
un circuit de traitement temporel 14' et un annuleur d'écho 3. Le dispositif de suppression
de bruit 1 est identique au dispositif montré à la figure 1, et comprend principalement
une unité de traitement fréquentiel 100 et un circuit de traitement temporel 14. L'annuleur
d'écho est formé d'un soustracteur 30 et d'un circuit 31 qui produit un signal d'écho
estimé. Le microphone 2 reçoit un signal de parole à transmettre [s(t)+e(t)] formé
d'un signal de parole sonore bruité s(t) additionné à un signal d'écho e(t). Ce signal
d'écho résulte du couplage acoustique entre les haut-parleur 4 et microphone 2. Le
dispositif de suppression de bruit 1 traite, tel que décrit précédemment, le signal
de parole à transmettre en un signal de parole transmis débruité [s*(nT)+e*(nT)] qui
est appliqué à une première entrée du soustracteur 30 dont une seconde entrée reçoit
la sortie du circuit 31. Un signal de parole reçu r(t) en provenance d'un terminal
distant est appliqué, d'une part à une entrée du haut-parleur, et, d'autre part, à
une entrée du circuit 31 à travers le circuit de traitement temporel 14' précédé par
un échantillonneur 14a'. Selon une caractéristique importante de l'invention, le circuit
de traitement temporel 14' est à chaque instant strictement similaire au circuit de
traitement temporel 14 dans le dispositif de suppression de bruit 1 (FIG.1). Cette
caractéristique se base sur le fait que l'écho estimé du signal reçu r(t) produit
par le circuit 31 est à soustraire, dans le soustracteur 30, au signal d'écho traité
par suppression de bruit e*(nT) dans le circuit 1 et non au signal d'écho original
e(nT). Ce circuit 14' est donc une duplication pure et simple du circuit de traitement
temporel 14 dans le dispositif 1, comme indiqué par la flèche en trait discontinu
à deux extrémités dans la figure 3. Le circuit de traitement temporel 14' est donc
associé à chaque instant aux mêmes 128 coefficients de filtrage C(nT) que le circuit
14 dans le dispositif 1. Il traite le signal de parole reçu r(t) en un signal de parole
reçu débruité r*(nT). Ce traitement résulte de la convolution, par cycle de 128, des
coefficients C(nT) et des échantillons r(nT) du signal reçu r(t). Le circuit 31 produit
un signal d'estimation ê*(nT) du signal d'écho débruité e* (nT) à partir du signal
de parole reçu débruité r*(nT) et de coefficients d'annulation d'écho w(nT). En sortie
du soustracteur 30 est donc produit un signal de différence [s*(nT)+e*(nT)-ê*(nT)]
dans lequel le signal d'écho est sensiblement supprimé. Les coefficients d'annulation
d'écho w(nT) sont obtenus à partir de ce signal de différence.
[0028] En référence à la figure 4, un système combiné de suppression de bruit et d'annulation
d'écho selon une seconde variante de l'invention comprend un microphone 2, un haut
parleur 4, un annuleur d'écho 3, une unité de traitement fréquentiel 100, un circuit
de traitement temporel 14 et un échantillonneur 5. Les unité 100 et circuit 14 sont
identiques à ceux décrits dans la figure 1. L'annuleur d'écho 3 est formé d'un soustracteur
30 et d'un circuit 31 qui produit un signal d'écho estimé ê(nT). Le microphone 2 reçoit
un signal de parole transmis [s(t)+e(t)] formé d'un signal de parole sonore bruité
s(t) additionné à un signal d'écho e(t). Ce signal d'écho résulte du couplage acoustique
entre les haut-parleur 4 et microphone 2. Le signal de parole transmis [s(t)+e(t)]
est échantillonné dans l'échantillonneur 5 en le signal [s(nT)+e(nT)]. Ce signal échantillonné
est appliqué, d'une part, à une entrée de l'unité 100, et, d'autre part, à une entrée
du circuit 14 à travers le soustracteur 30. Un signal de parole reçu en provenance
d'un terminal distant r(t)- est appliqué, d'une part, à une entrée du circuit 31,
et, d'autre part, à une entrée du haut-parleur 4. Le circuit 31, recevant le signal
r(t), produit en réponse un signal d'écho estimé ê(nT) appliqué à une première entrée
du soustracteur 30 dont une seconde entrée reçoit le signal de parole transmis [s(nT)+e(nT)].
En sortie du soustracteur 30, est produit un signal de différence [s(nT)+e(nT)-ê(nT)]
appliqué au circuit 14. Selon cette variante, d'une part les traitements fréquentiels
mis en oeuvre dans l'unité 100 s'opèrent sur le signal de parole transmis [s(nT)+e(nT)],
et d'autre part le traitement temporel dans le circuit 14, à partir des coefficients
C(nT) produits par l'unité 100, s'opère sur le signal de différence, ou signal de
parole transmis traité par annulation d'écho, [s(nT)+e(nT)-ê(nT)]. Cette variante
évite de "dupliquer" le circuit 14 dans la branche incluant le circuit 31, comme représenté
par la flèche en trait discontinu dans la figure 3 pour la variante précédente.
1. Procédé de suppression d'un signal de bruit dans un signal de parole bruité (s(nT))
qui est échantillonné,
caractérisé par les étapes de :
- traitement fréquentiel numérique (100) dudit signal de parole bruité, pour produire
des coefficients temporels de filtrage (C(nT)), et
- traitement temporel numérique (14) dudit signal de parole bruité (s(nT)) en fonction
desdits coefficients de filtrage (C(nT)), en un signal de parole (s*(nT)) dans lequel
ledit signal de bruit est sensiblement supprimé.
2. Procédé de suppression d'un signal de bruit dans un signal de parole bruité conforme
à la revendication 1,
caractérisé, pour un cycle de traitement donné, par les étapes de traitement fréquentiel numérique
de:
- extraction (10) d'une pluralité de composantes énergétiques fréquentielles (Emj) dans ledit signal de parole bruité (s(nT)),
- estimation (11), pour chacune des composantes énergétiques fréquentielles extraites,
d'un rapport (SNRj) entre un niveau d'énergie du signal de parole bruité (s(nT)) et un niveau d'énergie
du signal de bruit,
- détermination (12) d'un gain (Gj) respectif pour ladite chacune des composantes énergétiques fréquentielles extraites
(Emj), en fonction dudit rapport (SNRj) estimé entre le niveau d'énergie du signal de parole bruité (s (nT)) et le niveau
d'énergie du signal de bruit pour ladite chacune sélectionnée des composantes fréquentielles,
et
- synthèse (13) desdits coefficients de filtrage (C(nT)) en fonction desdits gains
(Gj).
3. Procédé conforme à l'une quelconque des revendications 2 à 3,
caractérisé en ce que ladite étape d'extraction de composantes énergétiques fréquentielles comprend les
sous-étapes de
- production (100a, 100b, 100c) de K groupes comprenant chacun une pluralité de composantes
fréquentielles (E(1)i, E(2)i, E(3)i), respectivement pour K blocs (B(1), B(2), B(3)) entrelacés du signal de parole bruité
(s(nT)), avec K entier, et
- calcul (103) d'une moyenne énergétique de K composantes fréquentielles de même rang
(j) respectivement dans les K groupes, en l'une respective des composantes énergétiques
fréquentielles extraites.
4. Procédé conforme à la revendication 3, caractérisé en ce que ladite étape de calcul (103) est précédée, pour chacun des K groupes de composantes
fréquentielles, par une étape de sélection (101) d'une partie des composantes fréquentielles
ayant des rangs prédéterminés respectifs dans ledit chacun des groupes (E(1)i, E(2)i, E(3)i), ladite partie sélectionnée présentant un caractère de symétrie par rapport au complémentaire
de cette partie parmi la pluralité des composantes fréquentielles extraites.
5. Procédé conforme à l'une quelconque des revendications 2 à 4, caractérisé en ce que lesdites étapes de production (100a, 100b, 100c) et de synthèse (13) sont mises en
oeuvre respectivement au moyen de Transformée de Fourier Rapide et Transformée de
Fourier Inverse.
6. Dispositif (1) de suppression d'un signal de bruit dans un signal de parole bruité
(s(nT)) qui est échantillonné,
caractérisé en ce qu'il comprend, pour chacun de cycles de traitement successifs,:
- des moyens (10) pour extraire une pluralité de composantes énergétiques fréquentielles
(Emj) dans ledit signal de parole bruité (s(nT)),
- des moyens (11) pour estimer, pour chacune des composantes énergétiques fréquentielles
extraites, un rapport (SNRj) entre un niveau d'énergie du signal de parole bruité (s(nT)) et un niveau d'énergie
de signal de bruit,
- des moyens pour déterminer (12) un gain (Gj) respectif pour ladite chacune des composantes énergétiques fréquentielles extraites
(Emj), en fonction dudit rapport (SNRj) estimé entre le niveau d'énergie du signal de parole bruité (s(nT)) et le niveau
d'énergie du signal de bruit pour ladite chacune sélectionnée des composantes fréquentielles,
- des moyens (13) pour synthétiser lesdits coefficients de filtrage (C(nT)) en fonction
desdits gains (Gj), et
- des moyens de filtrage temporel (14) dudit signal de parole bruité (s(nT)) en fonction
desdits coefficients de filtrage (C(nT)), en un signal de parole (s(nT)) dans lequel
ledit signal de bruit est sensiblement supprimé.
7. Système combiné d'annulation d'écho (3) et de suppression de bruit (1), comprenant
- un dispositif de suppression de bruit (1) pour supprimer un signal de bruit dans
un signal de parole à transmettre (s(nT)+e(nT)), en un signal de parole débruité,
- un annuleur d'écho (3) comprenant un premier moyen (31) pour produire un signal
d'écho estimé (ê*(t)) en fonction d'un signal de parole donné (r*(nT)) et d'un signal
de différence (s*(nT)+e*(nT)-ê*(nT)), et un second moyen (30) pour soustraire ledit
signal d'écho estimé (ê*(t)) audit signal de parole débruité (s*(nT)+e*(nT)), en ledit
signal de différence (s*(nT)+e*(nT)-ê*(nT)),
caractérisé en ce que ledit dispositif de suppression de bruit est sous la forme de:
- un moyen de traitement fréquentiel numérique (100) dudit signal de parole à transmettre,
pour produire des coefficients temporels de filtrage (C(nT)), et
- un premier moyen de traitement temporel numérique (14) pour traiter ledit signal
de parole à transmettre (s (nT)) en fonction desdits coefficients de filtrage (C(nT)),
en ledit signal de parole débruité (s*(nT)+e*(nT)) dans lequel ledit signal de bruit
est sensiblement supprimé, et en ce que ledit système comprend en outre:
- un second moyen de traitement temporel numérique (14'), strictement similaire audit
premier moyen de traitement temporel (14), pour traiter un signal de parole reçu d'un
terminal distant (r(t)) en fonction desdits coefficients de filtrage (C(nT)), en ledit
signal de parole donné (r*(nT)).
8. Système combiné d'annulation d'écho (3) et de suppression de bruit (1) dans un signal
de parole à transmettre (s (nT)+e(nT)), comprenant
- un annuleur d'écho (3) comprenant un premier moyen (31) pour produire un signal
d'écho estimé (ê(t)) en fonction d'un signal de parole (r(t)) reçu d'un terminal distant
et d'un signal de différence (s(nT)+e(nT)-ê(nT)), et un second moyen (30) pour soustraire
ledit signal d'écho estimé (ê(t)) à un signal de parole à transmettre (s(nT)+e(nT)),
en ledit signal de différence (s(nT)+e(nT)-ê(nT)),
caractérisé en ce qu'il comprend:
- un dispositif de suppression de bruit (1) pour supprimer un signal de bruit dans
le signal de différence (s(nT) +e(nT)-ê(nT)), en un signal de parole débruité (s*(nT)+e*(nT)-ê*(nT)),
ledit dispositif de suppression de bruit étant sous la forme de:
- un moyen de traitement fréquentiel numérique (100) pour traiter ledit signal de
parole à transmettre (s(nT)+e (nT)), afin de produire des coefficients temporels de
filtrage (C(nT)), et
- un moyen de traitement temporel numérique (14) pour traiter ledit signal de différence
(s(nT)+e(nT)-ê(nT)) en fonction desdits coefficients de filtrage (C(nT)), en un signal
de parole débruité (s*(nT)+e*(nT)-ê*(nT)) dans lequel ledit signal de bruit est sensiblement
supprimé.