(19)
(11)EP 0 983 678 B1

(12)FASCICULE DE BREVET EUROPEEN

(45)Mention de la délivrance du brevet:
03.08.2005  Bulletin  2005/31

(21)Numéro de dépôt: 98925756.3

(22)Date de dépôt:  20.05.1998
(51)Int. Cl.7H04M 9/08
(86)Numéro de dépôt:
PCT/FR1998/001010
(87)Numéro de publication internationale:
WO 1998/053595 (26.11.1998 Gazette  1998/47)

(54)

PROCEDE ET DISPOSITIF DE REDUCTION D' ECHO ACOUSTIQUE MULTIVOIES ET DE SPATIALISATION SONORE

VERFAHREN UND GERÄT ZUR VERRINGERUNG DES AKOUSTISCHEN MEHRWEGECHOS UND FÜR RAUMKLANGEFFEKT

METHOD AND DEVICE FOR REDUCING MULTI-CHANNEL ACOUSTIC ECHO AND ADAPTING SOUND TO SPACE CONDITIONS


(84)Etats contractants désignés:
DE GB IT

(30)Priorité: 21.05.1997 FR 9706191

(43)Date de publication de la demande:
08.03.2000  Bulletin  2000/10

(73)Titulaire: FRANCE TELECOM
75015 Paris (FR)

(72)Inventeurs:
  • THOMAS, Jean-Philippe
    F-22350 Trezeny (FR)
  • SALIOU, Alain
    F-22300 Lannion (FR)
  • EMERIT, Marc
    F-22200 Guingamp (FR)
  • MAHIEUX, Yannick
    F-22140 Bégard (FR)

(74)Mandataire: Fréchède, Michel et al
Cabinet Plasseraud 65/67 rue de la Victoire
75440 Paris Cedex 09
75440 Paris Cedex 09 (FR)


(56)Documents cités: : 
EP-A- 0 709 999
  
  • HIROSHI OIKAWA ET AL: "AUDIO TELECONFERENCING SET WITH MULTIPATH ECHO CANCELLER" REVIEW OF THE ELECTRICAL COMMUNICATION LABORATORIES., vol. 36, no. 2, 1988, TOKYO JP, pages 217-223, XP002059139
  
Il est rappelé que: Dans un délai de neuf mois à compter de la date de publication de la mention de la délivrance de brevet européen, toute personne peut faire opposition au brevet européen délivré, auprès de l'Office européen des brevets. L'opposition doit être formée par écrit et motivée. Elle n'est réputée formée qu'après paiement de la taxe d'opposition. (Art. 99(1) Convention sur le brevet européen).


Description


[0001] La présente invention concerne un procédé et un dispositif de réduction d'écho acoustique multivoies, et de restitution du relief sonore ou "spatialisation" sonore. Elle trouve une application particulièrement importante dans les systèmes de transmission numérique de signaux sonores sur plusieurs canaux de transmission entre un site local et un ou plusieurs sites distants, chaque site comprenant plusieurs microphones et plusieurs haut-parleurs. De tels systèmes sont dits "multivoies" à la prise de son (le son est capté par plusieurs microphones), à la transmission (sur plusieurs canaux) et à la restitution du son (au moyen de plusieurs haut-parleurs).

[0002] Le document EP-A-709999 ainsi que l'article "Teleconferencing set with multipath echo canceller de H. Oikawa, Review of the Electrical Communications Laboratories, Vol. 36, N° 2, 1988, pages 217-223, décrivent de tels systèms.

[0003] A titre d'exemple non limitatif, la présente invention sera ici décrite dans son application aux salles de visioconférence, aussi bien pour la transmission entre deux salles, dans une configuration dite "point à point" (où l'image de la salle distante est affichée sur un écran, ou bien plusieurs points de vue de la salle distante sont affichés sur plusieurs écrans) que pour la transmission dans un réseau comportant plus de deux salles, dans une configuration dite "multipoint" (où les images des salles distantes sont affichées sur plusieurs écrans).

[0004] Dans une salle comportant N microphones et M haut-parleurs, il existe NxM chemins d'écho acoustique. D'une part, les systèmes classiques d'annulation d'écho acoustique ne permettent pas de réaliser un contrôle de l'écho à un coût raisonnable dans un tel contexte. D'autre part, associer pour la transmission chaque microphone d'une salle locale à un haut-parleur d'une salle distante, afin d'obtenir la meilleure spatialisation possible du son, multiplierait le nombre de canaux de transmission, ce qui entraînerait un coût de transmission prohibitif pour un développement commercial.

[0005] On connait, outre les systèmes classiques d'annulation d'écho acoustique, des systèmes de réduction d'écho acoustique fondés sur des variations de niveau des signaux sonores. Un inconvénient majeur généralement rencontré dans de tels systèmes est la limitation de l'interactivité, c'est-à-dire une baisse de qualité de réception, notamment une variation sensible du niveau sonore en réception, dans des situations dites de "double parole", c'est-à-dire en cas de présence simultanée d'un signal sonore local utile et d'un signal sonore utile provenant de la salle distante, dans une salle locale donnée.

[0006] La présente invention vise à fournir un procédé et un dispositif de réduction d'écho acoustique multivoies et de spatialisation, qui permettent de réduire l'écho tout en préservant l'interactivité et qui, tout en utilisant un nombre relativement faible de canaux de transmission, assurent la restitution du relief sonore. Dans son application à la visioconférence, la présente invention permet de rapprocher la réunion à distance d'une situation de communication naturelle.

[0007] Dans ce but, l'invention propose notamment un procédé de réduction d'écho acoustique et de spatialisation, dans un système de transmission numérique de signaux sonores sur P canaux de transmission, entre un site local et au moins un site distant, comportant chacun N microphones et M haut-parleurs, N, M, P étant des entiers, les valeurs de N et M pouvant différer selon les sites, suivant lequel :

(a) on calcule un cumulant pour chaque signal microphonique xi(n) du site local, i étant un entier compris entre 1 et N et n désignant le rang temporel des échantillons, et on calcule un cumulant pour chaque signal de haut-parleur zj(n) du site local, j étant un entier compris entre 1 et M (la notion de cumulant est définie plus loin) ; puis, pour tout i, 1 ≤ i ≤ N,

(b) on calcule une première atténuation Gmic(i,n) pour le signal microphonique xi(n) du site local à partir d'un rapport entre des cumulants obtenus précédemment ;

(c) on modifie la première atténuation Gmic(i,n) de façon à obtenir une deuxième atténuation G'mic(i,n) définie comme suit :

où S1(Gmic(i,n)) = s si Gmic(i,n) ≤ s,
S1(Gmic(i,n)) = Gmic(i,n) si s < Gmic(i,n) < 1 et
S1(Gmic(i,n)) = 1 si Gmic(i,n) ≥ 1,
s étant un seuil minimal prédéterminé strictement inférieur à 1 ;

(d) à partir des cumulants de signaux microphoniques et de haut-parleurs calculés précédemment, on détermine
   si le signal microphonique xi(n) est un signal d'écho seul ou un signal provenant uniquement du site local, suivant un premier cas, ou
   si le signal microphonique xi(n) présente des composantes provenant du site local et d'autres composantes provenant du site distant, suivant un second cas ;

(e) on calcule une troisième atténuation G"mic(i,n), qui dans ledit premier cas, est égale à la deuxième atténuation G'mic(i,n) et dans ledit second cas, est égale à la deuxième atténuation G'mic(i,n) dans le calcul de laquelle on augmente le seuil minimal s d'une valeur prédéterminée ;

(f) on calcule une quatrième atténuation Γ(i,n) à partir d'un rapport entre des cumulants de signaux microphoniques ;

(g) on modifie la quatrième atténuation Γ(i,n) de façon à obtenir une cinquième atténuation Γ'(i,n) définie comme suit :

où S2(Γ(i,n)) = s' si Γ(i,n) ≤ s',
S2(Γ(i,n)) = Γ(i,n) si s' < Γ(i,n) < 1 et
S2(Γ(i,n)) = 1 si Γ(i,n) ≥ 1,
s' étant un seuil minimal prédéterminé strictement inférieur à 1 ;

(h) on calcule le produit des troisième et cinquième atténuations G"mic(i,n) et Γ'(i,n) obtenues précédemment, de façon à obtenir une atténuation globale G*mic(i,n) définie par :

(i) on modifie l'atténuation globale G*mic(i,n) de façon à obtenir un coefficient de pondération βi(n) défini comme suit :

où S4(G*mic(i,n)) = s" si G*mic(i,n) ≤ s" et
S4(G*mic(i,n)) = G*mic(i,n) si s" < G*mic(i,n) ≤ 1,
s" étant un seuil minimal prédéterminé strictement inférieur à 1 ;

(j) on transmet sur chaque canal de transmission un signal yk(n), k étant un entier compris entre 1 et P, sous forme d'une combinaison linéaire des signaux microphoniques xi(n) pondérés, définie comme suit :

où αk,i(n) désigne des coefficients de codage réels prédéterminés et βi(n) désigne les coefficients de pondération obtenus précédemment ;
puis, pour tout entier j, 1 ≤ j ≤ M :

(k) on calcule, pour le signal de haut-parleur zj(n) du site distant, une sixième atténuation GHP(j,n) à partir de cumulants calculés pour chaque signal yk(n) transmis en provenance du site local ;

(ℓ) on modifie la sixième atténuation GHP(j,n) de façon à obtenir un coefficient de pondération λj(n) défini comme suit :

où S3(GHP(j,n)) = s* si GHP(j,n) ≤ s*,
S3(GHP(j,n)) = GHP(j,n) si s* < GHP(j,n) < 1 et
S3(GHP(j,n)) = 1 si GHP(j,n) ≥ 1,
s* étant un seuil minimal prédéterminé strictement inférieur à 1 ;

(m) on détermine le signal de haut-parleur zj(n) du site distant à partir d'une combinaison linéaire des signaux transmis yk(n) pondérés, définie comme suit :

où γj,k(n) désigne des coefficients de décodage réels prédéterminés, et où λj(n) désigne les coefficients de pondération obtenus précédemment ; et

(n) on émet sur le jème haut-parleur du site distant le signal de haut-parleur zj(n) ainsi obtenu.



[0008] Les opérations ci-dessus sont effectuées de façon similaire dans toutes les salles du réseau considéré, à la fois en émission et en réception. Dans toute la suite, pour simplifier, on considère une salle donnée dite "locale" et une ou plusieurs salles "distantes", et on ne décrit que les opérations effectuées dans la salle locale à l'émission et les opérations effectuées dans la ou les salle(s) distante(s) à la réception, bien que des opérations similaires soient également effectuées dans la ou les salle(s) distante(s) à l'émission et dans la salle locale à la réception, respectivement.

[0009] Dans le même but que décrit plus haut, la présente invention propose également un dispositif de réduction d'écho acoustique et de spatialisation, dans un système de transmission numérique de signaux sonores sur P canaux de transmission, entre un site local et au moins un site distant, comportant chacun N microphones et M haut-parleurs, N, M, P étant des entiers, les valeurs de N et M pouvant différer selon les sites, caractérisé en ce qu'il comprend :

un module de codage des signaux sonores, recevant en entrée N signaux numériques xi(n) provenant respectivement des N microphones du site local, où i est un entier compris entre 1 et N, et n est un entier qui désigne le rang temporel des échantillons, ce module de codage fournissant en sortie P signaux numériques yk(n), où k est un entier compris entre 1 et P, définis par la formule suivante :

où αk,i(n) désigne des coefficients de codage réels prédéterminés, et
où βi(n) désigne des coefficients de pondération qui dépendent de cumulants des signaux reçus par les microphones du site local et de cumulants des signaux émis par les haut-parleurs du site local,
les P signaux yk(n) étant transmis respectivement sur les P canaux de transmission entre le site local et le site distant ; et

un module de décodage des signaux sonores, recevant en entrée les P signaux yk(n) et fournissant en sortie M signaux numériques zj(n) à émettre respectivement par les M haut-parleurs de chaque site, où j est un entier compris entre 1 et M, définis par la formule suivante :

où γj,k(n) désigne des coefficients de décodage réels prédéterminés, et
où λj(n) désigne des coefficients de pondération qui dépendent des signaux yk(n).



[0010] D'autres caractéristiques et avantages de la présente invention apparaîtront à la lecture de la description détaillée qui suit de modes particuliers de réalisation, donnés à titre d'exemples non limitatifs. La description se réfère aux dessins annexés, dans lesquels :
  • la figure 1 représente de façon schématique et simplifiée une salle de visioconférence classique du type à plusieurs microphones et plusieurs haut-parleurs, dans laquelle la disposition des principaux éléments est donnée à titre d'exemple non limitatif ;
  • la figure 2 est un organigramme général du procédé de la présente invention, dans un mode particulier de réalisation ;
  • la figure 3 représente de façon schématique le dispositif de la présente invention, dans un mode particulier de réalisation ;
  • la figure 4 représente de façon schématique un module de codage compris dans le dispositif de la présente invention, dans un mode particulier de réalisation ; et
  • la figure 5 représente de façon schématique un module de décodage compris dans le dispositif de la présente invention, dans un mode particulier de réalisation.


[0011] Dans toute la suite, on décrit la présente invention dans son application à un réseau d'au moins deux salles de visioconférence. Cette application fournit un exemple non limitatif de système de transmission numérique de signaux sonores entre un site local et un ou plusieurs sites distants comportant chacun plusieurs microphones et plusieurs haut-parleurs. Les signaux sonores considérés ici sont généralement des signaux de parole.

[0012] On suppose dans la présente description que dans une salle donnée, qu'il s'agisse d'une salle locale ou distante, les microphones et les haut-parleurs sont choisis de telle façon que le couplage entre haut-parleurs et microphones est négatif. Cela signifie que la valeur maximale, en dB, de la fonction de transfert entre l'entrée des amplificateurs des haut-parleurs et la sortie des préamplificateurs auxquels sont connectés les microphones est négative. L'énergie d'un signal issu du préamplificateur d'un microphone et provenant d'un haut-parleur de la même salle est donc inférieure à l'énergie du signal en entrée de l'amplificateur de ce haut-parleur. Le couplage négatif assure la stabilité de la boucle acoustique ; en particulier, il n'y a pas d'effet Larsen. D'autre part, cela permet de discriminer entre l'écho et la parole distante utile, puisque le niveau moyen de l'écho est toujours inférieur au niveau moyen de la parole distante utile. L'hypothèse du couplage négatif est vérifiée dans la plupart des salles de visioconférence classiques.

[0013] On appelle "signal microphonique à un instant donné" l'ensemble des signaux sonores captés par un microphone à cet instant. On appelle "signal de haut-parleur à un instant donné" le signal sonore émis par un haut-parleur à cet instant.

[0014] On rappelle, en relation avec la figure 1, qu'une salle de visioconférence 10 classique du type à plusieurs microphones et plusieurs haut-parleurs comprend plusieurs microphones 12, plusieurs haut-parleurs 14, et au moins un écran 16, en plus du mobilier courant (généralement table(s) et siège(s)). Pour plus de clarté, on a représenté seulement un microphone 12, deux haut-parleurs 14, un écran 16 et une table 18.

[0015] On considère dans toute la suite une salle locale ayant N microphones et M haut-parleurs, les entiers N et M n'étant pas nécessairement égaux, et une ou plusieurs salles distantes, selon le mode de réalisation envisagé, ayant également N microphones et M haut-parleurs. Les entiers N et M peuvent être différents d'une salle du réseau à une autre.

[0016] Les salles de visioconférence considérées ne comportent généralement pas plus de 12 microphones et 16 haut-parleurs.

[0017] On décrit d'abord le procédé de la présente invention, dans un mode particulier de réalisation, à l'aide de la figure 2.

[0018] Au cours d'une première étape, on calcule des grandeurs statistiques appelées cumulants, sur les signaux de chaque microphone et haut-parleur de la salle locale. Ces grandeurs décrivent les distributions des signaux microphoniques et de haut-parleur. A titre d'exemple non limitatif, on peut les estimer soit en large bande, soit sur certaines bandes de fréquence.

[0019] On rappelle que les cumulants sont les dérivées partielles successives de la seconde fonction caractéristique d'un vecteur aléatoire, prises à l'origine. En particulier, on montre que pour deux signaux a et b, si a = b = x alors le cumulant d'ordre 2 des signaux a et b, appelé dans ce cas auto-cumulant d'ordre 2 du signal x, représente l'énergie du signal x, et si a ≠ b alors le cumulant d'ordre 2 des signaux a et b, appelé dans ce cas inter-cumulant d'ordre 2 des signaux a et b, représente la fonction d'intercorrélation des signaux a et b.

[0020] Dans un mode particulier de réalisation du procédé de la présente invention, on choisit comme cumulant pour les signaux microphoniques et les signaux de haut-parleur l'auto-cumulant d'ordre 2, c'est-à-dire l'énergie de ces signaux. On note xi(n) le signal capté par le ième microphone d'une salle donnée, i étant un entier compris entre 1 et N, et n désignant le rang temporel des échantillons. On note zj(n) le signal émis par le jème haut-parleur d'une salle donnée, j étant un entier compris entre 1 et M. On note Cum2(xi(n)) et Cum2(zj(n)) les énergies respectives des signaux microphoniques et de haut-parleur.

[0021] Cette première étape est indiquée par le chiffre de référence 1000 sur la figure 2.

[0022] Dans une variante non détaillée ici, on peut choisir comme cumulants des inter-cumulants d'ordre 2, c'est-à-dire des fonctions d'intercorrélation des signaux microphoniques et de haut-parleur.

[0023] Puis, comme indiqué en 1001 sur la figure 2, à partir de ces grandeurs statistiques, on calcule pour chaque signal microphonique de la salle locale une première atténuation Gmic(i,n) permettant de réduire l'écho en fonction des signaux de haut-parleurs de la salle locale.

[0024] Dans le mode particulier de réalisation mentionné précédemment, où les cumulants choisis sont les énergies, on calcule la première atténuation Gmic(i,n) à partir de la formule suivante :

où C est une constante réelle strictement supérieure à 1. En présence de signaux de haut-parleurs, cette constante permet d'atténuer plus rapidement les signaux microphoniques, ce qui permet de réduire l'écho plus rapidement. Le choix de C est lié en particulier à des caractéristiques acoustiques de la salle et des transducteurs utilisés. A titre d'exemple non limitatif et dans un contexte acoustique particulier, on peut choisir C = 8.

[0025] On peut calculer les cumulants ainsi que la première atténuation Gmic(i,n) soit à chaque échantillon, soit à une cadence inférieure à la fréquence d'échantillonnage, soit par trame de plusieurs échantillons, à titre d'exemples non limitatifs. Dans ce dernier cas, on peut par exemple calculer une valeur moyenne des cumulants et de la première atténuation sur une trame donnée et attribuer cette valeur moyenne à chaque échantillon de cette trame.

[0026] Cependant, on n'applique pas la première atténuation Gmic(i,n) en l'état au signal microphonique correspondant xi(n).

[0027] Pour éviter une saturation des signaux microphoniques, on modifie la première atténuation Gmic(i,n) de façon qu'elle ait une valeur maximale égale à 1 et qu'elle ait comme valeur minimale l'atténuation souhaitée, qui dépend du niveau de l'écho acoustique.

[0028] Comme indiqué en 1002 sur la figure 2, on obtient ainsi pour chaque signal microphonique de la salle locale une atténuation modifiée appelée deuxième atténuation, notée G'mic(i,n) et définie par :

où S1(Gmic(i,n)) = s si Gmic(i,n) ≤ s,
S1(Gmic(i,n)) = Gmic(i,n) si s < Gmic(i,n) < 1 et
S1(Gmic(i,n)) = 1 si Gmic(i,n) ≥ 1.

[0029] Le seuil minimal s est l'atténuation souhaitée précitée. Dans l'exemple précité où C = 8, pour une fonction de transfert entre haut-parleurs et microphones ayant une valeur moyenne de -20 dB sur l'ensemble du domaine des fréquences mises en oeuvre, un seuil minimal avantageux est s = 0,1, ce qui correspond, en dB, à 20 log10s = -20 dB, où log10 désigne le logarithme décimal.

[0030] Cependant, on n'applique pas non plus la deuxième atténuation G'mic(i,n) en l'état au signal microphonique correspondant xi(n). Sinon, dans le cas de la double parole, c'est-à-dire en présence de parole locale et distante simultanées, le signal de parole local subirait la même atténuation que l'écho, ce qui limiterait l'interactivité. On effectue pour cela un ajustement supplémentaire des atténuations à appliquer aux signaux microphoniques.

[0031] A partir du rapport de cumulants (1) calculé précédemment, on détermine, microphone par microphone, pour tout entier i compris entre 1 et N, si le signal microphonique xi(n) est un signal d'écho seul ou un signal de parole locale seule, suivant un premier cas, ou si xi(n) est un signal de double parole, suivant un second cas.

[0032] Dans un mode particulier de réalisation, si la première atténuation Gmic(i,n) a une valeur très inférieure à 1, cela signifie qu'on est en présence d'un signal d'écho seul, étant donné qu'on a supposé que le couplage entre haut-parleurs et microphones est négatif. Si Gmic(i,n) est très supérieur à 1, on est en présence d'un signal de parole locale seule. Si Gmic(i,n) a une valeur intermédiaire, on est en présence de double parole.

[0033] Cette détermination du type de chaque signal microphonique peut être effectuée à l'aide de toute autre méthode jugée appropriée.

[0034] En fonction de la détermination du type de chaque signal microphonique xi(n), on calcule une troisième atténuation G"mic(i,n), comme indiqué en 1003 sur la figure 2, à partir de la deuxième atténuation G'mic(i,n), comme suit. Dans le premier cas précité, où le signal microphonique xi(n) est un signal d'écho seul ou un signal de parole locale seule, la troisième atténuation est G"mic(i,n) = G'mic(i,n). Dans le second cas précité, où le signal microphonique xi(n) est un signal de double parole, on "relàche" l'atténuation, c'est-à-dire que dans le calcul de la deuxième atténuation G'mic(i,n), on remplace la valeur initiale du seuil minimal s par une valeur plus élevée, dans une proportion telle que l'écho soit perceptible, mais non gênant. Dans l'exemple précité où C = 8 et s = 0,1, on peut par exemple choisir d'augmenter le seuil s lorsque le rapport de cumulants (1) est supérieur à -12 dB ; on peut choisir de le faire passer à s = 0,7, soit environ -3 dB. Ce relâchement de l'atténuation, effectué uniquement pour les microphones qui captent un signal de parole locale, contribue notamment à préserver l'interactivité.

[0035] Les étapes décrites précédemment concernent des opérations effectuées séparément pour chaque microphone de la salle locale. Afin de prendre en compte dans chacune de ces opérations la présence des autres microphones de la salle locale, on calcule pour chaque signal microphonique xi(n) une atténuation additionnelle, appelée quatrième atténuation et notée Γ(i,n), comme indiqué en 1004 sur la figure 2.

[0036] La quatrième atténuation Γ(i,n) tient compte des signaux microphoniques xq(n), où q est un entier différent de i et compris entre 1 et N. Elle est calculée à partir d'un rapport entre des cumulants de signaux microphoniques. Dans un mode particulier de réalisation, on choisit comme cumulant pour les signaux microphoniques xi(n) l'auto-cumulant d'ordre 2, c'est-à-dire l'énergie de ces signaux, et on calcule la quatrième atténuation Γ(i,n) pour chaque signal microphonique xi(n) à partir de la formule suivante :



[0037] Comme on l'a indiqué plus haut, on peut estimer les auto-cumulants des signaux microphoniques, d'une part, soit en large bande, soit sur certaines bandes de fréquence, et d'autre part, soit à chaque échantillon, soit à une cadence inférieure à la fréquence d'échantillonnage, soit par trame de plusieurs échantillons.

[0038] Dans le rapport de cumulants (3), il est particulièrement avantageux d'utiliser au dénominateur le produit des cumulants des signaux microphoniques autres que le ième signal microphonique. Néanmoins, en variante, on peut utiliser la somme des mêmes cumulants.

[0039] Cependant, on n'applique pas la quatrième atténuation Γ(i,n) en l'état au signal microphonique correspondant xi(n).

[0040] Pour éviter une saturation des signaux microphoniques, on modifie la quatrième atténuation Γ(i,n) suivant une étape analogue à l'étape de modification de la première atténuation Gmic(i,n), décrite plus haut.

[0041] Comme indiqué en 1005 sur la figure 2, on obtient ainsi pour chaque signal microphonique de la salle locale une cinquième atténuation Γ'(i,n), définie par :

où S2(Γ(i,n)) = s' si Γ(i,n) ≤ s',
S2(Γ(i,n)) = Γ(i,n) si s' < Γ(i,n) < 1 et
S2(Γ(i,n)) = 1 si Γ(i,n) ≥ 1.

[0042] Le seuil minimal s' est l'atténuation souhaitée, qui dépend principalement du niveau de diaphonie perceptible, et dans une moindre mesure, du niveau d'écho. La diaphonie est ici caractérisée par des interférences perceptibles dans le signal microphonique xi(n), entre la parole qui provient du locuteur s'exprimant devant le ième microphone de la salle locale et la parole qui provient de locuteurs s'exprimant devant les autres microphones de la salle locale et qui est également captée par le ième microphone.

[0043] Dans l'exemple précité où C = 8 et s = 0,1 (ou s = 0,7 en cas de double parole), un seuil s' avantageux est s' = 0,125, soit environ -18 dB.

[0044] On calcule ensuite le produit des troisième et cinquième atténuations G"mic(i,n) et Γ'(i,n) obtenues précédemment, de façon à obtenir pour chaque signal microphonique xi(n) une atténuation globale G*mic(i,n) définie par :



[0045] On modifie cette atténuation globale de façon à obtenir pour chaque signal microphonique xi(n), comme indiqué en 1006 sur la figure 2, un coefficient de pondération βi(n) défini comme suit :

où S4(G*mic(i,n)) = s" si G*mic(i,n) ≤ s" et
S4(G*mic(i,n)) = G*mic(i,n) si s" < G*mic(i,n) ≤ 1,
s" étant un seuil minimal prédéterminé strictement inférieur à 1.

[0046] Dans l'exemple précité où C = 8, s = 0, 1 (ou s = 0, 7 en cas de double parole) et s' = 0,125, un seuil s" avantageux est s" = 0,1.

[0047] On applique à chaque signal microphonique xi(n) le coefficient de pondération βi(n) correspondant.

[0048] En variante aux étapes 1005 et 1006, on peut tout d'abord calculer l'atténuation Γ"(i,n) puis l'appliquer au signal microphonique correspondant xi(n), de façon à obtenir un signal microphonique atténué ; on calcule ensuite l'atténuation G"mic(i,n) et on l'applique au signal microphonique atténué.

[0049] On suppose que P canaux sont prévus pour la transmission numérique entre la salle locale et la ou les salles distantes.

[0050] Dans le mode particulier de réalisation décrit, l'étape suivante du procédé de la présente invention consiste à transmettre sur chaque canal de transmission un signal yk(n), k étant un entier compris entre 1 et P, comme indiqué en 1007 sur la figure 2, sous forme d'une combinaison linéaire des signaux microphoniques xi(n) pondérés, définie comme suit :

où αk,i(n) désigne des coefficients de codage réels prédéterminés et βi(n) désigne les coefficients de pondération obtenus précédemment.

[0051] Les coefficients βi(n) varient au cours du temps et contribuent notamment à réduire l'écho tout en préservant l'interactivité. Ils permettent en outre de privilégier le ou les microphone(s) actif (s) et de favoriser la spatialisation du son.

[0052] Les coefficients αk,i(n), 1 ≤ k ≤ P, 1 ≤ i ≤ N, forment une matrice de codage à P lignes et N colonnes. Le coefficient situé à l'intersection de la k0ème ligne et de la i0ème colonne, noté αk0,i0(n), où k0 est un entier compris entre 1 et P et i0 est un entier compris entre 1 et N, représente la contribution du i0ème microphone au k0ème canal de transmission.

[0053] Ainsi, chaque ligne de la matrice de codage fournit les contributions des N microphones à un canal de transmission donné, et chaque colonne fournit les contributions d'un microphone donné aux différents canaux de transmission. La somme des coefficients de chaque colonne vaut 1.

[0054] Ces contributions, c'est-à-dire les coefficients αk,i(n), sont inférieures ou égales à 1 et sont choisies de façon appropriée selon le contexte acoustique et vidéo. Les coefficients αk,i(n) dépendent notamment de la configuration du réseau de salles de visioconférence. Par exemple, ils diffèrent selon que la configuration est du type point à point ou multipoint (ces notions ont été définies en introduction). Les coefficients αk,i(n) dépendent également de la prise de vue effectuée dans les salles de visioconférence du réseau, de façon à assurer la concordance entre les signaux sonores et les images fournies par les écrans des différentes salles.

[0055] Chaque microphone est généralement associé à une région de la salle locale. Chaque canal transmet généralement les contributions de microphones voisins d'une même région.

[0056] A titre d'exemple non limitatif, dans le cas où N = 6 (six microphones) et P = 2 (deux canaux de transmission), la matrice de codage peut être choisie comme suit :
1 1 1/2 1/2 0 0
0 0 1/2 1/2 1 1


[0057] On a choisi dans cet exemple d'associer les premier et deuxième microphones à une région "gauche", les deuxième et troisième microphones à une région "centre" et les cinquième et sixième microphones à une région "droite", en fonction de leur emplacement dans la salle.

[0058] Les signaux des premier et deuxième microphones sont transmis sur le premier canal (α1.1 = α1.2 = 1). Les signaux des cinquième et sixième microphones sont transmis sur le deuxième canal (α2.5 = α2.6 = 1). Les signaux des troisième et quatrième microphones sont transmis à 50 % sur le premier canal et à 50 % sur le deuxième canal (α1.3 = α1.4 = α2.3 = α2.4 = 1/2). Les contributions des cinquième et sixième microphones au premier canal sont considérées comme négligeables, étant donné l'emplacement sensiblement éloigné de ces microphones par rapport à la région "gauche" (α1.5 = α1.6 = 0). De même, les contributions des premier et deuxième microphones au deuxième canal sont considérées comme négligeables, étant donné l'emplacement sensiblement éloigné de ces microphones par rapport à la région "gauche" (α2.1 = α2.2 = 0).

[0059] On considère dans ce qui suit la réception dans une salle distante donnée.

[0060] L'étape suivante du procédé consiste à calculer, pour chaque signal de haut-parleur zj(n) de cette salle distante, une sixième atténuation GHP(j,n), comme indiqué en 1008 sur la figure 2, à partir de cumulants calculés pour chaque signal yk(n) transmis en provenance de la salle locale considérée précédemment.

[0061] Dans un mode particulier de réalisation, la sixième atténuation GHP(j,n) est issue d'un rapport entre des auto-cumulants d'ordre 2 (énergies) et des inter-cumulants d'ordre 2 (fonctions d'intercorrélation) des signaux transmis yk(n). De même que pour les cumulants mentionnés plus haut, le calcul peut être effectué par bande de fréquence ou en large bande.

[0062] De même que pour les atténuations calculées à l'émission, on applique à la sixième atténuation GHP(j,n) un seuil minimal, noté s* et strictement inférieur à 1, et un seuil maximal de 1, de façon que cette atténuation ait pour valeur maximale 1 et pour valeur minimale l'atténuation souhaitée en fonction de la diaphonie et de l'écho.

[0063] Comme indiqué en 1009 sur la figure 2, on obtient ainsi un coefficient de pondération λj(n) défini comme suit :

où S3(GHP(j,n)) = s* si GHP(j,n) ≤ s*,
S3(GHP(j,n)) = GHP(j,n) si s* < GHP(j,n) < 1 et
S3(GHP(j,n)) = 1 si GHP(j,n) ≥ 1.

[0064] A titre d'exemple non limitatif, dans le cas où P = 2 (deux canaux de transmission) et M = 3 (trois haut-parleurs), les coefficients de pondération peuvent être obtenus comme suit :



où Cum2(y1(n)) est un auto-cumulant d'ordre 2 qui représente l'énergie du signal transmis y1(n), et
où Cum2(y2(n)) est un auto-cumulant d'ordre 2 qui représente l'énergie du signal transmis y2(n).

[0065] Dans le même exemple, on peut choisir λ1(n) = λ3(n) = 1 + s* - λ2(n).

[0066] Ces expressions se généralisent aisément à un nombre plus élevé de canaux de transmission et de haut-parleurs.

[0067] Dans l'exemple précité où C = 8, s = 0,1 (ou s = 0,7 en cas de double parole) et s' = 0,125, un seuil s* avantageux est s* = s' = 0,125, soit environ -18 dB.

[0068] Comme indiqué en 1010 sur la figure 2, on détermine ensuite chaque signal de haut-parleur zj(n) de la salle distante, à partir d'une combinaison linéaire des signaux transmis yk(n) pondérés, définie comme suit :

où γj,k(n) désigne des coefficients de décodage réels prédéterminés et λj(n) désigne les coefficients de pondération obtenus précédemment.

[0069] Les coefficients λj(n) varient au cours du temps et contribuent notamment à améliorer la restitution du relief sonore et à réduire la diaphonie éventuelle, en particulier en cas de transmission sur un nombre P de canaux inférieur au nombre M de haut-parleurs. Ils contribuent également à réduire l'écho acoustique en limitant le nombre de haut-parleurs actifs à tout moment.

[0070] Les coefficients γj,k(n), 1 ≤ j ≤ M, 1 ≤ k ≤ P, forment une matrice de décodage à P lignes et M colonnes. Ils dépendent notamment de la disposition des haut-parleurs et du mode d'affichage des images dans les salles de visioconférence du réseau. A la différence des coefficients de codage αk,i(n), les coefficients γj,k(n) sont indépendants de la configuration point à point ou multipoint du réseau.

[0071] L'étape suivante du procédé consiste à émettre, au moyen du jème haut-parleur de la salle distante, pour tout entier j compris entre 1 et M, le signal de haut-parleur zj(n) obtenu à partir de la formule (8).

[0072] Dans un mode particulier de réalisation, on transmet en outre sur les P canaux de transmission les produits γj,k(n).λj(n), 1 ≤ j ≤ M, 1 ≤ k ≤ P, à la même cadence que les signaux sonores. Ainsi, chaque canal de transmission transporte, en plus du signal yk(n), les pondérations dont ce signal doit être affecté avant émission par le haut-parleur correspondant de la salle distante. Cela revient à effectuer une détection d'activité vocale et à transmettre l'information correspondante.

[0073] Dans ce mode de réalisation, on adapte la matrice de codage en fonction des locuteurs actifs et on calcule la matrice de décodage à l'émission, à partir de la matrice de codage et des caractéristiques de restitution sonore.

[0074] Lorsque le nombre de microphones actifs, tel que déduit de la valeur de la cinquième atténuation Γ'(i,n) ou de la troisième atténuation G"mic(i,n), est inférieur ou égal au nombre de canaux de transmission, chaque signal issu d'un microphone actif est aiguillé vers un des canaux. La matrice de codage est alors constituée uniquement de 1 et de 0 (les 1 correspondant aux microphones actifs).

[0075] Dans ce mode de réalisation, la matrice de décodage est la transposée de la matrice de codage.

[0076] On peut transmettre les M x P coefficients γj,k(n) au moyen d'un faible nombre de bits. A titre d'exemple non limitatif, trois bits par coefficient peuvent suffire. On peut par exemple effectuer un codage de type logarithmique où chaque coefficient, exprimé en dB, est quantifié de façon uniforme sur un nombre de niveaux donné. A titre d'exemple non limitatif, on peut prévoir huit niveaux.

[0077] Dans un mode particulier de réalisation, on diffuse en outre, dans la salle locale, les signaux à transmettre yk(n), au moyen des haut-parleurs locaux, en plus des signaux reçus en provenance de la ou des salle(s) distante(s) et à un niveau plus faible que les signaux reçus. Cette diffusion d'un retour local amène les locuteurs à parler moins fort ou plus loin du microphone, au cas où ils parlaient initialement à un niveau très élevé ou trop près du microphone sans s'en rendre compte. Cette diffusion contribue également à créer un environnement acoustique commun dans une salle donnée, ce qui est particulièrement avantageux pour des locuteurs situés à des emplacements éloignés d'une même salle.

[0078] On décrit dans ce qui suit le dispositif de la présente invention, dans un mode particulier de réalisation, à l'aide de la figure 3.

[0079] Ce dispositif s'applique à un système de transmission numérique de signaux sonores du même type que celui considéré en relation avec le procédé, à savoir, un système mettant en oeuvre P canaux de transmission entre une salle locale et au moins une salle distante, qui comportent chacune N microphones et M haut-parleurs, les valeurs de N et M pouvant différer selon les salles.

[0080] Comme le montre la figure 3, le dispositif comprend un module 20 de codage des signaux sonores. Le module 20 reçoit en entrée N signaux numériques xi(n) qui proviennent respectivement des N microphones de la salle locale. Il fournit en sortie P signaux numériques yk(n) définis par la formule (6) donnée plus haut.

[0081] Les P signaux yk(n) sont transmis respectivement sur les P canaux de transmission dans le réseau 22.

[0082] Le dispositif comprend également un module 24 de décodage des signaux sonores. Le module 24 reçoit en entrée les P signaux yk(n) et fournit en sortie M signaux numériques zj(n), définis par la formule (8) donnée plus haut, à émettre respectivement par les M haut-parleurs de chaque salle.

[0083] Dans le mode particulier de réalisation représenté sur la figure 4, le module 20 de codage des signaux sonores comprend un module 26 pour calculer un cumulant pour chaque signal microphonique xi(n) de la salle locale et un cumulant pour chaque signal de haut-parleur zj(n) de la salle locale.

[0084] Le module 20 comprend également un module 28, connecté en sortie du module 26, pour calculer la première atténuation Gmic(i,n), décrite plus haut, pour chaque signal microphonique xi(n) de la salle locale, à partir d'un rapport entre des cumulants fournis par le module 26 de calcul de cumulants. Dans un mode particulier de réalisation, le module 28 fournit en sortie des valeurs de Gmic(i,n) telles que définies par la formule (1) donnée plus haut.

[0085] Un module 30 pour modifier chaque première atténuation Gmic(i,n) est connecté en sortie du module 28. Il fournit en sortie la deuxième atténuation G'mic(i,n) définie par la formule (2) donnée plus haut.

[0086] Le module 20 comprend de plus un module 32, connecté en sortie du module 26 de calcul de cumulants, pour déterminer, pour chaque signal microphonique xi(n), à partir des cumulants de signaux microphoniques et de haut-parleurs fournis par le module 26,
   si ce signal microphonique est un signal d'écho seul ou un signal provenant uniquement de la salle locale, suivant un premier cas, ou
   si ce signal microphonique présente des composantes provenant de la salle locale et d'autres composantes provenant de la salle distante, suivant un second cas, comme on l'a décrit plus haut.

[0087] Un module 34 pour calculer la troisième atténuation G"mic(i,n) définie plus haut est connecté en sortie des modules 30 et 32.

[0088] Le module 20 comprend en outre un module 36, connecté en sortie du module 26 de calcul de cumulants, pour calculer la quatrième atténuation Γ(i,n) à partir d'un rapport entre des cumulants de signaux microphoniques. Dans un mode particulier de réalisation, le module 36 fournit en sortie des valeurs de Γ(i,n) telles que définies par la formule (3) donnée plus haut.

[0089] Un module 38 pour modifier chaque quatrième atténuation Γ(i,n) est connecté en sortie du module 36. Il fournit en sortie la cinquième atténuation Γ'(i,n) définie par la formule (4) donnée plus haut.

[0090] Un module 40 pour calculer et modifier le produit des troisième et cinquième atténuations G"mic(i,n) et Γ'(i,n) est connecté en sortie des modules 34 et 38. Le module 40 fournit en sortie les coefficients de pondération βi(n) définis par la formule (5) donnée plus haut.

[0091] Dans le mode particulier de réalisation représenté sur la figure 5, le module 24 de décodage des signaux sonores comprend un module 42 pour calculer, pour chaque signal de haut-parleur zj(n) de la salle distante considérée, la sixième atténuation GHP(j,n) définie plus haut, à partir de cumulants calculés pour chaque signal transmis yk(n). Ces cumulants peuvent être fournis par le module 26 de calcul de cumulants représenté sur la figure 4.

[0092] Un module 44 pour modifier chaque sixième atténuation GHP(j,n) est connecté en sortie du module 42. Il fournit en sortie les coefficients de pondération λj(n) définis par la formule (7) donnée plus haut.


Revendications

1. Procédé de réduction d'écho acoustique et de spatialisation sonore, dans un système de transmission numérique de signaux sonores sur P canaux de transmission, entre un site local et au moins un site distant, comportant chacun N microphones et M haut-parleurs, N, M, P étant des entiers, les valeurs de N et M pouvant différer selon les sites, suivant lequel :

a) on calcule un cumulant pour chaque signal microphonique xi(n) du site local, i étant un entier compris entre 1 et N et n désignant le rang temporel des échantillons, et on calcule un cumulant pour chaque signal de haut-parleur zj(n) du site local, j étant un entier compris entre 1 et M ;
puis, pour tout i, 1 ≤ i ≤ N,

b) on calcule une première atténuation Gmic(i,n) pour le signal microphonique xi(n) du site local à partir d'un rapport entre des cumulants obtenus précédemment ;

c) on modifie la première atténuation Gmic(i,n) de façon à obtenir une deuxième atténuation G'mic(i,n) définie comme suit :

où S1(Gmic(i,n)) = s si Gmic(i,n) ≤ s,
S1(Gmic(i,n)) = Gmic(i,n) si s < Gmic(i,n) < 1 et
S1(Gmic(i,n)) = 1 si Gmic(i,n) ≥ 1,
s étant un seuil minimal prédéterminé strictement inférieur à 1 ;

d) à partir des cumulants de signaux microphoniques et de haut-parleurs calculés précédemment, on détermine
   si le signal microphonique xi(n) est un signal d'écho seul ou un signal provenant uniquement du site local, suivant un premier cas, ou
   si le signal microphonique xi(n) présente des composantes provenant du site local et d'autres composantes provenant du site distant, suivant un second cas ;

e) on calcule une troisième atténuation G"mic(i,n), qui dans ledit premier cas, est égale à la deuxième atténuation G'mic(i,n) et dans ledit second cas, est égale à la deuxième atténuation G'mic(i,n) dans le calcul de laquelle on augmente le seuil minimal s d'une valeur prédéterminée ;

f) on calcule une quatrième atténuation Γ(i,n) à partir d'un rapport entre des cumulants de signaux microphoniques ;

g) on modifie la quatrième atténuation Γ(i,n) de façon à obtenir une cinquième atténuation Γ'(i,n) définie comme suit :

où S2(Γ(i,n)) = s' si Γ(i,n) ≤ s',
S2(Γ(i,n)) = Γ(i,n) si s' < Γ(i,n) < 1 et
S2(Γ(i,n)) = 1 si Γ(i,n) ≥ 1,
s' étant un seuil minimal prédéterminé strictement inférieur à 1 ;

h) on calcule le produit des troisième et cinquième atténuations G"mic(i,n) et Γ'(i,n) obtenues précédemment, de façon à obtenir une atténuation globale G*mic(i,n) définie par :

i) on modifie l'atténuation globale G*mic(i,n) de façon à obtenir un coefficient de pondération βi(n) défini comme suit :

où S4(G*mic(i,n)) = s" si G*mic(i,n) ≤ s" et
S4(G*mic(i,n)) = G*mic(i,n) si s" < G*mic(i,n) ≤ 1,
s" étant un seuil minimal prédéterminé strictement inférieur à 1 ;

j) on transmet sur chaque canal de transmission un signal yk(n), k étant un entier compris entre 1 et P, sous forme d'une combinaison linéaire des signaux microphoniques xi(n) pondérés, définie comme suit :

où αk,i(n) désigne des coefficients de codage réels prédéterminés et βi(n) désigne les coefficients de pondération obtenus précédemment ;
puis, pour tout entier j, 1 ≤ j ≤ M :

k) on calcule, pour le signal de haut-parleur zj(n) du site distant, une sixième atténuation GHP(j,n) à partir de cumulants calculés pour chaque signal yk(n) transmis en provenance du site local ;

ℓ) on modifie la sixième atténuation GHP(j,n) de façon à obtenir un coefficient de pondération λj(n) défini comme suit :

où S3(GHP(j,n)) = s* si GHP(j,n) ≤ s*,
S3(GHP(j,n)) = GHP(j,n) si s* < GHP(j,n) < 1 et
S3(GHP(j,n)) = 1 si GHP(j,n) ≥ 1,
s* étant un seuil minimal prédéterminé strictement inférieur à 1 ;

m) on détermine le signal de haut-parleur zj(n) du site distant à partir d'une combinaison linéaire des signaux transmis yk(n) pondérés, définie comme suit :

où γj,k(n) désigne des coefficients de décodage réels prédéterminés, et où λj(n) désigne les coefficients de pondération obtenus précédemment ; et

n) on émet sur le jème haut-parleur du site distant le signal de haut-parleur zj(n) ainsi obtenu.


 
2. Procédé selon la revendication 1, suivant lequel, à l'étape a), on choisit comme cumulant pour les signaux microphoniques xi(n) et les signaux de haut-parleur zj(n) l'énergie de ces signaux, et à l'étape (b), on calcule la première atténuation Gmic(i,n) pour chaque signal microphonique xi(n) à partir de la formule suivante :

où Cum2(.) désigne l'énergie et où C est une constante réelle prédéterminée strictement supérieure à 1.
 
3. Procédé selon la revendication 1, suivant lequel, à l'étape a), on choisit comme cumulant pour les signaux microphoniques xi(n) l'énergie de ces signaux, et à l'étape (f), on calcule la quatrième atténuation Γ(i,n) pour chaque signal microphonique xi(n) à partir de la formulé suivante :

où Cum2(.) désigne l'énergie et où q est un entier.
 
4. Procédé selon la revendication 1, 2 ou 3, suivant lequel on transmet en outre sur les P canaux les produits γj,k(n).λj(n), 1 ≤ j ≤ M, 1 ≤ k ≤ P, à la même cadence que les signaux sonores.
 
5. Procédé selon l'une quelconque des revendications 1 à 4, suivant lequel on diffuse en outre sur le site local les signaux à transmettre yk(n), au moyen des haut-parleurs locaux, en plus des signaux reçus en provenance du site distant et à un niveau plus faible que ces derniers.
 
6. Dispositif de réduction d'écho acoustique et de spatialisation sonore, dans un système de transmission numérique de signaux sonores sur P canaux de transmission, entre un site local et au moins un site distant, comportant chacun N microphones et M haut-parleurs, N, M, P étant des entiers, les valeurs de N et M pouvant différer selon les sites, caractérisé en ce qu'il comprend :

des moyens (20) de codage des signaux sonores, recevant en entrée N signaux numériques xi(n) provenant respectivement des N microphones du site local, où i est un entier compris entre 1 et N, et n est un entier qui désigne le rang temporel des échantillons, lesdits moyens (20) de codage fournissant en sortie P signaux numériques yk(n), où k est un entier compris entre 1 et P, définis par la formule suivante :

où αk,i(n) désigne des coefficients de codage réels prédéterminés, et
où βi(n) désigne des coefficients de pondération qui dépendent de cumulants des signaux reçus par les microphones du site local et de cumulants des signaux émis par les haut-parleurs du site local,
les P signaux yk(n) étant transmis respectivement sur les P canaux de transmission entre le site local et le site distant ; et
   des moyens (24) de décodage des signaux sonores, recevant en entrée les P signaux yk(n) et fournissant en sortie M signaux numériques zj(n) à émettre respectivement par les M haut-parleurs de chaque site, où j est un entier compris entre 1 et M, définis par la formule suivante :

où γj,k(n) désigne des coefficients de décodage réels prédéterminés, et
où λj(n) désigne des coefficients de pondération qui dépendent des signaux yk(n).
 
7. Dispositif selon la revendication 6, caractérisé en ce que lesdits moyens (20) de codage des signaux sonores comprennent :

des moyens (26) pour calculer un cumulant pour chaque signal microphonique xi(n) du site local et un cumulant pour chaque signal de haut-parleur zj(n) du site local ;

des moyens (28) pour calculer une première atténuation Gmic(i,n) pour chaque signal microphonique xi(n) du site local à partir d'un rapport entre des cumulants fournis par lesdits moyens (26) de calcul de cumulants ;

des moyens (30) pour modifier chaque première atténuation Gmic(i,n) de façon à obtenir, pour tout i, 1 ≤ i ≤ N, une deuxième atténuation G'mic(i,n) définie comme suit :

où S1(Gmic(i,n)) = s si Gmic(i,n) ≤ s,
S1(Gmic(i,n)) = Gmic(i,n) si s < Gmic(i,n) < 1 et
S1(Gmic(i,n)) = 1 si Gmic(i,n) ≥ 1,
s étant un seuil minimal prédéterminé strictement inférieur à 1 ;

des moyens (32) pour déterminer, pour chaque signal microphonique xi(n), à partir des cumulants de signaux microphoniques et de haut-parleurs fournis par lesdits moyens (26) de calcul de cumulants,
si ce signal microphonique xi(n) est un signal d'écho seul ou un signal provenant uniquement du site local, suivant un premier cas, ou
si ce signal microphonique xi(n) présente des composantes provenant du site local et d'autres composantes provenant du site distant, suivant un second cas ;

des moyens (34) pour calculer, pour tout i, 1 ≤ i ≤ N, une troisième atténuation G"mic(i,n), qui dans ledit premier cas, est égale à la deuxième atténuation G'mic(i,n) et dans ledit second cas, est égale à la deuxième atténuation G'mic(i,n) dans le calcul de laquelle on augmente le seuil minimal s d'une valeur prédéterminée ;

des moyens (36) pour calculer, pour tout i, 1 ≤ i ≤ N, une quatrième atténuation Γ(i,n) à partir d'un rapport entre des cumulants de signaux microphoniques ;

des moyens (38) pour modifier chaque quatrième atténuation Γ(i,n) de façon à obtenir une cinquième atténuation Γ'(i,n) définie comme suit :

où S2(Γ(i,n)) = s' si Γ(i,n) ≤ s',
S2(Γ(i,n)) = Γ(i,n) si s' < Γ(i,n) < 1 et
S2(Γ(i,n)) = 1 si Γ(i,n) ≥ 1,
s' étant un seuil minimal prédéterminé strictement inférieur à 1 ; et

des moyens (40) pour calculer et modifier, pour tout i, 1 ≤ i ≤ N, le produit des troisième et cinquième atténuations G"mic(i,n) et Γ'(i,n) obtenues précédemment, de façon à obtenir lesdits coefficients de pondération βi(n), définis comme suit :

où G*mic(i,n) = G"mic(i,n).Γ'(i,n),
où S4(G*mic(i,n)) = s" si G*mic(i,n) ≤ s" et
S4(G*mic(i,n)) = G*mic(i,n) si s" < G*mic(i,n) ≤ 1,
s" étant un seuil minimal prédéterminé strictement inférieur à 1.


 
8. Dispositif selon la revendication 6, caractérisé en ce que lesdits moyens (24) de décodage des signaux sonores comprennent :

des moyens (42) pour calculer, pour chaque signal de haut-parleur zj(n), une sixième atténuation GHP(j,n) à partir de cumulants calculés pour chaque signal yk(n) ; et

des moyens (44) pour modifier chaque sixième atténuation GHP(j,n) de façon à obtenir lesdits coefficients de pondération λj(n), définis comme suit :

où S3(GHP(j,n)) = s* si GHP(j,n) ≤ s*,
S3(GHP(j,n)) = GHP(j,n) si s* < GHP(j,n) < 1 et
S3(GHP(j,n)) = 1 si GHP(j,n) ≥ 1,
s* étant un seuil minimal prédéterminé strictement inférieur à 1.
 
9. Dispositif selon la revendication 7, caractérisé en ce que lesdits moyens (28) pour calculer chaque première atténuation Gmic(i,n) fournissent en sortie :

où Cum2(.) désigne le cumulant qui représente l'énergie et
où C est une constante réelle prédéterminée strictement supérieure à 1.
 
10. Dispositif selon la revendication 7, caractérisé en ce que lesdits moyens (36) pour calculer chaque quatrième atténuation Γ(i,n) fournissent en sortie :

où Cum2(.) désigne le cumulant qui représente l'énergie et
où q est un entier.
 


Ansprüche

1. Verfahren zur Reduktion von akustischem Echo und von'Schall-Spatialisation in einem System zur digitalen Übertragung von SchallSignalen auf P Übertragungskanälen zwischen einem lokalen Standort und wenigstens einem entfernten Standort, wobei jeder N Mikrofone und M Lautsprecher umfasst, wobei N, M, P ganze Zahlen sind, und wobei die Werte von N und M gemäß den Standorten differieren können, wobei entsprechend dem Verfahren:

a) für jedes Mikrofonsignal xi(n) des lokalen Standortes eine Häufung berechnet wird, wobei i eine ganze Zahl zwischen 1 und N ist und wobei n den zeitlichen Rang von Stichproben bezeichnet, und für jedes Lautsprechersignal zj(n) des lokalen Standortes eine Häufung berechnet wird, wobei j eine ganze Zahl zwischen 1 und M ist;
anschließend für alle i, 1 ≤ i ≤ N

b) eine erste Dämpfung Gmic(i,n) für das Mikrofonsignal xi(n) des lokalen Standortes ausgehend von einer Beziehung zwischen den zuvor erhaltenen Häufungen berechnet wird;

c) die erste Dämpfung Gmic(i,n) derart modifiziert wird, dass eine zweite Dämpfung G'mic(i,n) erhalten wird, welche wie folgt definiert ist:

wobei S1(Gmic(i,n)) = s wenn Gmic(i,n) ≤ s,
S1(Gmic(i,n)) = Gmic(i,n) wenn s < Gmic(i,n) < 1 und
S1(Gmic(i,n)) = 1 wenn Gmic(i,n) ≥ 1,
wobei s ein vorbestimmter minimaler Schwellwert ist, der ausschließlich kleiner als 1 ist;

d) ausgehend von den zuvor berechneten Dämpfungen von Mikrofon- und Lautsprechersignalen bestimmt wird,
ob das Mikrofonsignal xi(n) gemäß einem ersten Fall ein einzelnes Echosignal oder ein nur vom lokalen Standort stammendes Signal ist, oder
ob das Mikrofonsignal xi(n) gemäß einem zweiten Fall vom lokalen Standort stammende Komponenten und andere vom entfernten Standort stammende Komponenten aufweist;

e) eine dritte Dämpfung G"mic(i,n) berechnet wird, die im ersten Fall gleich der zweiten Dämpfung G'mic(i,n) ist und die im zweiten Fall gleich der zweiten Dämpfung G'mic(i,n) ist, bei deren Berechnung der minimale Schwellwert s um einen vorbestimmten Wert erhöht wird;

f) eine vierte Dämpfung Γ(i,n) ausgehend von einer Beziehung zwischen den Häufungen von Mikrofonsignalen berechnet wird;

g) die vierte Dämpfung Γ(i,n) derart modifiziert wird, dass eine fünfte Dämpfung Γ'(i,n) erhalten wird, die wie folgt definiert ist:

wobei S2(Γ(i,n)) = s' wenn Γ(i,n) ≤ s',
S2(Γ(i,n)) = Γ(i,n) wenn s' < Γ(i,n) < 1 und
S2(Γ(i,n)) = 1 wenn Γ(i,n) ≥ 1,
wobei s' ein vorbestimmter minimaler Schwellwert ist, der ausschließlich kleiner als 1 ist;

h) das Produkt der zuvor erhaltenen dritten und fünften Dämpfungen G"mic (i,n) und Γ'(i,n) derart berechnet wird, dass eine globale Dämpfung G*mic(i,n) erhalten wird, welche wie folgt definiert ist:

i) die globale Dämpfung G*mic(i,n) derart modifiziert wird, dass ein Gewichtungskoeffizient βi(n) erhalten wird, welcher wie folgt definiert ist:

wobei S4(G*mic(i,n)) = s" wenn G*mic(i,n) ≤ s" und
S4(G*mic(i,n)) = G*mic(i,n) wenn s" < G*mic(i,n) ≤ 1,
wobei s" ein vorbestimmter minimaler Schwellwert ist, der ausschließlich kleiner als 1 ist;

j) auf jedem Übertragungskanal wird ein Signal yk(n) übertragen in Form einer linearen Kombination der gewichteten Mikrofonsignale xi(n),
wobei k eine ganze Zahl zwischen 1 und P ist, wobei die lineare Kombination wie folgt definiert ist:

wobei αk,j(n) vorbestimmte reale Kodierungskoeffizienten bezeichnet und βi(n) die zuvor bestimmten Gewichtungskoeffizienten bezeichnet; dann für alle ganzen Zahlen j, 1 ≤ j ≤ M:

k) eine sechste Dämpfung GHP(j,n) ausgehend von Häufungen, die für jedes vom lokalen Standort stammende übertragene Signal berechnet werden, für das Lautsprechersignal zj(n) berechnet wird;

l) die sechste Dämpfung GHP(j,n) derart modifiziert wird, dass ein Gewichtungskoeffizient λj(n) erhalten wird, welcher wie folgt definiert ist:

wobei S3(GHP(j,n)) = s* wenn GHP(j,n) ≤ s*,
S3(GHP(j,n)) = GHP(j,n) wenn s* < GHP(j,n) < 1 und
S3(GHP(j,n)) = 1 wenn GHP(j,n) ≥ 1,
wobei s* ein vorbestimmter minimaler Schwellwert ist, der ausschließlich kleiner als 1 ist;

m) das Lautsprechersignal zj(n) des entfernten Standorts ausgehend von einer linearen Kombination der gewichteten übertragenen Signale yk(n) bestimmt wird, wobei die lineare Kombination wie folgt definiert ist:

wobei γj,k(n) vorbestimmte reale Dekodierungskoeffizienten bezeichnet und wobei λj(n) die zuvor erhaltenen Gewichtungskoeffizienten bezeichnet; und

n) auf dem j-ten Lautsprecher des entfernten Standorts das so erhaltenen Lautsprechersignal zj(n) ausgegeben wird.


 
2. Verfahren nach Anspruch 1, bei dem im Schritt a) als Häufung für die Mikrofonsignale xi(n) und die Lautsprechersignale zj(n) die Energie dieser Signale ausgewählt wird und im Schritt b) die erste Dämpfung Gmic(i,n) für jedes Mikrofonsignal xi(n) ausgehend von der folgenden Formel berechnet wird:

wobei Cum2(.) die Energie bezeichnet und wobei C eine vorbestimmte reale Konstante ist, die ausschließlich größer als 1 ist.
 
3. Verfahren nach Anspruch 1, bei dem im Schritt a) als Häufung für die Mikrofonsignale xi(n) die Energie dieser Signale ausgewählt wird und im Schritt f) die vierte Dämpfung Γ(i,n) für jedes Mikrofonsignal xi(n) ausgehend von der folgenden Formel berechnet wird:

wobei Cum2(.) die Energie bezeichnet und wobei q eine ganze Zahl ist.
 
4. Verfahren nach Anspruch 1, 2 oder 3, bei dem auf den P Kanälen ferner die Produkte γj,k(n).λj(n), 1 ≤ j ≤ M, 1 ≤ k ≤ P, im gleichen Takt wie die Schallsignale übertragen werden.
 
5. Verfahren nach einem der Ansprüche 1 bis 4, bei dem ferner am lokalen Standort zu übertragende Signale yk(n) vermittels der lokalen Lautsprecher ausgesendet werden, und zwar zusätzlich zu den empfangenen Signalen, welche vom entfernten Standort stammen, und mit einem schwächeren Pegel als diese letzteren.
 
6. Vorrichtung zur Reduktion von akustischem Echo und von Schall-Spatialisation in einem System zur digitalen Übertragung von SchallSignalen auf P Übertragungskanälen zwischen einem lokalen Standort und wenigstens einem entfernten Standort, wobei jeder N Mikrofone und M Lautsprecher umfasst, wobei N, M, P ganze Zahlen sind, und wobei die Werte von N und M gemäß den Standorten differieren können, dadurch gekennzeichnet, dass sie umfasst:

Mittel (20) zur Kodierung von Schallsignalen, welche am Eingang N digitale Signale xi(n) empfangen, die von jeweils N Mikrofonen des lokalen Standorts stammen, wobei i eine ganze Zahl zwischen 1 und N ist und n eine ganze Zahl ist, die den zeitlichen Rang von Stichproben bezeichnet, wobei die Mittel (20) am Ausgang P digitale Signale yk(n) bereitstellen, wobei k eine ganze Zahl zwischen 1 und P ist, und die digitalen Signale durch die folgende Formel definiert sind:

wobei αk,i(n) vorbestimmte reale Kodierungskoeefizienten bezeichnet und
wobei βi(n) Gewichtungskoeffizienten bezeichnet, welche von Häufungen der durch die Mikrofone des lokalen Standorts empfangenen Signalen und von Häufungen der durch die Lautsprecher des lokalen Standorts ausgegebenen Signalen abhängen,

wobei die P Signale yk(n) jeweils auf den P Übertragungskanälen zwischen dem lokalen und dem entfernten Standort übertragen werden; und
Mittel (24) zur Dekodierung von Schallsignalen, welche am Eingang die P Signale yk(n) empfangen und am Ausgang M digitale, jeweils durch die M Lautsprecher jedes Standorts auszusendende Signale zj(n) bereitstellen,
wobei j eine ganze Zahl zwischen 1 und M ist, wobei die Signale nach folgender Formel definiert sind:

wobei γj,k(n) vorbestimmte reale Dekodierungskoeffizienten bezeichnet und
wobei λj(n) Gewichtungskoeffizienten bezeichnet, die von den Signalen yk(n) abhängig sind.
 
7. Vorrichtung nach Anspruch 6, dadurch gekennzeichnet, dass die Mittel (20) zur Kodierung der Schallsignale umfassen:

Mittel (26) zur Berechnung einer Häufung für jedes Mikrofonsignal xi(n) des lokalen Standorts und einer Häufung für jedes Lautsprechersignal zj(n) des lokalen Standorts.;

Mittel (28) zur Berechnung einer ersten Dämpfung Gmic(i,n) für jedes Mikrofonsignal xi(n) des lokalen Standorts ausgehend von einer Beziehung zwischen den durch die Mittel (26) zur Berechnung von Häufungen bereitgestellten Häufungen;

Mittel (30) zum Modifizieren jeder ersten Dämpfung Gmic(i,n) derart, um für jedes i, 1 ≤ i ≤ N, eine zweite Dämpfung G'mic(i,n) zu erhalten, welche wie folgt definiert ist:

wobei S1(Gmic(i,n)) = s wenn Gmic(i,n) ≤ s,
S1(Gmic(i,n)) = Gmic(i,n) wenn s < Gmic(i,n) < 1 und
S1(Gmic(i,n)) = 1 wenn Gmic(i,n) ≥ 1,
wobei s ein vorbestimmter minimaler Schwellwert ist, der ausschließlich kleiner als 1 ist;
Mittel (32) zum Bestimmen für jedes Mikrofonsignal xi(n) ausgehend von den durch die Mittel (26) zur Berechnung von Häufungen bereitgestellten Häufungen von Mikrofonsignalen und von Lautsprechersignalen,
ob dieses Mikrofonsignal xi(n) gemäß einem ersten Fall ein einzelnes Echosignal oder ein nur vom lokalen Standort stammendes Signal ist, oder ob dieses Mikrofonsignal xi(n) gemäß einem zweiten Fall vom lokalen Standort stammende Komponenten und andere vom entfernten Standort stammende Komponenten aufweist;
Mittel (34) zum Berechnen für jedes i, 1 ≤ i ≤ N, einer dritten Dämpfung G"mic(i,n), die im ersten Fall gleich der zweiten Dämpfung G'mic(i,n) ist und die im zweiten Fall gleich der zweiten Dämpfung G'mic(i,n) ist, bei deren Berechnung der minimale Schwellwert s um einen vorbestimmten Wert erhöht wird;
Mittel (36) zum Berechnen für jedes i, 1 ≤ i ≤ N, einer vierten Dämpfung r (i,n) ausgehend von einer Beziehung zwischen den Häufungen der Mikrofonsignale;
Mittel (38) zum Modifizieren jeder vierten Dämpfung Γ(i,n), derart, um eine fünfte Dämpfung Γ'(i,n) zu erhalten, welche wie folgt definiert ist:

wobei S2(Γ(i,n)) = s' wenn Γ(i,n) S s',
S2(Γ(i,n)) = Γ(i,n) wenn s' < Γ(i,n) < 1 und
S2(Γ(i,n)) = 1 wenn Γ(i,n) ≥ 1,

wobei s' ein vorbestimmter minimaler Schwellwert ist, der ausschließlich kleiner als 1 ist; und
Mittel (40) zum Berechnen und Modifizieren für jedes i, 1 ≤ i ≤ N, des Produkts der zuvor erhaltenen dritten und der fünften Dämpfungen G"mic (i,n) und Γ'(i,n), derart, um die Gewichtungskoeffizienten βi(n) zu erhalten, welche wie folgt definiert sind:

wobei G*mic(i,n) = G"mic(i,n).Γ'(i,n),
wobei S4(G*mic(i,n)) = s" wenn G*mic(i,n) ≤ s" und
S4(G*mic(i,n)) = G*mic(i,n) wenn s" < G*mic(i,n) ≤ 1,
wobei s" ein vorbestimmter minimaler Schwellwert ist, der ausschließlich kleiner als 1 ist.
 
8. Vorrichtung nach Anspruch 6, dadurch gekennzeichnet, dass die Mittel (24) zur Dekodierung von Schallsignalen umfassen:

Mittel (42) zum Berechnen einer sechsten Dämpfung GHP(j,n) für jedes Lautsprechersignal zj(n) ausgehend von den für jedes Signal yk(n) berechneten Häufungen; und

Mittel (44) zum Modifizieren jeder sechsten Dämpfung GHP(j,n), derart, um die Gewichtungskoeffizienten λj(n) zu erhalten, welche wie folgt definiert sind:

wobei S3(GHP(j,n)) = s* wenn GHP(j,n) ≤ s*,
S3(GHP(j,n)) = GHP(j,n) wenn s* < GHP(j,n) < 1 und
S3(GHP(j,n)) = 1 wenn GHP(j,n) ≥ 1,

wobei s* ein vorbestimmter minimaler Schwellwert ist, der ausschließlich kleiner als 1 ist.
 
9. Vorrichtung nach Anspruch 7, dadurch gekennzeichnet, dass die Mittel (28) zum Berechnen jeder ersten Dämpfung Gmic(i,n) am Ausgang bereitstellen:

wobei Cum2(.) die die Energie repräsentierende Dämpfung bezeichnet und
wobei C eine vorbestimmte reale Konstante ist, die ausschließlich größer als 1 ist.
 
10. Vorrichtung nach Anspruch 7, dadurch gekennzeichnet, dass die Mittel (36) zum Berechnen jeder vierten Dämpfung Γ(i,n) am Ausgang bereitstellen:

wobei Cum2(.) die die Energie repräsentierende Dämpfung bezeichnet und
wobei q eine ganze Zahl ist.
 


Claims

1. Method for reducing acoustic echoes and sound spatialization, in a system for the digital transmission of sound signals over P transmission channels, between a local site and at least one remote site, each incorporating N microphones and M loudspeakers, N, M and P being integers, where N and M can differ according to the sites, according to which:

a) a cumulative figure is calculated for each microphone signal xi (n) from the local site, i being an integer between 1 and N inclusive and n meaning the sampling rate, and a cumulative figure is calculated for each loudspeaker signal zj (n) from the local site, j being an integer between 1 and M inclusive;
then, for any i, 1 ≤i ≤N,

b) an initial attenuation Gmic (i, n) for the microphone signal xj (n) from the local site is calculated from a relationship between the cumulative figures obtained previously;

c) the initial attenuation Gmic (i, n) is modified so as to obtain a second attenuation G'mic (i, n), defined as follows:

where S1(Gmic (i, n)) = s if Gmic (i, n) ≤s,
S1(Gmic (i, n)) = Gmic (i, n) if s < (Gmic (i, n) < 1 and
S1(Gmic (i, n)) = 1 if Gmic (i, n) ≥1,
S being a preset minimum threshold which is strictly less than 1;

d) from the microphone and loudspeaker signal cumulative figures calculated previously, we determine
   whether the microphone signal xi (n) is a single echo signal or a signal coming simply from the local site, according to a first case, or
   whether the microphone signal xi (n) has components coming from the local site and other components coming from the remote site, according to a second case;

e) a third attenuation G"mic (i, n) is calculated which, in said first case, is equal to the second attenuation G'mic (i, n) and in said second case is equal to the second attenuation G'mic (i, n) in the calculation, from which the minimum threshold s is incremented by a preset value;

f) a fourth attenuation Γ (i, n) is calculated from a relationship between the cumulative figures for the microphone signals;

g) the fourth attenuation Γ (i, n) is modified so as to obtain a fifth attenuation Γ' (i, n) defined as follows:

   where S2(Γ (i, n)) = s' if Γ (i, n) ≤s',
   S2(Γ (i, n)) = Γ (i, n) if s' < (Γ (i, n) < 1 and
   S2(Γ (i, n)) = 1 if Γ (i, n) ≥1,
   s' being a preset minimum threshold strictly less than 1;

h) the product of the third and fifth attenuations G"mic (i, n) and Γ' (i, n) obtained previously is calculated, so as to obtain a total attenuation G*mic (i, n) defined by:

i) the total attenuation G*mic (i, n) is modified so as to obtain a weighting coefficient βi (n) defined as follows:

where S4(G*mic (i, n)) = s" if (G*mic (i, n)) ≤s" and
S4(G*mic (i, n)) = G*mic (i, n)) ifs" < G*mic (i, n)) ≤1,
s" being a preset minimum threshold strictly less than 1;

j) over each transmission channel is emitted a signal γk (n), k being an integer between 1 and P inclusive, in the form of a linear combination of weighted microphone signals xi (n), defined as follows:

where αk,i (n) means the preset actual coding coefficients and βi (n) means the weighting coefficients obtained previously;
then, for any integer j, 1 ≤j ≤M:

k) we then calculate, for the loudspeaker signal zj (n) from the remote site, a sixth attenuation GHP (j, n) from the cumulative figures calculated for each signal yk (n) transmitted from the local site;

l) the sixth attenuation GHP (j, n) is then modified so as to obtain a weighting factor λj (n) defined as follows:

where S3 (GHP (j, n)) = s* if GHP (j, n) ≤ s*,
S3 (GHP (j, n)) = GHP (j, n) if s* < GHP (j, n) < 1 and
S3 (GHP (j, n)) = 1 if GHP (j, n) ≥1,
s* being a preset minimum threshold which is strictly less than 1;

m) the loudspeaker signal zj (n) from the remote site is then determined from a linear combination of the weighted linear signals yk (n) transmitted, defined as follows:

where γj,k (n) means the preset actual decoding coefficients and where λj (n) means the weighting coefficients obtained previously; and

n) the loudspeaker signal zj (n) thus obtained is emitted over the remote site's jth loudspeaker.


 
2. Method as in Claim 1, according to which, at stage a), the energy from the microphone signals xi (n) and the loudspeaker signals zj (n) is chosen as the cumulative figure for said signals and, at stage b), the initial attenuation Gmic (i, n) for each microphone signal xi (n) is calculated from the following equation:

where Cum2 (.) means the energy and where C is a preset actual constant which is strictly greater than 1.
 
3. Method as in Claim 1, according to which, at stage a), the energy for the microphone signals xi (n) is chosen as the cumulative figure for said signals and, at stage (f), the fourth attenuation Γ (i, n) for each microphone signal xi (n) is calculated from the following equation:

where Cum2 (.) means the energy and where q is an integer.
 
4. Method as in any one of Claims 1, 2 and 3, according to which the products γj.k (n).λj (n), 1 ≤ j ≤M, 1 ≤ k ≤ P, are also emitted over the P channels, at the same rate as the sound signals.
 
5. Method as in any one of Claims 1 to 4, according to which the signals γk (n) to be transmitted are also broadcast over the local site, employing the local loudspeakers, as well as the signals received from the remote site and at a lower level than the latter.
 
6. Device for reducing acoustic echoes and sound spatialization, in a digital system for transmitting sound signals over P transmission channels, between a local site and at least one remote site, each incorporating N microphones and M loudspeakers, N, M and P being integers, where the values ofN and M can differ according to the sites, characterized in that it comprises:

means (20) for coding sound signals, receiving as input N digital signals xi (n) coming respectively from N microphones at the local site, where i is an integer between 1 and N inclusive, and n is an integer which designates the sample rank, said coding means (20) providing P digital signals yk (n) as output, where k is an integer between 1 and P inclusive, defined by the following equation

where αk,i (n) means the preset actual coding coefficients, and
where βi (n) means the weighting coefficients, which depend on the cumulative figures for the signals received by the local site microphones and on the cumulative figures for the signals emitted by the local site loudspeakers,

the P signals yk (n) being transmitted respectively over the P transmission channels between the local site and the remote site; and
means (24) for decoding sound signals, receiving as input the P signals γk (n) and providing as output M digital signals zj (n) to be emitted respectively by the M loudspeakers at each site, where j is an integer between 1 and M inclusive, defined by the following equation:

where γj, k (n) means the preset actual decoding coefficients, and
where λj (n) means the weighting coefficients which depend on the signals Yk (n).
 
7. Device as in Claim 6, characterized in that said means (20) for coding sound signals comprise:

means (26) for calculating a cumulative figure for each microphone signal xi (n) from the local site and a cumulative figure for each loudspeaker signal zj (n) from the local site;

means (28) for calculating an initial attenuation Gmic (i, n) for each microphone signal xi (n) from the local site, from a relationship between the cumulative figures provided by said means (26) for calculating cumulative figures;

means (30) for modifying each initial attenuation Gmic (i, n) so as to obtain, for any i, 1 ≤ i ≤ N, a second attenuation G'mic (i, n) defined as follows:

   where S1(Gmic (i, n)) = s if Gmic (i, n) ≤ s,
   S1(Gmic (i, n)) = Gmic (i, n) if s < (Gmic (i, n) < 1 and
   S1(Gmic (i, n)) = 1 if Gmic (i, n) ≥ 1,

s being a preset minimum threshold which is strictly less than 1;
means (32) for determining, for each microphone signal xi (n), from the cumulative microphone signal and loudspeaker signal figures provided by said means (26) for calculating cumulative figures,
if said microphone signal xi (n) is an echo signal alone or a signal coming only from the local site, according to a first case, or
if said microphone signal xi (n) has components coming from the local site and other components coming from the remote site, in a second case;
means (34) for calculating, for any i, 1 ≤ i ≤ N, a third attenuation G"mic (i, n) which, in said first case, is equal to the second attenuation G'mic (i, n) and, in said second case, is equal to the second attenuation G'mic (i, n) in the calculation where the minimum threshold s is increased by a preset value; means (36) for calculating, for any i, 1 ≤ i ≤ N, a fourth attenuation Γ (i, n) from a relationship between the microphones signal cumulative figures;
means (38) for modifying each fourth attenuation Γ (i, n) so as to obtain a fifth attenuation Γ' (i, n), defined as follows:

   where S2(Γ (i, n)) = s' if Γ (i, n) ≤ s'.
   S2(Γ (i, n)) = Γ (i, n) if s' < (Γ (i, n) < 1 and
   S2(Γ (i, n)) = 1 if Γ (i, n) ≥ 1,
   s' being a preset minimum threshold strictly less than 1; and
   means (40) for calculating and modifying, for any i, 1 ≤ i ≤ N, the product of the third and fifth attenuations G"mic (i, n) and Γ' (i, n) obtained previously, so as to obtain said weighting coefficients βi (n), defined as follows:

where G*mic (i, n) = G"mic (i, n). Γ' (I, n),
where S4(G*mic (i, n)) = s" if (G*mic (i, n)) ≤ s" and
S4(G*mic (i, n)) = G*mic (i, n)) if s" < G*mic (i, n)) ≤ 1,
s" being a preset minimum threshold strictly less than 1.
 
8. Device as in Claim 6, characterized in that said means (24) for decoding sound signals comprise:

means (42) for calculating, for each loudspeaker signal zj (n), a sixth attenuation GHP (j, n) from the cumulative figures calculated for each signal yk (n); and means (44) for modifying each sixth attenuation GHP (j, n) so as to obtain said weighting coefficients λj (n), defined as follows:

where S3 (GHP (j, n)) = s* if (GHP (j, n) ≤ s*,
S3 (GHP (j, n)) = GHP (j, n) if s* < GHP (j, n) < 1 and
S3 (GHP (j, n)) = 1 if (GHP (j, n) ≥ 1,

s* being a preset minimum threshold which is strictly less than 1.
 
9. Device as in Claim 7, characterized in that said means (28) for calculating each initial attenuation (Gmic (i, n) provide as output:

where Cum2 (.) means the cumulative figure representing the energy and where C is a preset actual constant which is strictly greater than 1.
 
10. Device as in Claim 7, characterized in that said means (36) for calculating each initial attenuation Γ(i, n) provide as output:

where Cum2 (.) means the cumulative figure representing the energy and where q is an integer.
 




Dessins