Dispositif de génération de bruit de confort

(19)

(11)

EP 0 869 476 B1

(12)	FASCICULE DE BREVET EUROPEEN

(45)	Mention de la délivrance du brevet:
	17.11.2004 Bulletin 2004/47

(21)	Numéro de dépôt: 98200761.9

(22)	Date de dépôt: 10.03.1998

(51)	Int. Cl.⁷: G10L 19/00

(54)	Dispositif de génération de bruit de confort Vorrichtung zur Erzeugung von Hintergrundrauschen Comfort noise generation device

(84)	Etats contractants désignés:
	DE FR GB

(30)

Priorité:

25.03.1997 FR 9703617

(43)	Date de publication de la demande:
	07.10.1998 Bulletin 1998/41

(73)	Titulaire: Koninklijke Philips Electronics N.V.
	5621 BA Eindhoven (NL)

(72)	Inventeur:
	Morel, Cyrille 75008 Paris (FR)

(74)	Mandataire: Landousy, Christian et al
	Société Civile SPID, 156, Boulevard Haussmann 75008 Paris 75008 Paris (FR)

(56)

Documents cités: :

US-A- 5 537 509

SOUTHCOTT C B ET AL: "VOICE CONTROL OF THE PAN-EUROPEAN DIGITAL MOBILE RADIO SYSTEM" COMMUNICATIONS TECHNOLOGY FOR THE 1990'S AND BEYOND, DALLAS, NOV. 27 - 30, 1989, vol. 2 OF 3, 27 novembre 1989, INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERS, pages 1070-1074, XP000091191
PATENT ABSTRACTS OF JAPAN vol. 012, no. 375 (E-666), 7 octobre 1988 & JP 63 124636 A (KOKUSAI DENSHIN DENWA CO LTD), 28 mai 1988,

Il est rappelé que: Dans un délai de neuf mois à compter de la date de publication de la mention de la délivrance de brevet européen, toute personne peut faire opposition au brevet européen délivré, auprès de l'Office européen des brevets. L'opposition doit être formée par écrit et motivée. Elle n'est réputée formée qu'après paiement de la taxe d'opposition. (Art. 99(1) Convention sur le brevet européen).

Description

[0001] La présente invention concerne un dispositif de génération de bruit de confort pour un décodeur de parole recevant des signaux de parole qui correspondent à une séquence d'origine formée de trames successives de longueur prédéterminée et ont été préalablement codés dans un codeur de parole comprenant notamment un circuit de détermination de l'énergie de la trame courante et un circuit de détermination de l'enveloppe de cette trame par analyse dite LPC.

[0002] Lorsqu'on transmet des signaux de parole dans des types de réseaux transportant également d'autres données que de tels signaux, il est souvent utile de s'assurer qu'ils n'occupent pas toute la bande passante et autorisent le passage simultané de ces autres données, ce qui revient à optimiser leur débit. Il est alors prévu, avant transmission, un détecteur d'activité vocale qui permet de repérer, dans des signaux d'entrée où des signaux vocaux sont mêlés à du bruit et des moments de silence, les périodes où des signaux de parole sont présents.

[0003] Si la présence de signaux de parole est détectée, le codeur de parole qui suit transmet régulièrement (toutes les trames) un flot de données numériques qui permettra à un interlocuteur distant de reconstituer ultérieurement ces signaux de parole. Au contraire, si l'on ne détecte plus de signaux de parole, on n'envoie plus de trames codées sur le réseau, afin d'économiser du débit sur celui-ci. Pour l'interlocuteur distant, on peut forcer alors à zéro les échantillons des signaux pendant ces périodes d'absence de parole. Cette solution est efficace pour la réduction du débit, mais peut conduire à des effets désagréables pour l'interlocuteur. En effet, dans la plupart des cas, il n'existe pas un silence total dans les lieux où se déroule la conversation, mais plutôt un bruit ambiant. Si donc, au moment de transitions paroles/silence, les échantillons des signaux d'entrée sont forcés à zéro, l'interlocuteur aura l'impression d'une discontinuité dans la conversation, ou même d'une coupure de la ligne.

[0004] Le but de l'invention est de proposer un dispositif de génération de bruit de confort remédiant à cet inconvénient.

[0005] L'invention concerne à cet effet un dispositif de génération de bruit de confort tel que défini dans le paragraphe introductif de la description et qui est en outre caractérisé en ce qu'il comprend en série, pour permettre la génération d'une trame de bruit de confort en l'absence de signaux de parole dans ladite trame courante, un circuit de génération d'un bruit gaussien, un sous-ensemble de deux voies de définition de gain en parallèle et un additionneur des sorties desdites voies sur la sortie duquel est disponible ladite trame de bruit de confort engendrée en l'absence de signaux de parole, la première voie de définition de gain comprenant en série un circuit de gain, dont le gain est en relation directe avec l'énergie calculée pour chaque trame courante, un filtre de coefficients déterminés par ladite analyse LPC, et un multiplieur par un coefficient de pondération α, et la deuxième voie de définition de gain comprenant un multiplieur par le coefficient de pondération complémentaire (1-α).

[0006] Ce dispositif permet de restituer à l'interlocuteur distant une meilleure qualité de message. En effet, en transmettant pendant les plages de silence quelques trames qui contiennent les caractéristiques essentielles du bruit ambiant, on supprime cette désagréable impression de coupure de ligne en cas de silence total. Le codage de ces quelques trames de bruit est très peu coûteux en débit, puisqu'il n'y a qu'à envoyer les caractéristiques fréquentielles et d'énergie du signal de bruit, qui sont suffisantes pour restituer, pour l'interlocuteur, un bruit sensiblement équivalent. Des dispositifs de génération de bruit de confort sont déjà prévus dans les codeurs de parole décrits par exemple dans US-A-5537509, dans C.B. Southcott et al: "voice control of the pan-european digital mobile radic sistem", Communications technology for the 1990's and beyond, Dallas, nov. 27-30, 1989, vol.2 of 3, 27.11.1989, Institute of electrical and electronics engineers, pages 1070-1074, ou dans le projet de recommandation émis récemment par l'Union Internationale des Télécommunications (ITU), "Draft Recommendation G.723 - Dual rate speech coder for multimedia telecommunication transmitting at 5.3 and 6.3 kbits/s", ITU, Study Group 15, 1995, 10ème "LBC Meeting", Newton, Ma., USA, visant à définir une norme pour un codeur de parole. Il faut cependant remarquer que, dans le cas de ces réalisations existantes, l'opération de génération de bruit de confort est très fortement imbriquée dans le codeur de parole. Au contraire, dans le cas présent, la solution mise en oeuvre ne dépend pas du codeur. En effet, on ne fait plus appel à des dictionnaires de formes d'onde, qui étaient traditionnellement présents dans les codeurs de parole, mais à l'addition au bruit filtré d'un bruit gaussien, qui est particulièrement intéressante lorsque le bruit ambiant est très faible.

[0007] Les particularités de l'invention apparaîtront maintenant de façon plus détaillée dans la description qui suit et dans le dessin annexé (figure 1), donné à titre d'exemple non limitatif et qui illustre un exemple de réalisation d'un dispositif de génération de bruit de confort conforme à l'invention.

[0008] Sur la figure 1, dans la partie codage, les signaux d'entrée sont disponibles sous la forme de trames successives TR_n-1, TR_n, ... etc... de durée prédéterminée. Cette partie codage comprend tout d'abord, comme indiqué sur la figure, un circuit 11 de détermination de l'énergie de la trame courante, dit aussi d'analyse de gain, ainsi qu'un circuit 12 de détermination de l'enveloppe de cette trame (au point de vue fréquentiel) par l'intermédiaire d'une analyse connue sous le nom de LPC (en anglais : linear predictive coding) qui permet d'estimer des coefficients de prédiction linéaire. Ces caractéristiques des signaux d'entrée sont quantifiées, codées et transmises.

[0009] Au décodage, où l'on veut régénérer un bruit dit de confort pour l'interlocuteur distant, le dispositif de génération de bruit de confort selon l'invention comprend tout d'abord un circuit 21 de génération d'un bruit gaussien. Ce circuit n'est pas un dictionnaire de formes d'onde et ne nécessite donc pas de mémoire. Le calcul permettant cette génération est une somme, effectuée en temps réel, de nombres pseudo-aléatoires (on obtient un signal gaussien si le nombre d'itérations est suffisamment grand, moins d'une dizaine suffisant en général). Ce bruit est envoyé en parallèle sur deux voies de définition de gain 30 et 40 dont la première comprend en série un circuit de gain 31 (ce gain est déterminé par l'énergie -qui a été transmise- de la trame courante concernée), un filtre 32 (dont les coefficients LPC - également transmis- ont été estimés comme indiqué ci-dessus) et un multiplieur 33. La sortie de ce multiplieur 33 et celle d'un multiplieur 43 similaire constituant l'autre voie 40 (ces multiplieurs permettant des pondérations par des coefficients α et 1-α respectivement) constituent les entrées d'un additionneur 25 en sortie duquel est présente la trame de bruit de confort TBC reconstituée en l'absence de signaux de parole.

[0010] On a donc, dans la partie codage, déterminé et quantifié l'énergie de la trame concernée, pour fixer le gain de l'une des voies de définition de gain au décodage, ainsi qu'estimé et quantifié les coefficients du filtre de cette même voie destiné à régénérer à partir d'un bruit gaussien (auquel on applique le filtrage) un bruit ayant pratiquement les mêmes caractéristiques spectrales que le bruit original. A l'écoute, ce bruit reconstitué n'est pas exactement le même que le bruit d'origine, mais la qualité est nettement améliorée, les transitions brutales entre parole et silence total étant désormais évitées.

[0011] Bien entendu, la présente invention n'est pas limitée à cet exemple de réalisation, à partir duquel des variantes peuvent être prévues. Par exemple, pour le décodage, on peut tenir compte du fait que l'on a réduit le débit en ne transmettant pas à chaque fois une trame codée : pour diminuer les transitions abruptes, il est alors possible de faire une interpolation avec les trames précédentes, en ce qui concerne l'énergie et les coefficients de filtre. On peut aussi améliorer la qualité en prévoyant également au codage une interpolation de l'énergie des trames passées.

Revendications

1. Dispositif de génération de bruit de confort pour un décodeur de parole recevant des signaux de parole qui correspondent à une séquence d'origine formée de trames successives de longueur prédéterminée et ont été préalablement codés dans un codeur de parole comprenant notamment un circuit (11) de détermination de l'énergie de la trame courante et un circuit (12) de détermination de l'enveloppe de cette trame par analyse dite LPC, caractérisé en ce qu'il comprend en série, pour permettre la génération d'une trame de bruit de confort en l'absence de signaux de parole dans ladite trame courante, un circuit (21) de génération d'un bruit gaussien, un sous-ensemble de deux voies (30, 40) de définition de gain en parallèle et un additionneur (25) des sorties desdites voies sur la sortie duquel est disponible ladite trame de bruit de confort engendrée en l'absence de signaux de parole, la première voie de définition de gain comprenant en série un circuit (31) de gain, dont le gain est en relation directe avec l'énergie calculée pour chaque trame courante, un filtre (32) de coefficients déterminés par ladite analyse LPC, et un multiplieur (33) par un coefficient de pondération α, et la deuxième voie de définition de gain comprenant un multiplieur (43) par le coefficient de pondération complémentaire (1-α).

Ansprüche

1. Vorrichtung zur Erzeugung von Komfortrauschen für einen Sprachdekodierer, der Sprachsignale erhält, die einer aus aufeinanderfolgenden Rastern gebildeten Originalsequenz vorbestimmter Länge entsprechen, die zuvor in einem Sprachkodierer kodiert wurden, der insbesondere eine Schaltung zur Bestimmung der Energie (11) des laufenden Rasters und eine Schaltung zur Bestimmung der Umhüllung (12) dieses Rasters per so genannter LPC-Analyse beinhaltet, dadurch gekennzeichnet, dass sie zur möglichen Erzeugung eines Komfortrauschrasters bei ausbleibenden Sprachsignalen in dem besagten laufenden Raster in Serie eine Schaltung zur Erzeugung eines gaußschen Rauschens (21), ein Untersystem aus zwei Stimmen (30, 40) zur parallelen Leistungsdefinition und einen Addierer der Ausgänge der besagten Wege enthält, an dessen Ausgang das besagte Komfortrauschraster verfügbar ist, das bei ausbleibenden Sprachsignalen erzeugt wird, wobei der erste Leistungsdefinitionsweg in Serie eine Leistungsschaltung (31), deren Leistung in direktem Verhältnis mit der Energie steht, die für jedes laufende Raster berechnet wird, einen von der besagten LPC-Analyse definierten Koeffizientenfilter (32) und einen Multiplizierer (33) mit einem Wägungskoeffizienten enthält, und der zweite Leistungsdefinitionsweg einen Multiplizierer (43) mit dem zusätzlichen Wägungskoeffizienten (L- α) enthält.

Claims

1. A device for generating comfort noise for a speech decoder receiving speech signals which correspond to an original sequence formed by successive fields of a predetermined length and have been previously encoded in a speech encoder particularly comprising a circuit (11) for determining the energy of the current field and a circuit (12) for determining the envelope of this field by way of LPC analysis, characterized in that, for allowing generation of a field of comfort noise in the absence of speech signals in said current field, it comprises a series arrangement of a circuit (21) for generating Gaussian noise, a sub-assembly of two parallel gain-definition channels (30, 40) and an adder (25) for the outputs of said channels, said field of comfort noise generated in the absence of speech signals being available at the output of said adder; the first gain-definition channel comprising a series arrangement of a gain circuit (31) whose gain is in a direct relation with the energy calculated for each current field, a filter (32) for coefficients determined by said LPC analysis, and a multiplier (33) multiplying by a weighting coefficient α, and the second gain-definition channel comprising a multiplier (43) multiplying by the complementary weighting coefficient (1-α).

Dessins