[0001] La présente invention concerne un dispositif de génération de bruit de confort pour
un décodeur de parole recevant des signaux de parole qui correspondent à une séquence
d'origine formée de trames successives de longueur prédéterminée et ont été préalablement
codés dans un codeur de parole comprenant notamment un circuit de détermination de
l'énergie de la trame courante et un circuit de détermination de l'enveloppe de cette
trame par analyse dite LPC.
[0002] Lorsqu'on transmet des signaux de parole dans des types de réseaux transportant également
d'autres données que de tels signaux, il est souvent utile de s'assurer qu'ils n'occupent
pas toute la bande passante et autorisent le passage simultané de ces autres données,
ce qui revient à optimiser leur débit. Il est alors prévu, avant transmission, un
détecteur d'activité vocale qui permet de repérer, dans des signaux d'entrée où des
signaux vocaux sont mêlés à du bruit et des moments de silence, les périodes où des
signaux de parole sont présents.
[0003] Si la présence de signaux de parole est détectée, le codeur de parole qui suit transmet
régulièrement (toutes les trames) un flot de données numériques qui permettra à un
interlocuteur distant de reconstituer ultérieurement ces signaux de parole. Au contraire,
si l'on ne détecte plus de signaux de parole, on n'envoie plus de trames codées sur
le réseau, afin d'économiser du débit sur celui-ci. Pour l'interlocuteur distant,
on peut forcer alors à zéro les échantillons des signaux pendant ces périodes d'absence
de parole. Cette solution est efficace pour la réduction du débit, mais peut conduire
à des effets désagréables pour l'interlocuteur. En effet, dans la plupart des cas,
il n'existe pas un silence total dans les lieux où se déroule la conversation, mais
plutôt un bruit ambiant. Si donc, au moment de transitions paroles/silence, les échantillons
des signaux d'entrée sont forcés à zéro, l'interlocuteur aura l'impression d'une discontinuité
dans la conversation, ou même d'une coupure de la ligne.
[0004] Le but de l'invention est de proposer un dispositif de génération de bruit de confort
remédiant à cet inconvénient.
[0005] L'invention concerne à cet effet un dispositif de génération de bruit de confort
tel que défini dans le paragraphe introductif de la description et qui est en outre
caractérisé en ce qu'il comprend en série, pour permettre la génération d'une trame
de bruit de confort en l'absence de signaux de parole dans ladite trame courante,
un circuit de génération d'un bruit gaussien, un sous-ensemble de deux voies de définition
de gain en parallèle et un additionneur des sorties desdites voies sur la sortie duquel
est disponible ladite trame de bruit de confort engendrée en l'absence de signaux
de parole, la première voie de définition de gain comprenant en série un circuit de
gain, dont le gain est en relation directe avec l'énergie calculée pour chaque trame
courante, un filtre de coefficients déterminés par ladite analyse LPC, et un multiplieur
par un coefficient de pondération α, et la deuxième voie de définition de gain comprenant
un multiplieur par le coefficient de pondération complémentaire (1-α).
[0006] Ce dispositif permet de restituer à l'interlocuteur distant une meilleure qualité
de message. En effet, en transmettant pendant les plages de silence quelques trames
qui contiennent les caractéristiques essentielles du bruit ambiant, on supprime cette
désagréable impression de coupure de ligne en cas de silence total. Le codage de ces
quelques trames de bruit est très peu coûteux en débit, puisqu'il n'y a qu'à envoyer
les caractéristiques fréquentielles et d'énergie du signal de bruit, qui sont suffisantes
pour restituer, pour l'interlocuteur, un bruit sensiblement équivalent. Des dispositifs
de génération de bruit de confort sont déjà prévus dans les codeurs de parole décrits
par exemple dans US-A-5537509, dans C.B. Southcott et al: "voice control of the pan-european
digital mobile radic sistem", Communications technology for the 1990's and beyond,
Dallas, nov. 27-30, 1989, vol.2 of 3, 27.11.1989, Institute of electrical and electronics
engineers, pages 1070-1074, ou dans le projet de recommandation émis récemment par
l'Union Internationale des Télécommunications (ITU), "Draft Recommendation G.723 -
Dual rate speech coder for multimedia telecommunication transmitting at 5.3 and 6.3
kbits/s", ITU, Study Group 15, 1995, 10ème "LBC Meeting", Newton, Ma., USA, visant
à définir une norme pour un codeur de parole. Il faut cependant remarquer que, dans
le cas de ces réalisations existantes, l'opération de génération de bruit de confort
est très fortement imbriquée dans le codeur de parole. Au contraire, dans le cas présent,
la solution mise en oeuvre ne dépend pas du codeur. En effet, on ne fait plus appel
à des dictionnaires de formes d'onde, qui étaient traditionnellement présents dans
les codeurs de parole, mais à l'addition au bruit filtré d'un bruit gaussien, qui
est particulièrement intéressante lorsque le bruit ambiant est très faible.
[0007] Les particularités de l'invention apparaîtront maintenant de façon plus détaillée
dans la description qui suit et dans le dessin annexé (figure 1), donné à titre d'exemple
non limitatif et qui illustre un exemple de réalisation d'un dispositif de génération
de bruit de confort conforme à l'invention.
[0008] Sur la figure 1, dans la partie codage, les signaux d'entrée sont disponibles sous
la forme de trames successives TR
n-1, TR
n, ... etc... de durée prédéterminée. Cette partie codage comprend tout d'abord, comme
indiqué sur la figure, un circuit 11 de détermination de l'énergie de la trame courante,
dit aussi d'analyse de gain, ainsi qu'un circuit 12 de détermination de l'enveloppe
de cette trame (au point de vue fréquentiel) par l'intermédiaire d'une analyse connue
sous le nom de LPC (en anglais :
linear
predictive
coding) qui permet d'estimer des coefficients de prédiction linéaire. Ces caractéristiques
des signaux d'entrée sont quantifiées, codées et transmises.
[0009] Au décodage, où l'on veut régénérer un bruit dit de confort pour l'interlocuteur
distant, le dispositif de génération de bruit de confort selon l'invention comprend
tout d'abord un circuit 21 de génération d'un bruit gaussien. Ce circuit n'est pas
un dictionnaire de formes d'onde et ne nécessite donc pas de mémoire. Le calcul permettant
cette génération est une somme, effectuée en temps réel, de nombres pseudo-aléatoires
(on obtient un signal gaussien si le nombre d'itérations est suffisamment grand, moins
d'une dizaine suffisant en général). Ce bruit est envoyé en parallèle sur deux voies
de définition de gain 30 et 40 dont la première comprend en série un circuit de gain
31 (ce gain est déterminé par l'énergie -qui a été transmise- de la trame courante
concernée), un filtre 32 (dont les coefficients LPC - également transmis- ont été
estimés comme indiqué ci-dessus) et un multiplieur 33. La sortie de ce multiplieur
33 et celle d'un multiplieur 43 similaire constituant l'autre voie 40 (ces multiplieurs
permettant des pondérations par des coefficients α et 1-α respectivement) constituent
les entrées d'un additionneur 25 en sortie duquel est présente la trame de bruit de
confort TBC reconstituée en l'absence de signaux de parole.
[0010] On a donc, dans la partie codage, déterminé et quantifié l'énergie de la trame concernée,
pour fixer le gain de l'une des voies de définition de gain au décodage, ainsi qu'estimé
et quantifié les coefficients du filtre de cette même voie destiné à régénérer à partir
d'un bruit gaussien (auquel on applique le filtrage) un bruit ayant pratiquement les
mêmes caractéristiques spectrales que le bruit original. A l'écoute, ce bruit reconstitué
n'est pas exactement le même que le bruit d'origine, mais la qualité est nettement
améliorée, les transitions brutales entre parole et silence total étant désormais
évitées.
[0011] Bien entendu, la présente invention n'est pas limitée à cet exemple de réalisation,
à partir duquel des variantes peuvent être prévues. Par exemple, pour le décodage,
on peut tenir compte du fait que l'on a réduit le débit en ne transmettant pas à chaque
fois une trame codée : pour diminuer les transitions abruptes, il est alors possible
de faire une interpolation avec les trames précédentes, en ce qui concerne l'énergie
et les coefficients de filtre. On peut aussi améliorer la qualité en prévoyant également
au codage une interpolation de l'énergie des trames passées.
1. Dispositif de génération de bruit de confort pour un décodeur de parole recevant des
signaux de parole qui correspondent à une séquence d'origine formée de trames successives
de longueur prédéterminée et ont été préalablement codés dans un codeur de parole
comprenant notamment un circuit (11) de détermination de l'énergie de la trame courante
et un circuit (12) de détermination de l'enveloppe de cette trame par analyse dite
LPC, caractérisé en ce qu'il comprend en série, pour permettre la génération d'une trame de bruit de confort
en l'absence de signaux de parole dans ladite trame courante, un circuit (21) de génération
d'un bruit gaussien, un sous-ensemble de deux voies (30, 40) de définition de gain
en parallèle et un additionneur (25) des sorties desdites voies sur la sortie duquel
est disponible ladite trame de bruit de confort engendrée en l'absence de signaux
de parole, la première voie de définition de gain comprenant en série un circuit (31)
de gain, dont le gain est en relation directe avec l'énergie calculée pour chaque
trame courante, un filtre (32) de coefficients déterminés par ladite analyse LPC,
et un multiplieur (33) par un coefficient de pondération α, et la deuxième voie de
définition de gain comprenant un multiplieur (43) par le coefficient de pondération
complémentaire (1-α).
1. Vorrichtung zur Erzeugung von Komfortrauschen für einen Sprachdekodierer, der Sprachsignale
erhält, die einer aus aufeinanderfolgenden Rastern gebildeten Originalsequenz vorbestimmter
Länge entsprechen, die zuvor in einem Sprachkodierer kodiert wurden, der insbesondere
eine Schaltung zur Bestimmung der Energie (11) des laufenden Rasters und eine Schaltung
zur Bestimmung der Umhüllung (12) dieses Rasters per so genannter LPC-Analyse beinhaltet,
dadurch gekennzeichnet, dass sie zur möglichen Erzeugung eines Komfortrauschrasters bei ausbleibenden Sprachsignalen
in dem besagten laufenden Raster in Serie eine Schaltung zur Erzeugung eines gaußschen
Rauschens (21), ein Untersystem aus zwei Stimmen (30, 40) zur parallelen Leistungsdefinition
und einen Addierer der Ausgänge der besagten Wege enthält, an dessen Ausgang das besagte
Komfortrauschraster verfügbar ist, das bei ausbleibenden Sprachsignalen erzeugt wird,
wobei der erste Leistungsdefinitionsweg in Serie eine Leistungsschaltung (31), deren
Leistung in direktem Verhältnis mit der Energie steht, die für jedes laufende Raster
berechnet wird, einen von der besagten LPC-Analyse definierten Koeffizientenfilter
(32) und einen Multiplizierer (33) mit einem Wägungskoeffizienten enthält, und der
zweite Leistungsdefinitionsweg einen Multiplizierer (43) mit dem zusätzlichen Wägungskoeffizienten
(L- α) enthält.
1. A device for generating comfort noise for a speech decoder receiving speech signals
which correspond to an original sequence formed by successive fields of a predetermined
length and have been previously encoded in a speech encoder particularly comprising
a circuit (11) for determining the energy of the current field and a circuit (12)
for determining the envelope of this field by way of LPC analysis, characterized in that, for allowing generation of a field of comfort noise in the absence of speech signals
in said current field, it comprises a series arrangement of a circuit (21) for generating
Gaussian noise, a sub-assembly of two parallel gain-definition channels (30, 40) and
an adder (25) for the outputs of said channels, said field of comfort noise generated
in the absence of speech signals being available at the output of said adder; the
first gain-definition channel comprising a series arrangement of a gain circuit (31)
whose gain is in a direct relation with the energy calculated for each current field,
a filter (32) for coefficients determined by said LPC analysis, and a multiplier (33)
multiplying by a weighting coefficient α, and the second gain-definition channel comprising
a multiplier (43) multiplying by the complementary weighting coefficient (1-α).