[0001] La présente invention concerne un procédé d'analyse par prédiction linéaire d'un
signal audiofréquence. Ce procédé trouve une application particulière, mais non exclusive,
dans des codeurs audio à prédiction, notamment dans des codeurs à analyse par synthèse,
dont le type le plus répandu est le codeur CELP ("Code-Excited Linear Prediction").
[0002] Les techniques de codage prédictif à analyse par synthèse sont actuellement très
répandues pour le codage de la parole en bande téléphonique (300-3400 Hz) à des débits
pouvant descendre jusqu'à 8 kbit/s, tout en conservant une qualité téléphonique. Pour
la bande audio (de l'ordre de 20 kHz), les techniques de codage par transformée sont
utilisées pour des applications de diffusion et de stockage de signaux vocaux et musicaux.
Cependant, ces techniques impliquent des retards de codage relativement importants
(plus grands que 100 ms), ce qui produit en particulier des difficultés de participation
dans les communications de groupe où l'interactivité est très importante. Les techniques
prédictives produisent un retard plus faible, dépendant essentiellement de la longueur
des trames d'analyse par prédiction linéaire (typiquement 10 à 20 ms), et trouvent
pour cette raison des applications même pour le codage de signaux vocaux et/ou musicaux
ayant une largeur de bande supérieure à la bande téléphonique.
[0003] Les codeurs prédictifs utilisés pour la compression de débit réalisent une modélisation
de l'enveloppe spectrale du signal. cette modélisation résulte d'une analyse par prédiction
linéaire d'ordre M (M≃10 typiquement en bande étroite), consistant à déterminer M
coefficients a
i de prédiction linéaire du signal d'entrée. Ces coefficients caractérisent un filtre
de synthèse utilisé au décodeur, dont la fonction de transfert est de la forme 1/A(z)
avec

[0004] L'analyse par prédiction linéaire a un domaine d'application général plus large que
celui du codage de la parole. Dans certaines applications, l'ordre M de la prédiction
constitue l'une des variables que l'analyse par prédiction linéaire vise à obtenir,
cette variable étant influencée par le nombre de pics présents dans le spectre du
signal analysé (voir US-A-5 142 581).
[0005] Le filtre calculé par l'analyse par prédiction linéaire peut avoir diverses structures,
conduisant à différents choix de paramètres pour la représentation des coefficients
(les coefficients a
i eux-mêmes, les paramètres LAR, LSF, LSP, les coefficients de réflexion ou PARCOR...).
Avant l'avènement des processeurs de signal numérique (DSP), il était courant d'employer
des structures récursives pour le filtre calculé, par exemple des structures faisant
appel aux coefficients PARCOR du type décrit dans l'article de F. ITAKURA et S. SAITO
"Digital Filtering Techniques for Speech Analysis and Synthesis", Proc. of the 7th
International Congress on Acoustics, Budapest 1971, pages 261-264 (voir FR-A-2 284
946 ou US-A-3 975 587).
[0006] Dans les codeurs à analyse par synthèse, les coefficients a
i servent également à construire un filtre de pondération perceptuelle utilisé par
le codeur pour déterminer le signal d'excitation à appliquer au filtre de synthèse
à court terme pour obtenir un signal synthétique représentatif du signal de parole.
Cette pondération perceptuelle accentue les portions du spectre où les erreurs de
codage sont les plus perceptibles, c'est-à-dire les zones interformantiques. La fonction
de transfert W(z) du filtre de pondération perceptuelle est habituellement de la forme

où γ
1 et γ
2 sont deux coefficients d'expansion spectrale tels que 0≤γ
2≤γ
1≤1. Une amélioration du masquage du bruit a été apportée par E. Ordentlich et Y. Shoham,
dans leur article "Low-Delay Code-Excited Linear Predictive Coding of Wideband Speech
at 32 kbps", Proc. ICASSP, Toronto, Mai 1991, pages 9-12. Cette amélioration consiste
à combiner pour la pondération perceptuelle le filtre W(z) avec un autre filtre modélisant
la pente du spectre. Cette amélioration est particulièrement appréciable dans le cas
de codage de signaux à forte dynamique spectrale (bande élargie ou bande audio) pour
lesquels les auteurs ont montré une importante amélioration de la qualité subjective
du signal reconstruit.
[0007] Dans la plupart des décodeurs CELP actuels, les coefficients de prédiction linéaire
a
i sont également utilisés pour définir un post-filtre servant à atténuer les zones
fréquentielles entre les formants et les harmoniques du signal de parole, sans modifier
la pente du spectre du signal. Une forme habituelle de la fonction de transfert de
ce post-filtre est :

où G
P est un facteur de gain compensant l'atténuation des filtres, β
1 et β
2 sont des coefficients tels que 0≤β
1≤β
2≤1, µ est une constante positive et r
1 désigne le premier coefficient de réflexion dépendant des coefficients a
i.
[0008] La modélisation de l'enveloppe spectrale du signal par les coefficients a
i constitue donc un élément essentiel du processus de codage et de décodage, en ce
sens qu'elle doit représenter le contenu spectral du signal à reconstituer au décodeur
et qu'elle pilote aussi bien le masquage du bruit de quantification que le post-filtrage
au décodeur.
[0009] Pour des signaux à forte dynamique spectrale, l'analyse par prédiction linéaire habituellement
pratiquée ne parvient pas à modéliser fidèlement l'enveloppe du spectre. Souvent,
les signaux de parole sont sensiblement plus énergétiques aux basses fréquences qu'aux
fréquences élevées, de sorte que l'analyse par prédiction linéaire conduit certes
à une modélisation précise aux basses fréquences, mais au détriment de la modélisation
du spectre aux fréquences plus élevées. Cet inconvénient devient particulièrement
gênant dans le cas du codage en bande élargie.
[0010] Un but de la présente invention est d'améliorer la modélisation du spectre d'un signal
audiofréquence dans un système faisant appel à un procédé d'analyse par prédiction
linéaire. Un autre but est de rendre les performances d'un tel système plus homogènes
pour des signaux d'entrée différents (parole, musique, sinusoïdes, signaux DTMF...),
des largeurs de bande différentes (bande téléphonique, bande élargie, bande hifi...),
des conditions différentes d'enregistrement (microphone directif, antenne acoustique...)
et de filtrage.
[0011] L'invention propose ainsi un procédé d'analyse par prédiction linéaire d'un signal
audiofréquence, pour déterminer des paramètres spectraux dépendant d'un spectre à
court terme du signal audiofréquence, comprenant q étages de prédiction successifs,
q étant un entier supérieur à 1. A chaque étage de prédiction p (1≤p≤q), on détermine
des paramètres représentant un nombre prédéfini Mp de coefficients
a1p,...
aMpp de prédiction linéaire d'un signal d'entrée dudit étage, le signal audiofréquence
analysé constituant le signal d'entrée du premier étage, et le signal d'entrée d'un
étage p+1 étant constitué par le signal d'entrée de l'étage p filtré par un filtre
de fonction de transfert

[0012] Le nombre Mp de coefficients de prédiction linéaire peut notamment augmenter d'un
étage au suivant. Ainsi, le premier étage pourra rendre compte assez fidèlement de
la pente générale du spectre ou du signal, tandis que les étages suivants affineront
la représentation des formants du signal. On évite ainsi, dans le cas de signaux à
forte dynamique, de trop privilégier les zones les plus énergétiques au risque d'une
modélisation médiocre des autres zones fréquentielles pouvant être perceptuellement
importantes.
[0013] Un second aspect de l'invention concerne une application de ce procédé d'analyse
par prédiction linéaire dans un codeur audiofréquence à analyse par synthèse à adaptation
"forward". L'invention propose ainsi un procédé de codage d'un signal audiofréquence
comprenant les étapes suivantes :
- analyse par prédiction linéaire d'un signal audiofréquence numérisé en trames successives
pour déterminer des paramètres définissant un filtre de synthèse à court terme ;
- détermination de paramètres d'excitation définissant un signal d'excitation à appliquer
au filtre de synthèse à court terme pour produire un signal synthétique représentatif
du signal audiofréquence ; et
- production de valeurs de quantification des paramètres définissant le filtre de synthèse
à court terme et des paramètres d'excitation,
dans lequel l'analyse par prédiction linéaire est un processus à q étages successifs
tel que défini ci-dessus, et dans lequel le filtre de prédiction à court terme a une
fonction de transfert de la forme 1/A(z) avec

[0014] La fonction de transfert A(z) ainsi obtenue peut également être utilisée pour définir
selon la formule (2) la fonction de transfert du filtre de pondération perceptuelle
lorsque le codeur est un codeur à analyse par synthèse avec détermination en boucle
fermée du signal d'excitation. Une autre possibilité intéressante est d'adopter des
coefficients d'expansion spectrale γ
1 et γ
2 pouvant varier d'un étage au suivant, c'est-à-dire de donner au filtre de pondération
perceptuelle une fonction de transfert de la forme

où γ
1p, γ
2p désignent des paires de coefficients d'expansion spectrale tels que 0≤γ
2p≤γ
1p≤1 pour 1≤p≤q.
[0015] L'invention est également applicable au niveau d'un décodeur associé. Le procédé
de décodage ainsi mis en oeuvre selon l'invention comprend les étapes suivantes :
- on reçoit des valeurs de quantification de paramètres définissant un filtre de synthèse
à court terme et des paramètres d'excitation, les paramètres définissant le filtre
de synthèse à court terme comprenant un nombre q>1 de jeux de coefficients de prédiction
linéaire, chaque jeu comportant un nombre prédéfini de coefficients ;
- on produit un signal d'excitation sur la base des valeurs de quantification des paramètres
d'excitation ;
- on produit un signal audiofréquence synthétique en filtrant le signal d'excitation
par un filtre de synthèse ayant une fonction de transfert de la forme 1/A(z) avec

où les coefficients a1p,...,aMpp correspondent au p-ième jeu de coefficients de prédiction linéaire pour 1≤p≤q.
[0016] Cette fonction de transfert A(z) peut également être utilisée pour définir un post-filtre
dont la fonction de transfert comporte, comme dans la formule (3) ci-dessus, un terme
de la forme A(z/β
1)/A(z/β
2), où β
1 et β
2 désignent des coefficients tels que 0≤β
1≤β
2≤1.
[0017] Une variante intéressante consiste à remplacer ce terme de la fonction de transfert
du post-filtre par :

où β
1p, β
2p désignent des paires de coefficients tels que 0≤β
1p≤β
2p≤1 pour 1≤p≤q.
[0018] L'invention s'applique également à des codeurs audiofréquence à adaptation "backward".
L'invention propose ainsi un procédé de codage d'un premier signal audiofréquence
numérisé en trames successives, comprenant les étapes suivantes :
- analyse par prédiction linéaire d'un second signal audiofréquence pour déterminer
des paramètres définissant un filtre de synthèse à court terme ;
- détermination de paramètres d'excitation définissant un signal d'excitation à appliquer
au filtre de synthèse à court terme pour produire un signal synthétique représentatif
du premier signal audiofréquence, ce signal synthétique constituant ledit second signal
audiofréquence pour au moins une trame suivante ; et
- production de valeurs de quantification des paramètres d'excitation,
dans lequel l'analyse par prédiction linéaire est un processus à q étages successifs
tel que défini ci-dessus, et dans lequel le filtre de prédiction à court terme a une
fonction de transfert de la forme 1/A(z) avec

[0019] Pour une mise en oeuvre dans un décodeur associé, l'invention propose un procédé
de décodage d'un flux binaire pour construire en trames successives un signal audiofréquence
codé par ledit flux binaire, comprenant les étapes suivantes :
- on reçoit des valeurs de quantification de paramètres d'excitation ;
- on produit un signal d'excitation sur la base des valeurs de quantification des paramètres
d'excitation ;
- on produit un signal audiofréquence synthétique en filtrant le signal d'excitation
par un filtre de synthèse à court terme ;
- on effectue une analyse par prédiction linéaire du signal synthétique pour obtenir
des coefficients du filtre de synthèse à court terme pour au moins une trame suivante,
dans lequel l'analyse par prédiction linéaire est un processus à q étages successifs
tel que défini ci-dessus, et dans lequel le filtre de prédiction à court terme a une
fonction de transfert de la forme 1/A(z) avec

[0020] L'invention permet encore de réaliser des codeurs/décodeurs audiofréquence mixtes,
c'est-à-dire faisant appel à la fois à des schémas d'adaptation "forward" et "backward",
le ou les premiers étages de prédiction linéaire correspondant à une analyse "forward"
et le ou les derniers étages à une analyse "backward". L'invention propose ainsi un
procédé de codage d'un premier signal audiofréquence numérisé en trames successives,
comprenant les étapes suivantes :
- analyse par prédiction linéaire du premier signal audiofréquence pour déterminer des
paramètres définissant une première composante d'un filtre de synthèse à court terme
;
- détermination de paramètres d'excitation définissant un signal d'excitation à appliquer
au filtre de synthèse à court terme pour produire un signal synthétique représentatif
du premier signal audio-fréquence ;
- production de valeurs de quantification des paramètres définissant la première composante
du filtre de synthèse à court terme et des paramètres d'excitation ;
- filtrage du signal synthétique par un filtre de fonction de transfert correspondant
à l'inverse de la fonction de transfert de la première composante du filtre de synthèse
à court terme ; et
- analyse par prédiction linéaire du signal synthétique filtré pour obtenir des coefficients
d'une seconde composante du filtre de synthèse à court terme pour au moins une trame
suivante,
dans lequel l'analyse par prédiction linéaire du premier signal audiofréquence
est un processus à q
F étages successifs, q
F étant un entier au moins égal à 1, ledit processus à q
F étages comportant, à chaque étage de prédiction p (1≤p≤q
F), la détermination de paramètres représentant un nombre prédéfini MFp de coefficients
a1F,p,...,
aMFpF,p de prédiction linéaire d'un signal d'entrée dudit étage, le premier signal audiofréquence
constituant le signal d'entrée du premier étage, et le signal d'entrée d'un étage
p+1 étant constitué par le signal d'entrée de l'étage p filtré par un filtre de fonction
de transfert

la première composante du filtre de synthèse à court terme ayant une fonction de
transfert de la forme 1/A
F(z) avec

et dans lequel l'analyse par prédiction linéaire du signal synthétique filtré
est un processus à q
B étages successifs, q
B étant un entier au moins égal à 1, ledit processus à q
B étages comportant, à chaque étage de prédiction p (1≤p≤q
B), la détermination de paramètres représentant un nombre prédéfini MBp de coefficients
a1B,p,...,aMBpB,p de prédiction linéaire d'un signal d'entrée dudit étage, le signal synthétique filtré
constituant le signal d'entrée du premier étage, et le signal d'entrée d'un étage
p+1 étant constitué par le signal d'entrée de l'étage p filtré par un filtre de fonction
de transfert

la seconde composante du filtre de synthèse à court terme ayant une fonction de transfert
de la forme 1/A
B(z) avec

et le filtre de synthèse à court terme ayant une fonction de transfert de la forme
1/A(z) avec A(z)=A
F(z).A
B(z).
[0021] Pour une mise en oeuvre dans un décodeur mixte associé, l'invention propose un procédé
de décodage d'un flux binaire pour construire en trames successives un signal audiofréquence
codé par ledit flux binaire, comprenant les étapes suivantes :
- on reçoit des valeurs de quantification de paramètres définissant une première composante
d'un filtre de synthèse à court terme et de paramètres d'excitation, les paramètres
définissant la première composante du filtre de synthèse à court terme représentant
un nombre qF au moins égal à 1 de jeux de coefficients de prédiction linéaire a1F,p,...,aMFpF,p pour 1≤p≤qF, chaque jeu p comportant un nombre prédéfini MFp de coefficients, la première composante
du filtre de synthèse à court terme ayant une fonction de transfert de la forme 1/AF(z) avec

- on produit un signal d'excitation sur la base des valeurs de quantification des paramètres
d'excitation ;
- on produit un signal audiofréquence synthétique en filtrant le signal d'excitation
par un filtre de synthèse à court terme de fonction de transfert 1/A(z) avec A(z)=AF(z).AB(z), 1/AB(z) représentant la fonction de transfert d'une seconde composante du filtre de synthèse
à court terme ;
- on filtre le signal synthétique par un filtre de fonction de transfert AF(z) ; et
- on effectue une analyse par prédiction linéaire du signal synthétique filtré pour
obtenir des coefficients de la seconde composante du filtre de synthèse à court terme
pour au moins une trame suivante,
dans lequel l'analyse par prédiction linéaire du signal synthétique filtré est
un processus à q
B étages tel que défini ci-dessus, et dans lequel le filtre de synthèse à court terme
a une fonction de transfert de la forme 1/A(z)=1/[A
F(z).A
B(z)] avec

[0022] Bien qu'on accorde une importance particulière aux applications de l'invention dans
le domaine du codage/ décodage à analyse par synthèse, il convient d'observer que
le procédé d'analyse par prédiction linéaire à étages multiples proposé selon l'invention
comporte de nombreuses autres applications dans le traitement de signaux audio, par
exemple dans les codeurs prédictifs par transformée, dans des systèmes de reconnaissance
de parole, dans des systèmes d'accentuation de parole (speech enhancement) ...
[0023] D'autres particularités et avantages de la présente invention apparaîtront dans la
description ci-après d'exemples de réalisation préférés mais non limitatifs, en référence
aux dessins annexés, dans lesquels :
- la figure 1 est un organigramme d'un procédé d'analyse par prédiction linéaire selon
l'invention ;
- la figure 2 est un diagramme spectral comparant les résultats d'un procédé selon l'invention
avec ceux d'un procédé conventionnel d'analyse par prédiction linéaire ;
- les figures 3 et 4 sont des schémas synoptiques d'un décodeur et d'un codeur CELP
pouvant mettre en oeuvre l'invention ;
- les figures 5 et 6 sont des schémas synoptiques de variantes de décodeur et de codeur
CELP pouvant mettre en oeuvre l'invention ; et
- les figures 7 et 8 sont des schémas synoptiques d'autres variantes de décodeur et
de codeur CELP pouvant mettre en oeuvre d'invention.
[0024] Le signal audiofréquence à analyser dans le procédé illustré par la figure 1 est
noté s
0(n). Il est supposé disponible sous forme d'échantillons numériques, l'entier n désignant
les instants d'échantillonnage successifs. Le procédé d'analyse par prédiction linéaire
comprend q étages successifs 5
1,...,5
p,...,5
q. A chaque étage de prédiction 5
p (1≤p≤q), on effectue une prédiction linéaire d'ordre Mp d'un signal d'entrée s
p-1(n). Le signal d'entrée du premier étage 5
1 est constitué par le signal audiofréquence à analyser s
0(n), tandis que le signal d'entrée d'un étage 5
p+1 (1≤p<q) est constitué par le signal s
p(n), obtenu à une étape notée 6
p en appliquant au signal d'entrée s
p-1(n) du p-ième étage 5
p un filtrage au moyen d'un filtre de fonction de transfert

où les coefficients a
i p (1≤i≤Mp) sont les coefficients de prédiction linéaire obtenus à l'étage 5
p.
[0025] Les méthodes d'analyse par prédiction linéaire pouvant être mises en oeuvre dans
les différents étages 5
1,...,5
q sont bien connues dans la technique.
[0027] Les coefficients a
ip (i=1,...,Mp) sont pris égaux aux a
ip,Mp obtenus à la dernière itération. La quantité E(Mp) est l'énergie de l'erreur résiduelle
de prédiction de l'étage p. Les coefficients r
ip, compris entre -1 et 1, sont appelés coefficients de réflexion. Ils peuvent être
représentés par les rapports logarithmiques (log-area-ratios) LAR
ip=LAR(r
ip), la fonction LAR étant définie par LAR(r)= log
10[(1-r)/(1+r)].
[0028] Dans un certain nombre d'applications, on a besoin d'opérer une quantification des
coefficients de prédiction obtenus. La quantification peut être effectuée sur les
coefficients a
ip directement, sur les coefficients de réflexion associés r
ip ou sur les rapports logarithmiques LAR
ip. Une autre possibilité est de quantifier des paramètres de raie spectrale (LSP pour
"line spectrum pairs", ou LSF pour "line spectrum frequencies"). Les Mp fréquences
de raie spectrale ω
ip(1≤i≤Mp), normalisées entre 0 et π, sont telles que les nombres complexes 1, exp(jω
2p), exp(jω
4p),...,exp(jω
Mpp), soient les racines du polynôme P
p(z)=A
p(z)-z
-(Mp+1)A
p(z
-1) et que les nombres complexes exp(jω
1p), exp(jω
3p),...,exp(jω
pMp-1), et -1 soient les racines du polynôme Q
p(z)=A
p(z)+z
-(Mp+1)A
p(z
-1). La quantification peut porter sur les fréquences normalisées ω
ip ou sur leurs cosinus.
[0029] L'analyse peut être effectuée à chaque étage de prédiction 5
p selon l'algorithme classique de Levinson-Durbin ci-dessus rappelé. D'autres algorithmes
fournissant les mêmes résultats, développés plus récemment, peuvent être utilisés
avantageusement, notamment l'algorithme de Levinson éclaté (voir "A new Efficient
Algorithm to Compute the LSP Parameters for Speech Coding", par S. Saoudi, J.M. Boucher
et A. Le Guyader, Signal Processing, Vol.28, 1992, pages 201-212), ou l'utilisation
des polynômes de Chebyshev (voir "The Computation of Line Spectrum Frequencies Using
Chebyshev Polynomials, par P. Kabal et R.P. Ramachandran, IEEE Trans. on Acoustics,
Speech, and Signal Processing, Vol. ASSP-34, n°6, pages 1419-1426, décembre 1986).
[0030] Lorsque l'analyse multi-étages représentée sur la figure 1 est réalisée pour définir
un filtre de prédiction à court terme du signal audiofréquence s
0(n), on donne à la fonction de transfert A(z) de ce filtre, la forme

[0031] On note que cette fonction de transfert obéit à la forme générale classique donnée
par la formule (1), avec M=M1+...+Mq. Toutefois, les coefficients a
i de la fonction A(z) obtenus avec le processus de prédiction multi-étages diffèrent
en général de ceux que procure le processus classique de prédiction en un seul étage.
[0032] Les ordres Mp des prédictions linéaires effectuées augmentent de préférence d'un
étage au suivant : M1<M2<...<Mq. Ainsi, l'allure de l'enveloppe spectrale du signal
analysé est modélisée relativement grossièrement au premier étage 5
1(M1=2 par exemple), et cette modélisation s'affine d'étage en étage sans perdre l'information
globale fournie par le premier étage. On évite ainsi que soient insuffisamment pris
en compte des paramètres comme la pente générale du spectre qui sont perceptuellement
importants, particulièrement dans le cas de signaux en bande élargie et/ou à forte
dynamique spectrale.
[0034] Pour la représentation et éventuellement la quantification du spectre à court terme,
il est possible d'adopter l'un des jeux de paramètres spectraux précédemment évoqués
(a
ip, r
ip, LAR
ip, ω
ip ou cos ω
ip pour 1≤i≤Mp) pour chacun des étages (1≤p≤q), ou encore les mêmes paramètres spectraux
mais pour le filtre composé calculé selon les relations (9) à (13) (a
i, r
i, LAR
i, ω
i ou cos ω
i pour 1≤i≤M). Le choix entre ces paramètres de représentation, ou d'autres encore,
dépend des contraintes de chaque application particulière.
[0035] Le graphique de la figure 2 montre une comparaison des enveloppes spectrales d'une
portion voisée de 30 ms d'un signal de parole, modélisées par un processus classique
de prédiction linéaire à un étage avec M=15 (courbe II) et par un processus selon
l'invention de prédiction linéaire en q=2 étages avec M1=2 et M2=13 (courbe III).
La fréquence d'échantillonnage Fe du signal était de 16 kHz. Le spectre du signal
(module de sa transformée de Fourier) est représenté par la courbe I. Ce spectre est
représentatif des signaux audiofréquence qui ont, en moyenne, plus d'énergie aux basses
fréquences qu'aux hautes fréquences. La dynamique spectrale est parfois supérieure
à celle de la figure 2 (60 dB). Les courbes (II) et (III) correspondent aux enveloppes
spectrales modélisées | 1/A(e
2jπf/Fe)| . On voit que le procédé d'analyse selon l'invention améliore sensiblement la modélisation
du spectre, particulièrement aux hautes fréquences (f>4 kHz). La pente générale du
spectre et ses formants en haute fréquence sont mieux respectés par le processus d'analyse
en plusieurs étages.
[0036] L'invention est décrite ci-après dans son application à un codeur de parole de type
CELP.
[0037] Le processus de synthèse de parole mis en oeuvre dans un codeur et un décodeur CELP
est illustré sur la figure 3. Un générateur d'excitation 10 délivre un code d'excitation
c
k appartenant à un répertoire prédéterminé en réponse à un index k. Un amplificateur
12 multiplie ce code d'excitation par un gain d'excitation β, et le signal résultant
est soumis à un filtre 14 de synthèse à long terme. Le signal de sortie u du filtre
14 est à son tour soumis à un filtre 16 de synthèse à court terme, dont la sortie
s constitue ce qu'on considère ici comme le signal de parole synthétique. Ce signal
synthétique est appliqué à un post-filtre 17 destiné à améliorer la qualité subjective
de la parole reconstruite. Les techniques de post-filtrage sont bien connues dans
le domaine du codage de parole (voir J.H. Chen et A. Gersho : "Adaptive postfiltering
for quality enhancement of coded speech", IEEE Trans. on Speech and Audio Processing,
Vol. 3-1, pages 59-71, janvier 1995). Dans l'exemple représenté, les coefficients
du post-filtre 17 sont obtenus à partir des paramètres LPC caractérisant le filtre
de synthèse à court terme 16. On comprendra que, comme dans certains décodeurs CELP
actuels, le post-filtre 17 pourrait également comporter une composante de post-filtrage
à long terme.
[0038] Les signaux précités sont des signaux numériques représentés par exemple par des
mots de 16 bits à une cadence d'échantillonnage Fe égale par exemple à 16 kHz pour
un codeur en bande élargie (50-7000 Hz). Les filtres de synthèse 14, 16 sont en général
des filtres purement récursifs. Le filtre 14 de synthèse à long terme a typiquement
une fonction de transfert de la forme 1/B(z) avec B(z)=1-Gz
-T. Le retard T et le gain G constituent des paramètres de prédiction à long terme (LTP)
qui sont déterminés d'une manière adaptative par le codeur. Les paramètres LPC définissant
le filtre 16 de synthèse à court terme sont déterminés au codeur par un procédé d'analyse
par prédiction linéaire du signal de parole. Dans les codeurs et décodeurs CELP habituels,
la fonction de transfert du filtre 16 est généralement de la forme 1/A(z) avec A(z)
de la forme (1). La présente invention propose d'adopter une forme semblable de la
fonction de transfert, dans laquelle A(z) est décomposée selon (7) comme indiqué précédemment.
A titre d'exemple, les paramètres des différents étages peuvent être q=2, M1=2, M2=13
(M=M1+M2=15).
[0039] On désigne ici par "signal d'excitation" le signal u(n) appliqué au filtre de synthèse
à court terme 14. Ce signal d'excitation comporte une composante LTP G.u(n-T) et une
composante résiduelle, ou séquence d'innovation, βc
k(n). Dans un codeur à analyse par synthèse, les paramètres caractérisant la composante
résiduelle et, optionnellement, la composante LTP sont évalués en boucle fermée, en
utilisant un filtre de pondération perceptuelle.
[0040] La figure 4 montre le schéma d'un codeur CELP. Le signal de parole s(n) est un signal
numérique, par exemple fourni par un convertisseur analogique-numérique 20 traitant
le signal de sortie amplifié et filtré d'un microphone 22. Le signal s(n) est numérisé
en trames successives de Λ échantillons elles-mêmes divisées en sous-trames, ou trames
d'excitation, de L échantillons (par exemple Λ=160, L=32).
[0041] Les paramètres LPC, LTP et EXC (index k et gain d'excitation β) sont obtenus au niveau
du codeur par trois modules d'analyse respectifs 24, 26, 28. Ces paramètres sont ensuite
quantifiés de façon connue en vue d'une transmission numérique efficace, puis soumis
à un multiplexeur 30 qui forme le signal de sortie du codeur. Ces paramètres sont
également fournis à un module 32 de calcul d'états initiaux de certains filtres du
codeur. Ce module 32 comprend essentiellement une chaîne de décodage telle que celle
représentée sur la figure 3. Comme le décodeur, le module 32 opère sur la base des
paramètres LPC, LTP et EXC quantifiés. Si une interpolation des paramètres LPC est
effectuée au décodeur, comme il est courant, la même interpolation est effectuée par
le module 32. Le module 32 permet de connaître au niveau du codeur les états antérieurs
des filtres de synthèse 14, 16 du décodeur, déterminés en fonction des paramètres
de synthèse et d'excitation antérieurs à la sous-trame considérée.
[0042] Dans une première étape du processus de codage, le module 24 d'analyse à court terme
détermine les paramètres LPC définissant le filtre de synthèse à court terme, en analysant
les corrélations à court terme du signal de parole s(n). Cette détermination est effectuée
par exemple une fois par trame de Λ échantillons, de manière à s'adapter à l'évolution
du contenu spectral du signal de parole. Elle consiste selon l'invention à mettre
en oeuvre le procédé d'analyse illustré par la figure 1 avec s
0(n)=s(n).
[0043] L'étape suivante du codage consiste en la détermination des paramètres LTP de prédiction
à long terme. Ceux-ci sont par exemple déterminés une fois par sous-trame de L échantillons.
Un soustracteur 34 soustrait du signal de parole s(n) la réponse à un signal d'entrée
nul du filtre de synthèse à court terme 16. Cette réponse est déterminée par un filtre
36 de fonction de transfert 1/A(z) dont les coefficients sont donnés par les paramètres
LPC qui ont été déterminés par le module 24, et dont les états initiaux ŝ sont fournis
par le module 32 de façon à correspondre aux M=M1+ ...+Mq derniers échantillons du
signal synthétique. Le signal de sortie du soustracteur 34 est soumis à un filtre
38 de pondération perceptuelle dont le rôle est d'accentuer les portions du spectre
où les erreurs sont les plus perceptibles, c'est-à-dire les zones inter-formantiques.
[0044] La fonction de transfert W(z) du filtre de pondération perceptuelle 38 est de la
forme W(z)=AN(z)/AP(z) où AN(z) et AP(z) sont des fonctions de transfert d'ordre M
de type RIF (réponse impulsionnelle finie). Les coefficients respectifs b
i et c
i (1≤i≤M) des fonctions AN(z) et AP(z) sont calculés pour chaque trame par un module
39 d'évaluation de la pondération perceptuelle qui les fournit au filtre 38. Une première
possibilité est de prendre AN(z)=A(z/γ
1) et AP(z)=A(z/γ
2) avec 0≤γ
2≤γ
1≤1, ce qui revient à la forme habituelle (2) avec A(z) de la forme (7). Dans le cas
d'un signal en bande élargie avec q=2, M1=2 et M2=13, on a trouvé que le choix γ
1=0,92 et γ
2=0,6 fournissait de bons résultats.
[0045] L'invention permet toutefois, avec une surcharge de calculs très faible, d'avoir
une plus grande souplesse quant à la mise en forme du bruit de quantification, en
adoptant la forme (6) pour W(z), soit :


[0046] Dans le cas d'un signal en bande élargie avec q=2, M1=2 et M2=13, on a trouvé que
le choix γ
11=0,9, γ
21=0,65, y
12=0,95 et γ
22=0,75 fournissait de bons résultats. Le terme A
1(z/γ
11)/A
1(z/γ
21) permet de régler la pente générale du filtre 38, tandis que le terme A
2(z/γ
12)/A
2(z/γ
22) permet de régler le masquage au niveau des formants.
[0047] L'analyse LTP en boucle fermée effectuée par le module 26 consiste, de façon classique,
à sélectionner pour chaque sous-trame le retard T qui maximise la corrélation normalisée:

où x'(n) désigne le signal de sortie du filtre 38 pendant la sous-trame considérée,
et y
T(n) désigne le produit de convolution u(n-T)*h'(n). Dans l'expression ci-dessus, h'(0),
h' (1)...,h'(L-1) désigne la réponse impulsionnelle du filtre de synthèse pondéré,
de fonction de transfert W(z)/A(z). Cette réponse impulsionnelle h' est obtenue par
un module 40 de calcul de réponses impulsionnelles, en fonction des coefficients b
i et c
i fournis par le module 39 et des paramètres LPC qui ont été déterminés pour la sous-trame,
le cas échéant après quantification et interpolation. Les échantillons u(n-T) sont
les états antérieurs du filtre 14 de synthèse à long terme, fournis par le module
32. Pour les retards T inférieurs à la longueur d'une sous-trame, les échantillons
manquants u(n-T) sont obtenus par interpolation sur la base des échantillons antérieurs,
ou à partir du signal de parole. Les retards T, entiers ou fractionnaires, sont sélectionnés
dans une fenêtre déterminée. Pour réduire la plage de recherche en boucle fermée,
et donc pour réduire le nombre de convolutions y
T(n) à calculer, on peut d'abord déterminer un retard T' en boucle ouverte par exemple
une fois par trame, puis sélectionner les retards en boucle fermée pour chaque sous-trame
dans un intervalle réduit autour de T'. La recherche en boucle ouverte consiste plus
simplement à déterminer le retard T' qui maximise l'autocorrélation du signal de parole
s(n) éventuellement filtré par le filtre inverse de fonction de transfert A(z). Une
fois que le retard T a été déterminé, le gain G de prédiction à long terme est obtenu
par :

[0048] Pour rechercher l'excitation CELP relative à une sous-trame, le signal Gy
T(n), qui a été calculé par le module 26 pour le retard optimal T, est d'abord soustrait
du signal x'(n) par le soustracteur 42. Le signal résultant x(n) est soumis à un filtre
à rebours 44 qui fournit un signal D(n) donné par :

où h(0), h(1),..., h(L-1) désigne la réponse impulsionnelle du filtre composé
des filtres de synthèse et du filtre de pondération perceptuelle, calculée par le
module 40. En d'autres termes, le filtre composé a pour fonction de transfert W(z)/[A(z).B(z)].
En notation matricielle, on a donc :

avec
et
[0049] Le vecteur D constitue un vecteur-cible pour le module 28 de recherche de l'excitation.
Ce module 28 détermine un mot de code du répertoire qui maximise la corrélation normalisée
Pk 2/αk 2 dans laquelle :


[0050] L'indice k optimal ayant été déterminé, le gain d'excitation β est pris égal à β
= P
k/α
k 2.
[0051] En référence à la figure 3, le décodeur CELP comprend un démultiplexeur 8 recevant
le flux binaire issu du codeur. Les valeurs quantifiées des paramètres d'excitation
EXC et des paramètres de synthèse LTP et LPC sont fournies au générateur 10, à l'amplificateur
12 et aux filtres 14, 16 pour reconstituer le signal synthétique ŝ, qui est soumis
au post-filtre 17 puis converti en analogique par le convertisseur 18 avant d'être
amplifié puis appliqué à un haut-parleur 19 pour restituer la parole originale.
[0052] Dans le cas du décodeur de la figure 3, les paramètres LPC sont par exemple constitués
par des index de quantification des coefficients de réflexion
ri p (également appelés coefficients de corrélation partielle ou PARCOR) relatifs aux
différents étages de prédiction linéaire. Un module 15 récupère les valeurs quantifiées
des
ri p à partir des index de quantification, et les convertit pour fournir les q jeux de
coefficients de prédiction linéaire. Cette conversion est par exemple effectuée par
la même méthode récursive que dans l'algorithme de Levinson-Durbin.
[0053] Les jeux de coefficients
ai p sont fournis au filtre 16 de synthèse à court terme constitué par une succession
de q filtres/étages de fonctions de transfert 1/A
1(z),..., 1/A
q(z) données par la relation (4). Le filtre 16 pourrait également être en un seul étage
de fonction de transfert 1/A(z) donnée par la relation (1) dans laquelle les coefficients
a
i ont été calculés selon les relations (9) à (13).
[0054] Les jeux de coefficients
ai p sont également fournis au post-filtre 17 qui, dans l'exemple considéré, a une fonction
de transfert de la forme

où APN(z) et APP(z) sont des fonctions de transfert d'ordre M de type RIF, G
P est un facteur de gain constant, µ est une constante positive et r
1 désigne le premier coefficient de réflexion. Le coefficient de réflexion r
1 peut être celui associé aux coefficients a
i du filtre de synthèse composé, qu'il est alors nécessaire de calculer. On peut également
prendre pour r
1 le premier coefficient de réflexion du premier étage de prédiction (
r1=
r1 1) moyennant un éventuel ajustement de la constante µ. Pour le terme APN(z)/APP(z),
une première possibilité est de prendre APN(z)=A(z/β
1) et APP(z)=A(z/β
2) avec 0≤β
1≤β
2≤1, ce qui revient à la forme habituelle (3) avec A(z) de la forme (7).
[0055] Comme dans le cas du filtre de pondération perceptuelle du codeur, l'invention permet
d'adopter des coefficients β
1 et β
2 différents d'un étage au suivant (formule (8)), soit :


[0056] Dans le cas d'un signal en bande élargie avec q=2, M1=2 et M2=13, on a trouvé que
le choix β
1 1=0,7,
β2 1=0,9, β
1 2=0,95 et
β2 2=0,97 fournissait de bons résultats.
[0057] L'invention a été décrite ci-dessus dans son application à un codeur prédictif à
adaptation "forward", c'est-à-dire dans lequel le signal audiofréquence faisant l'objet
de l'analyse par prédiction linéaire est le signal d'entrée du codeur. L'invention
s'applique également à des codeurs/décodeurs prédictifs à adaptation "backward", dans
lesquels le signal synthétique fait l'objet de l'analyse par prédiction linéaire au
codeur et au décodeur (voir J.H. Chen et al: "A Low-Delay CELP Coder for the CCITT
16 kbit/s Speech Coding Standard", IEEE J.SAC, Vol.10, n°5, pages 830-848, juin 1992).
Les figures 5 et 6 montrent respectivement un décodeur CELP et un codeur CELP à adaptation
"backward" mettant en oeuvre la présente invention. Des références numériques identiques
à celles des figures 3 et 4 ont été utilisées pour désigner des éléments analogues.
[0058] Le décodeur à adaptation "backward" reçoit seulement les valeurs de quantification
des paramètres définissant le signal d'excitation u(n) à appliquer au filtre de synthèse
à court terme 16. Dans l'exemple considéré, ces paramètres sont l'index k et le gain
associé β ainsi que les paramètres LTP. Le signal synthétique ŝ(n) est traité par
un module 124 d'analyse par prédiction linéaire multi-étages identique au module 24
de la figure 3. Le module 124 fournit les paramètres LPC au filtre 16 pour une ou
plusieurs trames suivantes du signal d'excitation, et au post-filtre 17 dont les coefficients
sont obtenus comme décrit précédemment.
[0059] Le codeur correspondant, représenté sur la figure 6, effectue l'analyse par prédiction
linéaire multi-étages sur le signal synthétique généré localement et non sur le signal
audio s(n). Il comprend ainsi un décodeur local 132 consistant essentiellement en
les éléments notés 10, 12, 14, 16 et 124 du décodeur de la figure 5. Outre les échantillons
u du dictionnaire adaptatif et les états initiaux ŝ du filtre 36, le décodeur local
132 fournit les paramètres LPC obtenus par analyse du signal synthétique, qui sont
utilisés par le module 39 d'évaluation de la pondération perceptuelle et le module
40 de calcul des réponses impulsionnelles h et h'. Pour le reste, le fonctionnement
du codeur est identique à celui du codeur décrit en référence à la figure 4, sauf
que le module d'analyse LPC 24 n'est plus nécessaire. Seuls les paramètres EXC et
LTP sont envoyés vers le décodeur.
[0060] Les figures 7 et 8 sont des schémas synoptiques d'un décodeur CELP et d'un codeur
CELP à adaptation mixte. Les coefficients de prédiction linéaire du ou des premiers
étages résultent d'une analyse "forward" du signal audiofréquence effectuée par le
codeur, tandis que les coefficients de prédiction linéaire du ou des derniers étages
résultent d'une analyse "backward" du signal synthétique effectuée par le décodeur
(et par un décodeur local prévu dans le codeur). Des références numériques identiques
à celles des figures 3 à 6 ont été utilisée pour désigner des éléments analogues.
[0061] Le décodeur mixte illustré sur la figure 7 reçoit les valeurs de quantification des
paramètres EXC, LTP définissant le signal d'excitation u(n) à appliquer au filtre
de synthèse à court terme 16, et les valeurs de quantification des paramètres LPC/F
déterminés par l'analyse "forward" effectuée par le codeur. Ces paramètres LPC/F représentent
q
F jeux de coefficients de prédiction linéaire a
1 F,p,..., a
MFp F,p pour 1≤p≤q
F, et définissent une première composante 1/A
F(z) de la fonction de transfert 1/A(z) du filtre 16 :

[0062] Pour l'obtention de ces paramètres LPC/F, le codeur mixte représenté sur la figure
8 comporte un module 224/F qui analyse le signal audiofréquence à coder s(n) de la
manière décrite en référence à la figure 1 si q
F>1, ou en un seul étage si q
F=1.
[0063] L'autre composante 1/A
B(z) du filtre de synthèse à court terme 16 de fonction de transfert 1/A(z)=1/[A
F(z).A
B(z)] est donnée par

[0064] Pour déterminer les coefficients a
i B,P, le décodeur mixte comporte un filtre inverse 200 de fonction de transfert A
F(z) qui filtre le signal synthétique

(n) produit par le filtre de synthèse à court terme 16 pour produire un signal synthétique
filtré
0(n). Un module 224/B effectue l'analyse par prédiction linéaire de ce signal
0(n) de la manière décrite en référence à la figure 1 si q
B>1, ou en un seul étage si q
B=1. Les coefficients LPC/B ainsi obtenus sont fournis au filtre de synthèse 16 pour
définir sa seconde composante pour la trame suivante. Ils sont également fournis,
de même que les coefficients LPC/F au post-filtre 17, dont les composantes APN(z)
et APP(z) sont soit de la forme APN(z)=A(z/β
1), APP(z)=A(z/β
2), soit de la forme :


les paires de coefficient β
1 F,p, β
2 F,p et β
1 B,p, β
2 B,P étant optimisables séparément avec
0≤β
1 F,p≤β
2 F,p≤
1 et 0≤β
1 B,p≤β
2 B,p≤
1.
[0065] Le décodeur local 232 prévu dans le codeur mixte consiste essentiellement en les
éléments notés 10, 12, 14, 16, 200 et 224/B du décodeur de la figure 7. Outre les
échantillons u du dictionnaire adaptatif et les états initiaux ŝ du filtre 36, le
décodeur local 232 fournit les paramètres LPC/B qui sont utilisés, avec les paramètres
LPC/F fournis par le module d'analyse 224/F, par le module 39 d'évaluation de la pondération
perceptuelle et le module 40 de calcul des réponses impulsionnelles h et h'.
[0066] La fonction de transfert du filtre de pondération perceptuelle 38 évaluée par le
module 39 est soit de la forme W(z)=A(z/γ
1)/A(z/γ
2), soit de la forme

les paires de coefficients γ
1 F,p, γ
2 F,p, et γ
1 B,p, γ
2 B,p étant optimisables séparément avec 0≤γ
2 F,p≤γ
2 F,p≤1 et 0≤γ
2 B,p≤γ
1 B,p≤1.
[0067] Pour le reste, le fonctionnement du codeur mixte est identique à celui du codeur
décrit en référence à la figure 4. Seuls les paramètres EXC, LTP et LPC/F sont envoyés
vers le décodeur.
1. Procédé d'analyse par prédiction linéaire d'un signal audiofréquence (s
0(n)), pour déterminer des paramètres spectraux dépendant d'un spectre à court terme
du signal audiofréquence, le procédé comprenant q étages de prédiction successifs
(5
p), q étant un entier supérieur à 1, caractérisé en ce qu'à chaque étage de prédiction
p (1≤p≤q), on détermine des paramètres représentant un nombre Mp, prédéfini pour chaque
étage p, de coefficients
a1 p,..., aMp p de prédiction linéaire d'un signal d'entrée dudit étage, le signal audiofréquence
à analyser constituant le signal d'entrée (s
0(n)) du premier étage, et le signal d'entrée (s
p(n)) d'un étage p+1 étant constitué par le signal d'entrée (s
p-1(n)) de l'étage p filtré par un filtre de fonction de transfert
2. Procédé d'analyse selon la revendication 1, caractérisé en ce que le nombre Mp de
coefficients de prédiction linéaire augmente d'un étage au suivant.
3. Procédé de codage d'un signal audiofréquence, comprenant les étapes suivantes :
- analyse par prédiction linéaire du signal audiofréquence (s(n)) numérisé en trames
successives pour déterminer des paramètres (LPC) définissant un filtre de synthèse
à court terme (16) ;
- détermination de paramètres d'excitation (k,β,LTP) définissant un signal d'excitation
(u(n)) à appliquer au filtre de synthèse à court terme (16) pour produire un signal
synthétique (ŝ(n)) représentatif du signal audiofréquence ; et
- production de valeurs de quantification des paramètres définissant le filtre de
synthèse à court terme et des paramètres d'excitation,
caractérisé en ce que l'analyse par prédiction linéaire est un processus à q étages
successifs (5
p), q étant un entier supérieur à 1, ledit processus comportant, à chaque étage de
prédiction p (1≤p≤q), la détermination de paramètres représentant un nombre Mp, prédéfini
pour chaque étage p, de coefficients
a1 p,...,
aMp p de prédiction linéaire d'un signal d'entrée dudit étage, le signal audiofréquence
à coder (s(n)) constituant le signal d'entrée (s
0(n)) du premier étage, et le signal d'entrée (s
p(n)) d'un étage p+1 étant constitué par le signal d'entrée (s
p-1(n)) de l'étage p filtré par un filtre de fonction de transfert

le filtre de synthèse à court terme (16) ayant une fonction de transfert de la forme
1/A(z) avec
4. Procédé de codage selon la revendication 3, caractérisé en ce que le nombre Mp de
coefficients de prédiction linéaire augmente d'un étage au suivant.
5. Procédé de codage selon la revendication 3 ou 4, caractérisé en ce que certains au
moins des paramètres d'excitation sont déterminés en minimisant l'énergie d'un signal
d'erreur résultant du filtrage de la différence entre le signal audiofréquence (s(n))
et le signal synthétique (ŝ(n)) par au moins un filtre de pondération perceptuelle
(38) dont la fonction de transfert est de la forme W(z)=A(z/γ1)/A(z/γ2) où γ1 et γ2 désignent des coefficients d'expansion spectrale tels que 0≤γ2≤γ1≤ 1.
6. Procédé de codage selon la revendication 3 ou 4, caractérisé en ce que certains au
moins des paramètres d'excitation sont déterminés en minimisant l'énergie d'un signal
d'erreur résultant du filtrage de la différence entre le signal audiofréquence (s(n))
et le signal synthétique (ŝ(n)) par au moins un filtre de pondération perceptuelle
(38) dont la fonction de transfert est de la forme

où γ
1 p, γ
2 p désignent des paires de coefficients d'expansion spectrale tels que
0≤ γ
2 p≤ γ
1 p≤
1 pour 1≤p≤q.
7. Procédé de décodage d'un flux binaire pour construire un signal audiofréquence codé
par ledit flux binaire, caractérisé en ce que :
- on reçoit des valeurs de quantification de paramètres (LPC) définissant un filtre
de synthèse à court terme (16) et de paramètres d'excitation (k,β,LTP), les paramètres
définissant le filtre de synthèse représentant un nombre q plus grand que 1 de jeux
de coefficients de prédiction linéaire (ai p), chaque jeu p comportant un nombre prédéfini Mp de coefficients ;
- on produit un signal d'excitation (u(n)) sur la base des valeurs de quantification
des paramètres d'excitation ; et
- on produit un signal audiofréquence synthétique (ŝ(n)) en filtrant le signal d'excitation
par un filtre de synthèse (16) ayant une fonction de transfert de la forme 1/A(z)
avec

où les coefficients a1 p,...,aMp p correspondent au p-ième jeu de coefficients de prédiction linéaire pour 1≤p≤q.
8. Procédé de décodage selon la revendication 7, caractérisé en ce que ledit signal audiofréquence
synthétique (ŝ(n)) est appliqué à un post-filtre (17) dont la fonction de transfert
(HPF(z)) comporte un terme de la forme A(z/β1)/A(z/β2), où β1 et β2 désignent des coefficients tels que 0≤β1≤β2≤1.
9. Procédé de décodage selon la revendication 7, caractérisé en ce que ledit signal audiofréquence
synthétique (ŝ(n)) est appliqué à un post-filtre (17) dont la fonction de transfert
(H
PF(z)) comporte un terme de la forme

où β
1 p, β
2 p désignent des paires de coefficients tels que
0≤β
1 p≤β
2 p≤
1 pour 1≤p≤q, et A
p(z) représente, pour le p-ième jeu de coefficients de prédiction linéaire, la fonction
10. Procédé de codage d'un premier signal audiofréquence numérisé en trames successives,
comprenant les étapes suivantes :
- analyse par prédiction linéaire d'un second signal audiofréquence (ŝ(n)) pour déterminer
des paramètres (LPC) définissant un filtre de synthèse à court terme (16) ;
- détermination de paramètres d'excitation (k,β,LTP) définissant un signal d'excitation
(u(n)) à appliquer au filtre de synthèse à court terme (16) pour produire un signal
synthétique (ŝ(n)) représentatif du premier signal audiofréquence, ce signal synthétique
constituant ledit second signal audiofréquence pour au moins une trame suivante ;
et
- production de valeurs de quantification des paramètres d'excitation,
caractérisé en ce que l'analyse par prédiction linéaire est un processus à q étages
successifs (5
p), q étant un entier supérieur à 1, ledit processus comportant, à chaque étage de
prédiction p (1≤p≤q), la détermination de paramètres représentant un nombre Mp, prédéfini
pour chaque étage p, de coefficients
a1 p,...,aMp P de prédiction linéaire d'un signal d'entrée dudit étage, le second signal audiofréquence
(ŝ(n)) constituant le signal d'entrée (s
0(n)) du premier étage, et le signal d'entrée (s
p(n)) d'un étage p+1 étant constitué par le signal d'entrée (s
p-1(n)) de l'étage p filtré par un filtre de fonction de transfert

le filtre de synthèse à court terme (16) ayant une fonction de transfert de la forme
1/A(z) avec
11. Procédé de codage selon la revendication 10, caractérisé en ce que le nombre Mp de
coefficients de prédiction linéaire augmente d'un étage au suivant.
12. Procédé de codage selon la revendication 10 ou 11, caractérisé en ce que certains
au moins des paramètres d'excitation sont déterminés en minimisant l'énergie d'un
signal d'erreur résultant du filtrage de la différence entre le premier signal audiofréquence
(s(n)) et le signal synthétique (ŝ(n)) par au moins un filtre de pondération perceptuelle
(38) dont la fonction de transfert est de la forme W(z)=A(z/γ1)/A(z/γ2) où γ1 et γ2 désignent des coefficients d'expansion spectrale tels que 0≤γ2≤γ1≤ 1.
13. Procédé de codage selon la revendication 10 ou 11, caractérisé en ce que certains
au moins des paramètres d'excitation sont déterminés en minimisant l'énergie d'un
signal d'erreur résultant du filtrage de la différence entre le premier signal audiofréquence
(s(n)) et le signal synthétique (ŝ(n)) par au moins un filtre de pondération perceptuelle
(38) dont la fonction de transfert est de la forme

où γ
1 p, γ
2 p désignent des paires de coefficients d'expansion spectrale tels que
0≤ γ
2 p ≤ γ
1 p ≤
1 pour 1≤p≤q.
14. Procédé de décodage d'un flux binaire pour construire en trames successives un signal
audiofréquence codé par ledit flux binaire, caractérisé en ce que :
- on reçoit des valeurs de quantification de paramètres d'excitation (k,β,LTP) ;
- on produit un signal d'excitation (u(n)) sur la base des valeurs de quantification
des paramètres d'excitation ;
- on produit un signal audiofréquence synthétique (ŝ(n)) en filtrant le signal d'excitation
par un filtre de synthèse à court terme (16) ;
- on effectue une analyse par prédiction linéaire du signal synthétique (ŝ(n)) pour
obtenir des coefficients du filtre de synthèse à court terme (16) pour au moins une
trame suivante,
et en ce que l'analyse par prédiction linéaire est un processus à q étages successifs
(5
p), q étant un entier supérieur à 1, ledit processus comportant, à chaque étage de
prédiction p (1≤p≤q), la détermination de paramètres représentant un nombre Mp, prédéfini
pour chaque étage p, de coefficients a
1 p,...,a
Mp p de prédiction linéaire d'un signal d'entrée dudit étage, le signal synthétique (ŝ(n))
constituant le signal d'entrée (s
0(n)) du premier étage, et le signal d'entrée (s
p(n)) d'un étage p+1 étant constitué par le signal d'entrée (s
p-1(n)) de l'étage p filtré par un filtre de fonction de transfert

le filtre de synthèse à court terme (16) ayant une fonction de transfert de la forme
1/A(z) avec
15. Procédé de décodage selon la revendication 14, caractérisé en ce que ledit signal
audiofréquence synthétique (ŝ(n)) est appliqué à un post-filtre (17) dont la fonction
de transfert (HPF(z)) comporte un terme de la forme A(z/β1)/A(z/β2), où β1 et β2 désignent des coefficients tels que 0≤β1≤β2≤1.
16. Procédé de décodage selon la revendication 14, caractérisé en ce que ledit signal
audiofréquence synthétique (ŝ(n)) est appliqué à un post-filtre (17) dont la fonction
de transfert (H
PF(z)) comporte un terme de la forme

où β
1 p, β
2 p désignent des paires de coefficients tels que 0≤ β
1 p ≤ β
2 p≤
1 pour 1≤p≤q.
17. Procédé de codage d'un premier signal audiofréquence numérisé en trames successives,
caractérisé en ce qu'il comprend les étapes suivantes :
- analyse par prédiction linéaire du premier signal audiofréquence (s(n)) pour déterminer
des paramètres (LPC/F) définissant une première composante d'un filtre de synthèse
à court terme (16) ;
- détermination de paramètres d'excitation (k,β,LTP) définissant un signal d'excitation
(u(n)) à appliquer au filtre de synthèse à court terme (16) pour produire un signal
synthétique (ŝ(n)) représentatif du premier signal audiofréquence ;
- production de valeurs de quantification des paramètres définissant la première composante
du filtre de synthèse à court terme et des paramètres d'excitation ;
- filtrage du signal synthétique (ŝ(n)) par un filtre de fonction de transfert correspondant
à l'inverse de la fonction de transfert de la première composante du filtre de synthèse
à court terme ; et
- analyse par prédiction linéaire du signal synthétique filtré ((ŝ0(n)) pour obtenir des coefficients d'une seconde composante du filtre de synthèse
à court terme pour au moins une trame suivante,
en ce que l'analyse par prédiction linéaire du premier signal audiofréquence (s(n))
est un processus à q
F étages successifs (5
p), q
F étant un entier au moins égal à 1, ledit processus à q
F étages comportant, à chaque étage de prédiction p (1≤p≤q
F), la détermination de paramètres représentant un nombre MFp, prédéfini pour chaque
étage p, de coefficients
a1 F,p,...,
aMFp F,p de prédiction linéaire d'un signal d'entrée dudit étage, le premier signal audiofréquence
(s(n)) constituant le signal d'entrée (s
0(n)) du premier étage du processus à q
F étages, et le signal d'entrée (s
p(n)) d'un étage p+1 du processus à q
F étages étant constitué par le signal d'entrée (s
p-1(n)) de l'étage p du processus à q
F étages filtré par un filtre de fonction de transfert

la première composante du filtre de synthèse à court terme (16) ayant une fonction
de transfert de la forme 1/A
F(z) avec

et en ce que l'analyse par prédiction linéaire du signal synthétique filtré est
un processus à q
B étages successifs (5
p), q
B étant un entier au moins égal à 1, ledit processus à q
B étages comportant, à chaque étage de prédiction p (1≤p≤q
B), la détermination de paramètres représentant un nombre MBp, prédéfini pour chaque
étage p, de coefficients
a1 B,p,...,
aMBp B,p de prédiction linéaire d'un signal d'entrée dudit étage, le signal synthétique filtré
(ŝ
0(n)) constituant le signal d'entrée (s
0(n)) du premier étage du processus à q
B étages, et le signal d'entrée (s
p(n)) d'un étage p+1 du processus à q
B étages étant constitué par le signal d'entrée (s
p-1(n)) de l'étage p du processus à q
B étages filtré par un filtre de fonction de transfert

la seconde composante du filtre de synthèse à court terme (16) ayant une fonction
de transfert de la forme 1/A
B(z) avec

et le filtre de synthèse à court terme (16) ayant une fonction de transfert de la
forme 1/A(z) avec A(z)=A
F(z).A
B(z).
18. Procédé de codage selon la revendication 17, caractérisé en ce que certains au moins
des paramètres d'excitation sont déterminés en minimisant l'énergie d'un signal d'erreur
résultant du filtrage de la différence entre le premier signal audiofréquence (s(n))
et le signal synthétique (ŝ(n)) par au moins un filtre de pondération perceptuelle
(38) dont la fonction de transfert est de la forme W(z)=A(z/γ1)/A(z/γ2) où γ1 et γ2 désignent des coefficients d'expansion spectrale tels que 0≤γ2≤γ1≤ 1.
19. Procédé de codage selon la revendication 17, caractérisé en ce que certains au moins
des paramètres d'excitation sont déterminés en minimisant l'énergie d'un signal d'erreur
résultant du filtrage de la différence entre le premier signal audiofréquence (s(n))
et le signal synthétique (ŝ(n)) par au moins un filtre de pondération perceptuelle
(38) dont la fonction de transfert est de la forme

où γ
1 F,p, γ
2 F,p désignent des paires de coefficients d'expansion spectrale tels que
0≤ γ
2 F,p≤ γ
1 F,p≤
1 pour 1≤p≤q
F, et γ
1 B,p, γ
2 B,p désignent des paires de coefficients d'expansion spectrale tels que
0≤ γ
2 B,p≤ γ
1 B,p≤
1 pour 1≤p≤q
B.
20. Procédé de décodage d'un flux binaire pour construire en trames successives un signal
audiofréquence codé par ledit flux binaire, caractérisé en ce que :
- on reçoit des valeurs de quantification de paramètres (LPC/F) définissant une première
composante d'un filtre de synthèse à court terme (16) et de paramètres d'excitation
(k,β,LTP), les paramètres définissant la première composante du filtre de synthèse
à court terme représentant un nombre qF au moins égal à 1 de jeux de coefficients de prédiction linéaire a1 F,p,...,aMFp F,p pour 1≤p≤qF, chaque jeu p comportant un nombre prédéfini MFp de coefficients, la première composante
du filtre de synthèse à court terme (16) ayant une fonction de transfert de la forme
1/AF(z) avec

- on produit un signal d'excitation (u(n)) sur la base des valeurs de quantification
des paramètres d'excitation ;
- on produit un signal audiofréquence synthétique (ŝ(n)) en filtrant le signal d'excitation
par un filtre de synthèse à court terme (16) de fonction de transfert 1/A(z) avec
A(z)=AF(z).AB(z), 1/AB(z) représentant la fonction de transfert d'une seconde composante du filtre de synthèse
à court terme (16) ;
- on filtre le signal synthetique (ŝ(n)) par un filtre de fonction de transfert AF(z) ; et
- on effectue une analyse par prédiction linéaire du signal synthétique filtré (ŝ0(n)) pour obtenir des coefficients de la seconde composante du filtre de synthèse
à court terme (16) pour au moins une trame suivante,
et en ce que l'analyse par prédiction linéaire du signal synthétique filtré est
un processus à q
B étages successifs (5
p), q
B étant un entier au moins égal à 1, ledit processus comportant, à chaque étage de
prédiction p (1≤p≤q
B), la détermination de paramètres représentant un nombre MBp, prédéfini pour chaque
étage p, de coefficients a
1B,p,...,a
MBp B,p de prédiction linéaire d'un signal d'entrée dudit étage, le signal synthétique filtré
(ŝ
0(n)) constituant le signal d'entrée (s
0(n)) du premier étage, et le signal d'entrée (s
p(n)) d'un étage p+1 étant constitué par le signal d'entrée (s
p-1(n)) de l'étage p filtré par un filtre de fonction de transfert

la seconde composante du filtre de synthèse à court terme (16) ayant une fonction
de transfert de la forme 1/A
B(z) avec
21. Procédé de décodage selon la revendication 20, caractérisé en ce que ledit signal
audiofréquence synthétique (ŝ(n)) est appliqué à un post-filtre (17) dont la fonction
de transfert (HPF(z)) comporte un terme de la forme A(z/β1)/A(z/β2), où β1 et β2 désignent des coefficients tels que 0≤β1≤β2≤1.
22. Procédé de décodage selon la revendication 20, caractérisé en ce que ledit signal
audiofréquence synthétique (ŝ(n)) est appliqué à un post-filtre (17) dont la fonction
de transfert (H
PF(z)) comporte un terme de la forme

où β
1 F,p, β
2 F,p désignent des paires de coefficients tels que
0≤β
1 F,p≤β
2 F,p≤
1 pour 1≤p≤q
F, et β
1 B,p, β
2 B,p désignent des paires de coefficients tels que
0≤β
1 B,p≤β
2 B,p≤1 pour 1≤p≤q
B.