[0001] La présente invention concerne un procédé de discrimination de la parole en présence
de bruits ambiants et un vocodeur à faible débit pour la mise en oeuvre du procédé.
[0002] La qualité des vocodeurs de type LPC10 (prédiction linéaire d'ordre 10) est souvent
jugée insuffisante, notamment en termes d'agrément d'écoute, de fidélité au locuteur,
et de résistance aux bruits ambiants notamment aux bruits ambiants structurés de nature
périodique ou quasi-périodique.
[0003] Le principe même de ce type de vocodeur conduit à une fidélité limitée car il part
de l'hypothèse que le signal à coder est exclusivement de la parole et, qui plus est,
que cette parole peut être représentée sous une forme simple telle que du bruit filtré,
ou une excitation périodique elle aussi filtrée.
[0004] Si le signal à coder ne répond pas à cette définition, par exemple un signal semi-périodique,
ou un mélange de plusieurs signaux, la qualité de reproduction est médiocre.
[0005] Pour améliorer la qualité de reproduction de la parole, différentes méthodes connues,
consistent à utiliser, par exemple, un vocodeur haut débit de 4800 bits/seconde et
à réduire ce débit à 2400 bits/seconde. Aucune hypothèse n'est faite sur la nature
du signal à coder, le but de ces méthodes consistant uniquement à reproduire le plus
fidèlement possible la forme d'onde du signal d'entrée.
[0006] Parmi ces méthodes, on peut citer la méthode dite des ondelettes qui est une représentation
du signal par une combinaison de formes d'onde bien localisées en temps et en fréquence,
l'analyse harmonique qui est une représentation du signal par une combinaison de sinusoïdes
harmoniques les unes des autres et, le CELP abréviation anglo-saxonne pour Code Excited
Linear Prediction ou les formes d'ondes utilisées à l'entrée du filtre de synthèse
sont pré-définies, et stockées dans un "dictionnaire".
[0007] L'expérience montre que, si l'on cherche à réduire par trop le débit des vocodeurs
qui traitent la forme d'onde du signal, la qualité de reproduction s'en ressent beaucoup.
Les dégradations de la qualité se traduisent, par exemple, par une certaine raucité
de la parole synthétique, et/ou un bruit de fond de coloration variable au cours du
temps, et /ou une grande difficulté à reproduire les sons bruités ou au contraire
périodiques.
[0008] Le but de l'invention est de pallier les inconvénients précités.
[0009] A cet effet, l'invention a pour objet un procédé de discrimination de la parole en
présence de bruits ambiants pour vocodeur à faible débit du type comportant une excitation
périodique, une excitation apériodique et un filtre d'analyse d'ordre P, caractérisé
en ce qu'il consiste pour analyser un signal S
n composé de la somme d'un nombre K déterminé d'excitations périodiques et d'une excitation
apériodique, à calculer l'autocorrélation globale r
m du signal S
n, à calculer les sommes partielles t
m de l'autocorrélation à court terme s
m corrélée avec l'autocorrélation globale r
m, à initialiser un compteur k et tant que le compteur k n'atteint pas la valeur maximale
K correspondant au nombre maximal d'excitations périodiques, pour chaque incrémentation
du compteur k, après avoir corrigé le calcul des sommes partielles t
m, à calculer les valeurs du pitch M
k, du gain β
k et de la pente du gain α
k de chaque excitation périodique, et à déterminer le niveau de l'excitation apériodique
β₀ en fonction de l'autocorrélation globale r
m en début d'analyse et de l'autocorrélation r
m en fin d'analyse.
[0010] Le procédé selon l'invention a pour principal avantage qu'il permet de reproduire
une parole de meilleure qualité qu'avec un vocodeur standard à 2400 bits/seconde et
de mieux résister aux bruits ambiants et notamment aux bruits ambiants structurés.
Il a également pour avantage d'utiliser un algorithme de complexité raisonnable limitant
ainsi la charge de calcul.
[0011] D'autres caractéristiques et avantages de l'invention apparaîtront dans la description
qui suit faite en regard des dessins annexés qui représentent :
- la figure 1, les différentes étapes d'un premier mode de réalisation du procédé selon
l'invention mises sous la forme d'un organigramme ;
- la figure 2, les diagrammes représentant l'évolution de l'autocorrélation ;
- la figure 3, les différentes étapes d'un second mode de réalisation du procédé mises
sous la forme d'un organigramme ;
- la figure 4, un mode de réalisation d'un vocodeur pour la mise en oeuvre du procédé
selon l'invention.
[0012] Le procédé selon l'invention repose sur le principe qu'il n'est pas utile de reproduire
la forme d'onde du signal d'entrée et qu'il faut plutôt reproduire du mieux possible
l'impression auditive qu'aurait produit le signal original, ce qui n'est pas obligatoirement
la même chose: un vocodeur standard à 2400 bits/seconde pouvant restituer un signal
de parole d'excellente qualité avec certains locuteurs et dans de bonnes conditions
de prise de son, bien que la forme d'onde produite à la synthèse n'a que peu de choses
à voir avec la forme d'onde originale.
[0013] Le débit alloué au filtre de prédiction n'étant pas suffisant pour représenter le
signal avec une fidélité suffisante, il faut le modéliser. Pour cela, la parole synthétique
est considérée donner une impression acoustique voisine de celle procurée par le signal
de parole original. La parole synthétique ainsi considérée est constituée de la superposition
de formes d'ondes particulièrement simples qui peuvent être définies avec un faible
débit binaire. Pour définir ces formes d'ondes, le vocodeur standard à 2400 bits/seconde
est supposé donner une qualité satisfaisante dans des cas simples, par exemple, dans
des cas où le signal à coder peut être représenté comme la superposition d'un bruit
de fond continu, et d'un ou plusieurs signaux périodiques ou quasi-périodiques ; la
même hypothèse est faite dans les vocodeurs harmoniques.
[0014] D'autre part, dans le cas où apparaît un transitoire brutal tel qu'un bruit extérieur,
la fidélité de reproduction du signal d'entrée n'est vraisemblablement pas indispensable.
Le transitoire est alors considéré comme un son parasite et il est éliminé par des
systèmes d'antiparasitage connus améliorant ainsi la qualité de restitution du signal
d'entrée.
[0015] De plus, le débit accordé au filtre de prédiction d'un vocodeur standard peut être
réduit suivant des techniques connues, utilisées dans les vocodeurs à 800 bits/seconde,
permettant ainsi de libérer des bits alloués au filtre de prédiction trop richement
décrit.
[0016] Les bits ainsi récupérés sont utilisés pour définir les K excitations périodiques
ayant chacune une période ou "pitch" déterminée et un gain modulable dans le temps.
[0017] Un premier mode de réalisation du procédé selon l'invention consiste à déterminer
le signal d'excitation représentatif de la parole extraite des bruits ambiants, en
donnant la période du "pitch" et le niveau du signal à partir de la somme des K signaux
périodiques et d'un signal apériodique.
[0018] Dans un vocodeur standard de 2400 bits/seconde, il est obligatoire de déterminer
un seul pitch sans erreur et un indicateur de voisement également sans erreur. Avantageusement,
selon l'invention, si le premier générateur périodique, matérialisant l'excitation,
ne dispose pas du "vrai" pitch, c'est-à-dire du pitch du signal de parole à extraire,
il reste encore K-1 générateurs pour le trouver. De même, comme il n'y a pas de décision
de voisement mais plutôt une répartition des gains entre une source de bruit et K
sources périodiques, il n'y a pas de risque d'erreur de voisement.
[0019] Le procédé selon l'invention ne s'intéresse pas à la forme d'onde vraie, ou à un
résiduel, mais à sa composition en termes de périodes ou "pitch", niveaux relatifs,
et proportion de bruit. La détermination de l'excitation se fait donc à partir d'un
signal où les informations de phase n'apparaissent pas. Le procédé est basé sur un
calcul d'autocorrélation dont le résultat donne une grandeur représentative de ce
signal moyennant certaines précautions pour détecter les composantes périodiques et
les variations de gain.
[0020] La figure 1 représente l'organigramme des étapes du procédé selon l'invention.
[0021] La première étape 1 calcule l'autocorrélation globale r
m du signal constitué de la somme des K + 1 signaux.
[0022] Si P représente l'ordre du filtre de prédiction à court terme, et M
max la valeur maximale de pitch considérée en nombre d'échantillons, l'autocorrélation
globale r
m est calculée pour m = -P à m = M
max+P, suivant la formule :
[0023] Dans l'expression (1) S
n et S
n-m sont des amplitudes d'échantillons de signal et N(m) désigne un nombre d'échantillons
multiple de m, le plus grand qui soit inférieur ou égal à une valeur N
max. Cette disposition permet d'améliorer la détection ultérieure des périodicités.
[0024] La valeur choisie pour le dénominateur permet de détecter la variation du niveau
de signal, donc d'améliorer la fidélité. Par exemple, pour un niveau de signal multiplié
par g sur une durée de m échantillons, le signal ayant une période m, on obtient r
m = g.r₀, r
2m = g².r₀, etc...
[0025] Les valeurs de l'autocorrélation globale r
m sont ensuite analysées en faisant comme première hypothèse simplificatrice que l'autocorrélation
à court terme du signal est nulle pour un écart m supérieur à P en valeur absolue
: ceci devient presque vrai si l'on utilise non pas le signal original mais plutôt
le résiduel à la sortie d'un prédicteur auto-adaptatif d'ordre suffisant et ayant
une constante de temps d'adaptation bien choisie.
[0026] Par exemple, il peut être avantageux de remplacer S
n par un résiduel S
n' donné par les équations suivantes :
avec A
=A
+ ε signe (S'
nS
n-i), i=1...Q
Dans une deuxième hypothèse, la valeur minimale M
min du pitch est choisie supérieure à 2P.
[0027] En tenant compte des deux hypothèses précédentes, l'autocorrélation globale r
m est ensuite recomposée à partir de la somme des excitations périodiques M₁, M₂,...,M
k et des valeurs de l'autocorrélation à court terme r
-p...,r
p dupliquées aux positions 0, M₁, 2
M1,...,0, M₂, 2
M2,...,0, M
k, 2M
k, ..., les répliques suivant l'évolution du niveau des composantes du signal.
[0028] La figure 2 représente, de haut en bas, l'évolution de l'autocorrélation r
m en fonction de m, pour m = -P à m = M
max+P. Sur cette figure, la contribution du bruit n'est pas représentée. Le premier diagramme
représente l'autocorrélation à court terme, les deux diagrammes suivants, la contribution
des signaux périodiques M₁ à M
K, et le dernier diagramme l'autocorrélation globale r
m obtenue à partir des valeurs de l'autocorrélation à court terme r
-p,...,r
p, convoluées avec K trains d'impulsions.
[0029] Afin de tenir compte de l'évolution du niveau du signal, le train d'impulsions relatif
à la kème excitation périodique est défini par la formule suivante:
[0030] Le coefficient β
k représente un gain, le coefficient α
k une variation de gain, ou pente de gain qui doit être linéaire pour pouvoir poursuivre
les calculs et INT(M
max/M
k) est une fonction qui ne retient que la partie entière du rapport M
max/M
k soit le rapport entre la valeur du pitch maximum et la valeur du pitch de la kème
excitation périodique.
[0031] Compte tenu des deux hypothèses précédentes concernant les valeurs respectives de
P, ordre de prédiction, et M
min, valeur minimale recherchée pour le pitch M
k, l'étape 2 sur la figure 1 consiste à calculer les sommes partielles t
m qui correspondent en fait au calcul de l'autocorrélation de l'autocorrélation globale
r
m limitée à sa valeur à court terme. Le calcul est donné par la formule suivant :
et
s
-p...,s
p sont les valeurs de l'autocorrélation r
-p,..., r
p limitée à sa valeur à court terme.
[0032] Pour des raisons de complexité de calcul, un algorithme itératif de recherche sub-optimal
pour trouver les K valeurs de M
k, α
k et β
k correspondant respectivement à la période du pitch, la pente du gain et le gain de
la kème excitation est mis en oeuvre à l'étape 5. Il consiste à calculer les valeurs
de M
k, α
k et β
k qui minimisent la quantité d suivante, par exemple, par une méthode des moindre carrés
:
Les étapes 3 et 4 correspondent respectivement à l'initialisation d'un compteur k
et à l'incrémentation de ce compteur k tant que la valeur du compteur k n'a pas atteinte
la valeur K. Ce test est effectué par l'étape 6 du procédé selon l'invention.
[0033] En notant R le vecteur des autocorrélations r
m et Sl
k celui des autocorrélations à court terme s
m convoluées avec le kème train d'impulsions, avec un gain égal à 1, la quantité d,
représentant la distance entre le vecteur R et le vecteur Sl
k affecté d'un gain β
k, est obtenue par la formule suivante :
avec
et
La valeur de β
k qui minimise cette expression (6) est obtenue par la formule suivante :
[0034] Dans ces conditions, la quantité d devient d
min telle que:
[0035] En reprenant le calcul des sommes partielles donné par la relation (4), l'expression
d
min donnée par la relation (8) devient alors :
[0036] Il ne reste plus qu'à minimiser cette expression en fonction de α
k, ce qui donne, tous calculs effectués, la valeur suivante pour α
k :
avec
et
[0037] La valeur de d
min ainsi obtenue est alors la suivante :
[0038] La recherche d'une excitation donnée consiste à trouver la valeur M
k qui minimise cette quantité, sachant que R ne varie pas durant la recherche et que
les quantités S₀, S₁ et S₂ sont facilement calculables pour une valeur de M
k donnée.
[0039] Une fois que la valeur de M
k a été déterminée, l'équation (10) donne la valeur de α
k, et la valeur de β
k est donnée par modification de l'équation (7):
[0040] Lors de l'itération suivante, c'est-à-dire au passage de la valeur k à la valeur
k + 1 du compteur k correspondant à l'étape 4 sur la figure 1, le vecteur R des autocorrélations
r
m n'est que partiellement modélisé par le vecteur Sl
k multiplié par le gain β
k. Il convient donc de remplacer les autocorrélations r
m par leurs valeurs modifiées r'
m par soustraction des quantités β
k si
k,m suivant l'équation suivante :
[0041] Cependant, comme les valeurs de l'autocorrélation globale r
m n'interviennent pas directement dans le calcul de α
k et β
k, le procédé ne modifie que les sommes partielles t
m qui sont seules utilisées. Cette correction correspondant à l'étape 7 consiste à
soustraire des sommes partielles t
m les valeurs de l'autocorrélation c
m des échantillons s
m de l'autocorrélation à court terme et à remplacer les sommes partielles t
m par leurs valeurs modifiées t
m' . Ceci est réalisé suivant la relation suivante :
avec
[0042] Les coefficients c
m ne sont calculés qu'une fois, puisque s
m ne change pas au cours des itérations.
[0043] Une fois les K excitations périodiques définies, le niveau de l'excitation apériodique
à utiliser, se déduit de l'autocorrélation r
m. En effet, si le signal répondait exactement à un modèle à K excitations périodiques,
la valeur de l'autocorrélation r
m ou des sommes t
m serait nulle après la dernière correction suivant les équations (13) et (14). En
pratique, le niveau β₀ de bruit à générer peut être représenté, compte tenu des approximations
faites, par une fonction non décroissante du rapport entre les valeurs des coefficients
r
m après définition de la Kème excitation, et leurs valeurs initiales. Cette fonction
peut être par exemple une relation empirique du type :
avec γ = 1 ou 2
[0044] Bien entendu, le procédé décrit ci-dessus peut être amélioré sur divers points qui
sont abordés brièvement ci-après. Un nouvel organigramme des étapes d'un deuxième
mode de réalisation du procédé selon l'invention est représenté sur la figure 3. Sur
cette figure les étapes homologues à celles de la figure 1 sont désignées par les
mêmes repères.
[0045] L'étape 8 du procédé consiste en un prétraitement du signal d'entrée. Ce prétraitement
transforme, par exemple, le signal d'entrée S
m brut en un signal dont l'autocorrélation se rapproche d'une impulsion de dirac, donc
d'un signal dont le spectre est aplati, par exemple, par un filtre prédicteur auto-adaptatif.
Ce prétraitement réalise ainsi un blanchissement du spectre avant analyse.
[0046] D'autres prétraitements, tels que par exemple, l'élimination de la composante continue
et des très basses fréquences du signal d'entrée, un contrôle automatique de gain,
et une pré-accentuation, sont également possibles.
[0047] A partir du signal ainsi traité par l'étape 8, le calcul de l'autocorrélation globale
r
m est effectué selon l'étape 1 décrite précédemment. Une deuxième étape 9 supplémentaire
consiste à pondérer l'autocorrélation venant d'être calculée par une fenêtre de pondération
simple pouvant être représenté par exemple par une enveloppe non croissante en fonction
du temps et dont la largeur est choisie plus large que l'intervalle maximal d'analyse.
Le but de cette fenêtre de pondération vise plus à stabiliser le signal plutôt qu'à
le mettre en forme en évitant des discontinuités dans la suite des calculs dues au
nombre variable de répliques de l'autocorrélation à court terme que peuvent comporter
les vecteurs Sl
k. Par exemple, si M
max = 160, il y aura trois répliques pour un pitch de 80 et seulement deux répliques
pour un pitch de 81. Cette étape fait donc apparaître progressivement les répliques
de l'autocorrélation dont les amplitudes suivent une fonction décroissante.
[0048] Les étapes 2, 3 et 4 se retrouvent à l'identique de la figure 1, et l'étape 5 est
pratiquement identique moyennant une limitation sur les valeurs de β
k et α
k :
[0049] En effet, dans le cas d'un signal complètement non voisé, par exemple un signal de
parole sans voyelle, le procédé selon l'invention est capable de déterminer les K
pitchs recherchés. La seule différence avec un son partiellement ou totalement voisé
réside dans la valeur des coefficients β et α . Pour éviter cette situation, le calcul
selon l'étape 5 ne retient que les excitations périodiques pour lesquelles les coefficients
β et α sont compris dans des plages de valeurs restreintes : par exemple, des valeurs
positives inférieures à 1 pour β ≧ 0,3 et β ≦ 1, et des valeurs proches de 1 pour
α,|α| = 0,2. La limitation des valeurs de α permet également d'éviter des impulsions
de diracs négatives représentatives de l'autocorrélation. Le coefficient α peut répondre
par exemple à la relation suivante :
[0050] L'étape 10 du procédé, consiste en un test supplémentaire sur la valeur du compteur
k à l'issue du calcul des coefficients M
k, α
k et β
k effectué par l'étape 5 du procédé.
[0051] Ce test prend en compte l'éventualité que la première excitation analysée, k<2, par
le procédé soit le signal de parole recherché. Dans ce cas, l'étape 10 est rebouclée
sur l'incrémentation du compteur k représentée par l'étape 4.
[0052] Dans l'autre cas, k≧2, l'étape 11 du procédé recalcule les coefficients calculés
par l'étape 5: l'algorithme utilisé par le procédé selon l'invention est sub-optimal,
c'est-à-dire qu'il recherche les K excitations périodiques les unes après les autres,
alors qu'en toute rigueur il devrait les rechercher toutes à la fois. De plus, les
vecteurs Sl
k ne sont pas orthogonaux, ils partagent tous les autocorrélations r
-p à r
p créant des interférences entre les diverses autocorrélations. Afin d'optimiser l'algorithme,
l'étape 11 recalcule les coefficients α₁, α₂,..., α
k-1 et β₁, β₂,...,β
k-1 en plus de α
k et β
k à la kème itération, en conservant les valeurs de pitchs M
k précédemment calculés; ce qui revient à une résolution d'un système de K équations
linéaires.
[0053] Les étapes 6 et 7 suivantes correspondent respectivement à celles du procédé de la
figure 1.
[0054] Une dernière correction est apportée au premier mode de réalisation du procédé selon
l'invention par une étape 12 qui, compte tenu de la sub-optimalité de l'algorithme,
consiste à corriger les valeurs de pitch M
k :
[0055] En effet, il est possible de trouver à la kème itération un pitch M
k de valeur identique à celle de l'un des pitchs déjà calculé. Pour améliorer l'algorithme,
l'étape 12 optimise le calcul au-delà du nombre K effectif d'excitations recherché
et choisit et/ou regroupe parmi les K'(K'< K) excitations celles qui donnent le meilleur
résultat acoustique. Par exemple, deux excitations dont les valeurs de M sont trop
voisines pour être discernées sont regroupées en une seule excitation. La détermination
du niveau de l'excitation apériodique reste quant à elle identique dans les deux modes
de réalisation du procédé selon l'invention. Une fois les différentes excitations
déterminées par le procédé selon l'invention, l'analyse se poursuit par une quantification
selon des procédés connus.
[0056] Un mode de réalisation d'un vocodeur permettant la mise en oeuvre du procédé selon
l'invention est représenté à la figure 4. Ce dispositif comporte un générateur de
bruit 13 délivrant une forme d'onde aléatoire, ou excitation apériodique, K générateurs
14₁ à 14
k délivrant chacun un train d'ondes périodiques où chaque période du fondamental, "pitch",
est notée respectivement M₁ à M
k. L'excitation apériodique correspond aux sons non voisés comme la plupart des consonnes
et les K trains d'ondes périodiques correspondent à des sons voisés comme les voyelles.
L'excitation apériodique et les K excitations apériodiques ainsi définies sont affectées
respectivement d'un gain G₀ à G
k modulable dans le temps représenté respectivement par les cercles 15₀ à 15
k. Les K + 1 excitations sont ensuite injectées simultanément à l'entrée d'un sommateur
16. En sortie du sommateur 16, on obtient les k + 1 excitations superposées qui sont
injectées sur une première entrée d'opérande d'un opérateur de multiplication 17.
La deuxième entrée d'opérande permet d'ajuster le niveau global des k + 1 excitations.
Après avoir défini le niveau global et la répartition des gains des diverses excitations,
tout en respectant la relation suivante G₀ + G₁ + ... + G
k = 1, le signal de sortie de l'opérateur 17 est injecté en entrée d'un filtre d'analyse
18, par exemple, un filtre de prédiction d'ordre P qui en utilisant le procédé d'analyse
selon l'invention délivre en sortie un signal de parole synthétique débarrassé des
bruits ambiants .
[0057] Un procédé de quantification utilisable avec un tel vocodeur est donné à titre d'exemple
:
[0058] De façon usuelle, le niveau global de l'énergie de la trame est quantifié semi-logarithmiquement
sur 5 bits.
[0059] En supposant l'existence de K = 3 générateurs d'excitation périodique, et en admettant
une quantification non linéaire du pitch sur 6 bits, avec M
min = 20 et M
max = 160, il faut 18 bits pour définir les trois pitchs, M₁, M₂ et M₃.
[0060] Enfin, pour s'affranchir des erreurs de transmission affectant le pitch, et ne pas
avoir à transmettre le gain β₀ du générateur de bruit, on propose plutôt de transmettre
les valeurs des niveaux initiaux β
i,init(i = 1...K) des générateurs périodiques de leurs niveaux finaux β
i,fin(i = 1...K) ces niveaux finaux étant atteints sur la durée N d'une trame, et étant
définis par l'expression suivante :
[0061] A raison de 2 bits par coefficient, ceci représente un total de 3(2+2) = 12 bits,
sachant par ailleurs que β₀ est le complément à 1 de la somme des β
i.
[0062] Le nombre de bits alloués à l'excitation est donc de 5 + 18 + 12 = 35.
[0063] En utilisant pour la quantification du filtre de prédiction un procédé similaire
à celui mis en oeuvre pour un vocodeur à 1200 bits/seconde, où le débit est d'environ
25 bits par filtre pour une qualité équivalente à celle du 2400 bits/seconde, le débit
obtenu est de 2400 bits/seconde au plus pour des trames de 25 ms au moins.
1. Procédé de discrimination de la parole en présence de bruits ambiants pour vocodeur
à faible débit du type comportant une excitation périodique, une excitation apériodique
et un filtre d'analyse d'ordre P, caractérisé en ce qu'il consiste pour analyser un
signal Sn composé de la somme d'un nombre K déterminé d'excitations périodiques et d'une excitation
apériodique, à calculer (1) l'autocorrélation globale rm du signal Sn, à calculer (2) les sommes partielles tm de l'autocorrélation à court terme sm corrélée avec l'autocorrélation globale rm, à initialiser (3) un compteur k et tant que le compteur k n'atteint pas la valeur
maximale K correspondant au nombre maximal d'excitations périodiques (6), pour chaque
incrémentation (4) du compteur k, après avoir corrigé (7) le calcul des sommes partielles
tm, à calculer (5) les valeurs du pitch Mk, du gain βk et de la pente du gain αk de chaque excitation périodique, et à déterminer le niveau de l'excitation apériodique
β₀ en fonction de l'autocorrélation globale rm en début d'analyse et de l'autocorrélation rm en fin d'analyse.
2. Procédé selon la revendication 1, caractérisé en ce que l'autocorrélation globale
rm est bornée entre une valeur minimale m = - P, où P correspond à l'ordre de prédiction
à court terme du filtre d'analyse, et une valeur maximale m = Mmax + P, où Mmax correspond à la valeur maximale du pitch Mk considéré.
3. Procédé selon l'une quelconque des revendications 1 et 2, caractérisé en ce que les
valeurs Mk, βk et αk sont déterminées en minimisant par une méthode des moindre carré la distance d définie
comme étant la distance entre le vecteur R de l'autocorrélation globale rm et le vecteur Slk de l'autocorrélation à court terme sm convolué avec la kème excitation périodique, multiplié par le gain βk.
4. Procédé selon l'une quelconque des revendications 1 à 3, caractérisé en ce que les
sommes partielles tm sont modifiées en soustrayant des sommes partielles tm, les valeurs de l'autocorrélation d'échantillons sm de l'autocorrélation à court terme et en remplaçant les anciennes sommes partielles
tm par les nouvelles sommes tm' résultant de la soustraction.
5. Procédé selon l'une quelconque des revendications 1 à 4, caractérisé en ce qu'il consiste
en outre à prétraiter (8) le signal d'entrée Sn pour affiner le calcul (1) de l'autocorrélation globale rm, à pondérer (9) l'autocorrélation globale rm par une fenêtre de pondération limitant le nombre de répliques de l'autocorrélation,
à tester (10) après le calcul (5) des valeurs de Mk, βk et αk, si la valeur du compteur k est strictement inférieure à deux, alors à incrémenter
(4) le compteur k, sinon à recalculer (10) les valeurs αi et βi respectivement à αk et βk en conservant les valeurs de Mk précédemment calculées, de i égal à un, à i égal à la valeur du compteur k, et tant
que la valeur du compteur k n'a pas atteint la valeur maximale K, à incrémenter (4)
le compteur k, et quand la valeur maximale K est atteinte, à regrouper en une seule
excitation, deux excitations dont les valeurs Mk sont trop voisines pour être discernables.
6. Procédé selon la revendication 5, caractérisé en ce que le prétraitement (8) du signal
d'entrée Sn est une prédiction auto-adaptative permettant un blanchissement du spectre du signal
d'entrée Sn.
7. Procédé selon la revendication 6, caractérisé en ce que la fenêtre de pondération
de l'autocorrélation globale rm est une fonction non croissante du temps dont la largeur est choisi supérieure à
l'intervalle maximal d'analyse.
8. Vocodeur pour la mise en oeuvre du procédé selon l'une quelconque des revendications
1 à 7, caractérisé en ce qu'il comporte un générateur de bruit (13) délivrant une
excitation apériodique, K générateurs (14₁ à 14k) délivrant K excitations périodiques, les K + 1 excitations étant affectées respectivement
d'un gain (G₀ à Gk) modulable dans le temps et tel que la somme des gains (G₀ à Gk) est égale à un, un circuit sommateur (16) recevant les K + 1 excitations dont la
sortie est couplée à une première entrée d'opérande d'un opérateur de multiplication
(17), la deuxième entrée d'opérande permettant d'ajuster le niveau global des K +
1 excitations, et un filtre d'analyse (18) assurant l'analyse des k + 1 excitations
pour en déduire le signal synthétique représentatif de la parole en présence de bruits
ambiants.
9. Vocodeur selon la revendication 8, caractérisé en ce que le filtre d'analyse (18)
est un filtre de prédiction linéaire d'ordre P = 10.