[0001] L'invention concerne un procédé et un système de reconstitution de basses fréquences
d'un signal audio, utilisable en sortie d'un dispositif de reproduction du son présentant
une fréquence de coupure pour les basses fréquences.
[0002] L'invention trouve une application particulièrement avantageuse dans le domaine des
équipements électro-acoustiques, notamment les enceintes stéréo pour la reproduction
d'oeuvres musicales ou encore les enceintes d'ordinateurs personnels (PC) pour la
reproduction de la bande son de fichiers vidéo.
[0003] On sait que toute enceinte acoustique possède une fréquence de coupure pour les basses
fréquences en dessous de laquelle elle n'est plus capable de rayonner de l'énergie.
Cette fréquence de coupure est directement liée aux dimensions du haut-parleur, et
plus précisément à la taille de la membrane. Plus le haut-parleur est petit et plus
la fréquence de coupure est élevée dans le spectre. Ainsi, une enceinte de petites
dimensions imposera une atténuation naturelle au contenu basse fréquence d'un morceau
de musique, et ceci au détriment de l'auditeur qui ne pourra pas bénéficier de cette
information et ressentira de ce fait un effet désagréable lié à la perte des sonorités
graves.
[0004] Une première solution à cette difficulté consiste à appliquer un filtre pour amplifier
les basses fréquences atténuées par l'enceinte acoustique, en forçant mécaniquement
la membrane du haut-parleur à rayonner ces fréquences graves. Cependant, cette solution
présente de réels risques pour l'intégrité du haut-parleur. En effet, l'excursion
de la membrane, c'est-à-dire l'amplitude de son déplacement par rapport à sa position
d'équilibre, deviendrait trop importante, jusqu'à l'endommager, voire la rompre.
[0005] Une autre solution repose sur une propriété psycho-acoustique de l'oreille humaine
qui permet de percevoir des fréquences basses même si elles ne sont pas effectivement
transmises par un dispositif appartenant à la chaîne de reproduction du son, un haut-parleur
d'enceinte acoustique par exemple. Cet effet de perception de tonalité ("pitch") résiduel,
généralement connu sous le terme anglo-saxon de
Missing-Fundamental Effect, résulte du fait que la perception du "pitch" d'un signal sonore n'est pas seulement
liée à la présence de la fréquence fondamentale dans le signal mais également à celle
d'harmoniques supérieures de cette fréquence. En d'autres termes, si la fréquence
fondamentale, de 100 Hz par exemple, est éliminée d'un signal tout en conservant ses
harmoniques supérieures, à 200, 300, 400 Hz, ... le "pitch" perçu sera le même, car
dans ce cas c'est en fait l'écart fréquentiel, ici de 100 Hz, entre les harmoniques
supérieures qui fixe le "pitch" et procure à l'auditeur l'impression d'entendre un
signal de "pitch" 100 Hz. Bien entendu, cette troncature du signal, ainsi privé de
sa fréquence fondamentale, se traduit par un timbre différent, ce dernier étant déterminé
notamment par les amplitudes relatives de l'ensemble des harmoniques.
[0006] Il est donc possible de remédier à l'atténuation, totale ou partielle, des fréquences
fondamentales des signaux audio inférieures à la fréquence de coupure, en générant
en temps réel un signal harmonique synthétisé à partir d'harmoniques associées à chacune
des fréquences fondamentales atténuées, et en réinjectant ce signal harmonique dans
le signal audio original. On comprend en effet que, même si la fréquence fondamentale
d'un son est atténuée ou complètement absorbée, les harmoniques supérieures, situées
au-dessus de la fréquence de coupure du dispositif de reproduction du son, pourront
être transmises et reconstituer le "pitch" du son par l'effet de tonalité résiduelle
expliqué plus haut.
[0007] Ce procédé permettant d'étendre virtuellement vers le bas du spectre la bande passante
d'un système électro-acoustique est désigné sous le terme de "génération de basses
virtuelles".
[0008] Dans ce contexte, le
US 5 930 373 A1 décrit un tel procédé, consistant à générer des harmoniques relatives aux fréquences
basses du signal audio au moyen d'un système de modulation. Le signal de référence
est multiplié par lui-même pour obtenir un signal de fréquence double, puis à nouveau
multiplié par lui-même pour obtenir un signal de fréquence triple, etc. Ce système
connu a l'avantage d'être rapide, car sans retard important, et de ne pas nécessiter
d'information de fréquence. Il présente cependant l'inconvénient d'être non-linéaire.
En effet, si le signal audio original contient une somme de fréquences, seront générées
non seulement les harmoniques de chacune de ces fréquences mais également des harmoniques
issues de termes d'intermodulation qui risquent de dégrader fortement les performances
audio du système.
[0009] On connaît également d'après le
US 6 134 330 A1 un procédé dans lequel le signal contenant les basses fréquences traverse une série
de filtres non-linéaires constitués d'un redresseur et d'un intégrateur. Ce traitement
donne naissance à une série d'harmoniques supérieures associées à chaque fréquence
fondamentale. Toutefois, comme le précédent ce procédé présente les inconvénients
d'un système non-linéaire, à savoir la génération d'artéfacts d'intermodulation pouvant
affecter le signal résultant.
[0010] Une autre technique encore est décrite dans le
WO 97/42789 A1, qui prévoit de filtrer le signal audio au moyen d'un filtre passe-bas de fréquence
de coupure sensiblement égale à la fréquence de coupure du dispositif de reproduction
du son, puis de déterminer les fréquences fondamentales à reconstituer par détection
de passages par zéro du signal audio filtré. Les fréquences fondamentales devant être
reconstituées en sortie étant déterminées par détection de passages par zéro, on en
déduit très simplement les valeurs de leurs harmoniques supérieures de manière à synthétiser
les signaux harmoniques associés à chaque fréquence fondamentale qui servent de base
à la mise en oeuvre de l'effet de restitution de "pitch" exposé précédemment. Toutefois,
la présence du filtre passe-bas introduit un déphasage variable qui interfère négativement
sur le signal obtenu en sortie car le signal harmonique ne sera pas réinjecté en phase
dans le signal audio d'origine. Ceci produit des niveaux d'harmoniques inégaux selon
les fréquences, car potentiellement plus faibles pour les fréquences qui ne sont pas
en phase avec celles du signal original.
[0011] Un autre problème tient au fait que le signal synthétisé présente des variations
temporelles qui ne suivent pas fidèlement celles du signal original, ce qui a pour
effet d'en altérer les nuances.
[0012] Le
US 2003/223588 A1 propose à cet égard un dispositif de renforcement des basses où l'enveloppe du signal
synthétique est ajustée par un système de compression/expansion dans lequel la pente
ainsi qu'un décalage sont réglables. La pente et le décalage sont ajustés simultanément
de manière que l'énergie moyenne de l'enveloppe soit compensée, ce contrôle simultané
étant réglable par un potentiomètre ou tout autre moyen de réglage manuel.
[0013] Ce système présente l'inconvénient de ne pas être adapté à tous les types de signaux
d'entrée, notamment si le but recherché est d'obtenir un rendu le plus naturel possible
des tonalités, et non de produire des effets acoustiques en générant des composantes
fréquentielles non contenues dans le signal original, comme dans le cas du
US 2003/223588 A1 qui cherche essentiellement à élargir artificiellement le champ stéréo, augmenter
la "brillance" du son ou encore introduire une distorsion rappelant la sonorité particulière
des amplificateurs à tubes.
[0014] En effet, si l'on appliquait les enseignements de ce document à la reconstitution
du "pitch" du son par l'effet de tonalité résiduelle expliqué plus haut, une ligne
de basse de niveau modéré serait amplifiée d'une même valeur qu'une ligne de basse
très forte, et l'effet serait perçu négativement par l'utilisateur.
[0015] Un autre problème, commun à toutes les techniques décrites dans les documents présentés
ci-dessus, tient au fait que ces techniques ne tiennent pas compte des variations
de la perception auditive humaine avec la fréquence (effet dit de la "perception du
loudness"). En effet, selon le niveau sonore et selon la fréquence, une même variation d'un
signal acoustique ne produira pas la même variation d'intensité perçue. Par exemple,
pour passer une variation d'intensité perçue de 40 à 50 phones, il faut augmenter
le signal acoustique de presque 10 dB à 100 Hz, alors qu'il ne faut que 5 ou 6 dB
supplémentaires à 50 Hz.
[0016] Aussi, un but de l'invention est de proposer un procédé de reconstitution de basses
fréquences d'un signal audio en sortie d'un dispositif de reproduction du son qui
respecte les variations temporelles du signal original de façon à en préserver les
nuances, et qui tienne également compte des variations de la perception auditive humaine
avec la fréquence.
[0017] Le procédé de l'invention est du type divulgué par le
WO 97/42789 A1 précité, c'est-à-dire un procédé de reconstitution de basses fréquences d'un signal
audio en sortie d'un dispositif de reproduction du son présentant une fréquence de
coupure basse (F
0), et comprenant des étapes de :
- filtrage du signal audio au moyen d'un filtre passe-bas de fréquence de coupure sensiblement
égale à ladite fréquence de coupure du dispositif de reproduction du son ;
- détermination d'une fréquence fondamentale à reconstituer à partir du signal audio
filtré passe-bas ; et
- génération d'un signal harmonique associé à ladite fréquence fondamentale à reconstituer.
[0018] Les buts précités sont atteints, conformément à l'invention, du fait que ce procédé
comprend les étapes de :
- détection d'une enveloppe temporelle du signal audio filtré passe-bas ;
- adaptation dynamique de ladite enveloppe temporelle en fonction de la bande de fréquences
considérée ; et
- réinjection en phase dudit signal harmonique dans ledit signal audio par addition
après multiplication de ce signal harmonique avec l'enveloppe temporelle adaptée.
[0019] L'adaptation dynamique de l'enveloppe temporelle en fonction de la bande de fréquences
permet notamment de tenir compte des variations de la perception auditive humaine
avec la fréquence, et la détection de l'enveloppe temporelle et sa prise en compte
par multiplication avec le signal harmonique généré permet de moduler le signal synthétisé
selon les variations temporelles de l'enveloppe.
[0020] En pratique, l'étape d'adaptation de l'enveloppe temporelle est réalisée par compression/expansion
de l'enveloppe temporelle.
[0021] Il a été en particulier constaté qu'il était préférable d'amplifier le gain de l'enveloppe
lorsque la ligne de basse est faible ou modérée, afin que l'effet proposé soit toujours
perçu positivement par l'utilisateur.
[0022] Ainsi, contrairement au procédé de compression/expansion proposé par le
US 2003/223588 A1 précité, qui prévoyait d'ajuster le décalage une fois pour toutes par un réglage
manuel, l'invention propose d'automatiser dynamiquement l'ajustement du décalage de
l'enveloppe par une boucle de rétroaction sur la valeur de l'enveloppe (avantageusement
avec des constantes de temps différentes à la montée et à la descente). Ainsi, le
décalage s'ajustera automatiquement, en fonction de l'énergie moyenne du signal d'entrée,
à une valeur qui maximise cette énergie dans une limite définie.
[0023] Selon diverses caractéristiques subsidiaires avantageuses :
- le contrôle de l'étape de compression/expansion est opéré conditionnellement après
comparaison du niveau du signal comprimé/expansé par rapport à un seuil prédéterminé
;
- ce contrôle comprend la modification dynamique d'au moins un paramètre de la caractéristique
de compression/expansion en fonction du niveau du signal comprimé/expansé ;
- cette modification dynamique est opérée de manière itérative, par pas successifs,
le pas de modification dudit paramètre en cas de niveaux forts, supérieurs à un seuil
donné, du niveau du signal comprimé/expansé étant supérieur au pas de modification
de ce même paramètre en cas de niveaux faibles, supérieurs à un seuil donné, du signal
comprimé/expansé ;
- le paramètre en question est la position du point invariant de la caractéristique
de compression/expansion ;
- la caractéristique de compression/expansion est une caractéristique linéaire, pour
des entrées/sorties exprimées en échelle logarithmique ;
- la pente de la caractéristique de compression/expansion est maintenue constante lors
de la modification du paramètre ;
- la modification de la position du point invariant de la caractéristique de compression/expansion
est opérée par modification de l'ordonnée à l'origine de ladite caractéristique linéaire,
cette modification étant de préférence limitée par des valeurs minimale et maximale.
[0024] L'invention concerne également un module de reconstitution de basses fréquences d'un
signal audio pour la mise en oeuvre du procédé précité, ce module comprenant :
- un filtre passe-bas apte à filtrer le signal audio à une fréquence de coupure sensiblement
égale à la fréquence de coupure du dispositif de reproduction du son ; et
- une première branche de traitement du signal audio filtré passe-bas destinée à générer
un signal harmonique associée à au moins une fréquence fondamentale à reconstituer
dans le signal audio, cette première branche comprenant un bloc apte à déterminer
la fréquence fondamentale.
[0025] Selon l'invention, ce module comporte en outre :
- une deuxième branche de traitement du signal audio filtré passe-bas comprenant un
détecteur d'enveloppe temporelle du signal et un circuit d'adaptation dynamique de
cette enveloppe temporelle en fonction de son niveau instantané ; et
- un circuit apte à réinjecter en phase le signal harmonique dans le signal audio par
addition après multiplication de ce signal harmonique avec l'enveloppe temporelle
adaptée.
[0026] Le circuit d'adaptation dynamique comprend très avantageusement un compresseur/expanseur
de l'enveloppe temporelle, imbriqué dans une boucle à rétroaction qui permet de contrôler
dynamiquement le niveau général de l'enveloppe temporelle afin de rehausser ce niveau
dans le cas des signaux faibles et de l'atténuer dans le cas des signaux forts.
[0027] On va maintenant décrire un exemple de mise en oeuvre du dispositif de l'invention,
en référence aux dessins annexés où les mêmes références numériques désignent d'une
figure à l'autre des éléments identiques ou fonctionnellement semblables.
La figure 1 est un schéma de l'architecture générale d'un système de reconstitution
de basses fréquences conforme à l'invention.
La figure 2 représente l'extension de bande-passante réalisée par le système de la
figure 1.
La figure 3 est un schéma détaillé du module de reconstitution de basses fréquences
du système de la figure 1.
La figure 4 est un bloc-diagramme du détecteur d'enveloppe temporelle du module de
la figure 3.
La figure 5 est un schéma du compresseur/expanseur du circuit d'adaptation d'enveloppe
du module de la figure 3.
La figure 6 est un diagramme de réponse du compresseur/expanseur de la figure 5.
La figure 7 illustre la manière dont évolue l'ordonnée à l'origine β du compresseur/expanseur
de la figure 5, de façon différenciée dans le sens de l'augmentation et de la diminution,
et avec application de seuils minimum et maximum.
Les figures 8a et 8b sont des diagrammes de réponse du compresseur/expanseur de la
figure 5, respectivement dans une configuration de gain minimal et de gain maximal,
montrant la manière dont la caractéristique est modifiée en fonction du niveau du
gain appliqué par le compresseur/expanseur.
[0028] La description qui va suivre en regard des dessins annexés, donnée à titre d'exemple
non limitatif, fera bien comprendre en quoi consiste l'invention et comment elle peut
être réalisée.
Principe général de mise en oeuvre
[0029] Sur la figure 1 est représentée une architecture d'un système 10 de reconstitution
de basses fréquences dans un signal audio, un signal stéréo par exemple, lesdites
basses fréquences devant être reconstituées en sortie d'un dispositif de reproduction
du son constitué par deux haut-parleurs 11, 12, associés à chaque signal de sortie
stéréo L
out et R
out, desdits haut-parleurs présentant une fréquence de coupure F
0 basse fréquence de 120 Hz par exemple.
[0030] Le système de reconstitution de la figure 1 comprend un module de reconstitution
100, désigné aussi par module de génération de "basses virtuelles", fonctionnant selon
le principe de restitution de "pitch" expliqué plus haut qui consiste, en substance,
à traiter un signal d'entrée S
in résultant de la moyenne des signaux stéréo d'entrée L
in et R
in de manière à générer un signal harmonique de sortie S
out associé à au moins une fréquence fondamentale inférieure à la fréquence de coupure
F
0 que l'on souhaite reconstituer en sortie des haut-parleurs 11, 12 par effet de restitution
de "pitch". Le signal harmonique de sortie S
out ainsi généré est réinjecté en phase en sortie du module 100 de génération de basses
virtuelles dans les signaux stéréo originaux L
in et R
in pour former les signaux de sortie stéréo L
out et R
out.
[0031] Dans la suite de cette description, on choisira de générer ledit signal harmonique
de sortie S
out par sommation de trois composantes sinusoïdales de fréquences respectivement égales
aux trois premières harmoniques du signal basse fréquence à reconstituer, à savoir
la fréquence fondamentale, ou première harmonique, et les deux harmoniques supérieures
suivantes, c'est-à-dire les harmoniques double et triple de la fréquence fondamentale.
Bien entendu, d'autres choix sont possibles comme, par exemple, l'utilisation des
quatre premières harmoniques, l'essentiel dans tous les cas étant que le signal harmonique
généré contienne au moins deux harmoniques consécutives de manière à percevoir leur
écart, lequel est égal au "pitch".
[0032] En conséquence, dans le cas envisagé ici, si la fréquence de coupure F
0 est de 120 Hz, la plage de basses fréquences pouvant bénéficier d'une reconstitution
par effet de "pitch" s'étend entre 60 et 120 Hz. Pour une fréquence fondamentale à
reconstituer de 60 Hz, les harmoniques à considérer sont celles à 60, 120, 180 Hz.
La bande passante du système 100 est donc "virtuellement" étendue vers le bas jusqu'à
une nouvelle fréquence de coupure F'
0 égale à 60 Hz, comme le montre la figure 2. La plage des fréquences comprises dans
l'intervalle [F'
0, F
0] est dénommée FFR (
Fundamental Frequency Range).
Reconstitution des fréquences basses
[0033] Le module de reconstitution 100 va maintenant être décrit en détail en référence
à la figure 3.
[0034] Le module 100 comprend en entrée un premier filtre passe-bas 101 dont la fréquence
de coupure est sensiblement égale à la fréquence de coupure F
0. Ce filtre 101 est destiné à effectuer une première partition du FFR au sein de toutes
les fréquences contenues dans le signal d'entrée S
in, et à limiter le phénomène de distorsion par repliement (
aliasing). Puis, le signal S
in ainsi filtré est sous-échantillonné par 10 par le bloc 102, afin de réduire la complexité
du filtrage tout en conservant une résolution suffisante pour l'estimation à venir
des fréquences fondamentales à reconstituer.
[0035] Le signal S
in ainsi filtré passe-bas et sous-échantillonné est ensuite traité parallèlement dans
deux branches 110, 120, du module 100.
[0036] La première branche 110 a pour but de générer un signal harmonique S
harm résultant de la synthèse de trois composantes sinusoïdales de fréquences respectives
égales à une fréquence fondamentale contenue dans le FFR et ses deux premières harmoniques
supérieures.
[0037] La deuxième branche 120 a pour but de construire une enveloppe temporelle env
adapt(t) destinée à moduler le signal harmonique S
harm de façon à ce que le signal de sortie S
out reproduise les variations temporelles du signal original. Le signal de sortie S
out résulte donc, en particulier, de la multiplication par le circuit multiplicateur
103 du signal harmonique S
harm par l'enveloppe env
adapt(t) :

[0038] Comme le montre la figure 3, la première branche 110 de traitement comprend un deuxième
filtre passe-bas 111 prévu pour délimiter à nouveau le FFR et éliminer du signal original
les fréquences s'étendant en dehors du FFR.
[0039] Ce filtre 111 incorpore avantageusement un étage passe-tout permettant de linéariser
la phase du signal, en neutralisant l'effet de déphasage variable introduit par le
filtrage passe-bas. L'effet de phase introduit par cette linéarisation est corrigé
par un retard τ introduit (figure 1) sur le signal original L
in ou R
in avant que celui-ci ne soit combiné avec le signal harmonique de sortie S
out synthétisé par le module 100 et réinjecté en phase avec le signal original pour former
les signaux de sortie L
out et R
out.
[0040] Les fréquences fondamentales, contenues dans le FFR et que l'on cherche à reconstituer
par effet de "pitch", sont déterminées au moyen d'un bloc 112 de passages par zéro
du signal issu du deuxième filtre passe-bas 111. Plus précisément, le bloc 112 détermine
la durée des périodes fondamentales entre deux passages par zéro et en déduit les
fréquences fondamentales correspondantes.
[0041] Pour chaque fréquence fondamentale déterminée par le bloc 112, un générateur 113
d'harmoniques fournit ensuite trois composantes sinusoïdales à la fréquence fondamentale
elle-même (n=1), ainsi qu'aux deux harmoniques supérieures (n=2, n=3). Ces trois composantes
sinusoïdales sont construites à partir d'une même table, dite "table de sinus" ou
encore
wavetable, stockée en mémoire, qui donne les valeurs d'une période de sinusoïde. Pour plus
de détail sur cette technique, on pourra se référer à l'article de
Laroche J. Synthesis of Sinusoids via Non-Overlapping Inverse Fourier Transform, IEEE
Transactions on Speech and Audio Processing, IEEE Service Center, New York, NY, USA,
vol. 8, n° 4, juillet 2000, pp. 471-477.
[0042] En pratique, le générateur 113 construit, à partir de la période fondamentale, les
composantes sinusoïdales d'échantillon en échantillon en progressant selon un pas
régulier dans la table. En fonction de la période détectée, le générateur 113 calcule
un certain pas pour construire la composante à la fréquence fondamentale (n=1) et,
partant du premier échantillon, il incrémente l'indice de ce pas afin de déterminer
l'échantillon suivant. Le pas d'échantillonnage est choisi de manière à être compatible
avec la puissance de calcul du microprocesseur du système 10, étant entendu que le
procédé mis en oeuvre par l'invention est un procédé en temps réel et qu'en conséquence
il ne doit pas introduire de retard entre les signaux. A titre d'exemple, la table
de sinus peut comporter 4096 points sur une période entière.
[0043] Les deux harmoniques supérieures (n=2, n=3) sont générées de la même façon en prenant
pour pas respectif le double et le triple du pas correspondant à la fréquence fondamentale.
[0044] On peut voir sur la figure 3 que les composantes sinusoïdales fournies par le générateur
113 sont ensuite soumises à une opération de pondération effectuée par un circuit
114 consistant à affecter à chaque composante un coefficient d'adaptation de timbre
déterminé expérimentalement, ceci afin de donner au signal de sortie S
out un timbre proche de celui du signal original. La valeur de ces coefficients dépend
essentiellement de l'ordre de l'harmonique considérée, c'est-à-dire première harmonique
(n=1), ou fréquence fondamentale, deuxième (n=2) et troisième (n=3) harmoniques (on
a vu en effet plus haut que le timbre d'un signal sonore est déterminé par le rapport
d'énergie entre ses différentes composantes fréquentielles). Plus précisément, le
circuit 114 reçoit du bloc 112 une information de fréquence et opère la pondération
des harmoniques, qui dépend de la fréquence instantanée, à partir de tables de coefficients
indexées par la fréquence détectée. Ainsi, par exemple, la pondération appliquée aux
sinusoïdes 60 Hz, 120 Hz et 180 Hz sera différente de celle appliquée aux sinusoïdes
100 Hz, 200 Hz et 300 Hz.
[0045] Les composantes sinusoïdales pondérées sont sommées en sortie du circuit de pondération
114 par un circuit additionneur 115 pour former le signal harmonique synthétisé S
harm contenant les trois premières harmoniques de la fréquence fondamentale à reconstituer
considérée.
Détermination et adaptation de l'enveloppe temporelle
[0046] Parallèlement à la génération des harmoniques dans la première branche 110, la seconde
branche 120 du traitement extrait l'enveloppe temporelle env(t) du signal filtré passe-bas
et sous-échantillonné issu du bloc 102, au moyen d'un détecteur d'enveloppe 121 représenté
à la figure 4 qui, pour ce faire, effectue de manière classique un calcul de moindre
carré RMS (
Root Mean Square) consistant à élever le signal au carré par le bloc 121a, le filtrer à travers un
filtre passe-bas 121b, puis à en prendre la racine carrée par le bloc 121c.
[0047] Par ailleurs, il faut remarquer que le signal harmonique synthétisé S
harm n'a pas la même composition spectrale que le signal de basse fréquence original puisqu'il
se compose non seulement de la fréquence fondamentale mais aussi des deux premières
harmoniques supérieures. Or, l'oreille humaine ne perçoit pas toutes les fréquences
avec la même intensité, et les variations temporelles de deux signaux sonores ne sont
pas perçues de la même façon si leur contenu spectral est différent. Afin de tenir
compte de cette contrainte, les variations de l'enveloppe env(t) doivent être adaptées
en fonction du FFR.
[0048] Conformément à la figure 3, cette adaptation est faite sur la deuxième branche 120
de traitement par un circuit 122 apte à réaliser une opération de compression/expansion
selon la courbe de réponses entrée/sortie donnée sur la figure 6. L'enveloppe env(t)
étant préalablement calculée en décibels, les niveaux les plus faibles de l'enveloppe
inférieurs à un seuil donné -N dB par exemple -27 dB dans l'exemple illustré, sont
atténués, alors que les niveaux plus forts, supérieurs à -N dB, sont encore augmentés.
Cette adaptation, basée sur une échelle perceptive, permet de donner au signal ainsi
généré des variations temporelles qui seront perçues comme semblables aux variations
temporelles du signal original, permettant ainsi de garantir que le timbre généré
sera fidèle au timbre original.
[0049] Comme le montre la représentation schématique de la figure 5, le circuit d'adaptation
122 est contrôlé par une boucle de rétroaction 122b de la façon suivante.
[0050] Pour simplifier la réalisation du circuit, et sans que cela ait d'incidence notable
sur les résultats obtenus, on peut faire, dans la gamme de fréquences analysées (typiquement
40-120 Hz) la double approximation suivante :
- le taux d'expansion, c'est-à-dire le facteur par lequel il faut multiplier une variation
x donnée sur le signal original, exprimée en décibels, pour obtenir la même variation
d'intensité perçue sur le signal harmonique, exprimée en phones, est constant pour
une harmonique considérée ; et
- le taux d'expansion ne dépend pas non plus de l'ordre de l'harmonique considérée (alors
que, théoriquement, il augmenterait avec l'ordre de l'harmonique).
[0051] On choisira pour la valeur du taux d'expansion une moyenne des taux d'expansion pour
toutes les fréquences, amplitudes et ordres d'harmonique considérés.
[0052] Le processus de compression/expansion, schématisé en 122a, sera appliqué sur l'enveloppe
détectée déterminée par le détecteur d'enveloppe 121, puis cette enveloppe expansée
sera utilisée pour moduler la somme des harmoniques synthétisées (puisque le taux
d'expansion est le même pour toutes les harmoniques).
[0053] Le taux d'expansion, désigné par la suite α, correspond à la pente de la droite D
représentée figure 6 (comme indiqué plus haut, après étude des courbes d'isophonie
on peut considérer que cette pente sera constante). L'ordonnée à l'origine de cette
droite D sera désignée β, et sera fonction du point invariant souhaité l, qui dans
l'exemple illustré figure 6 est situé à (-27 dB, - 27 dB). La fonction de transfert
du bloc 122a peut être exprimée sous la forme :

[0054] Si l'on souhaite que le système amplifie dans tous les cas le niveau sonore perçu
des sons graves (c'est-à-dire même quand le niveau de l'enveloppe temporelle est inférieur
à -N dB (-27 dB dans l'exemple illustré), et puisque α est fixé, il convient d'augmenter
β d'une certaine valeur pour que la caractéristique D de compression/expansion passe
au-dessus de la droite
y =
x de pente unité pour ce niveau faible de l'enveloppe. Inversement, dans le cas d'un
niveau de basses important sur le signal original, il faut veiller à ne pas trop amplifier
l'enveloppe.
[0055] Pour obtenir ce résultat, l'invention propose d'utiliser un système d'adaptation
du niveau de l'enveloppe, basé sur une boucle de rétroaction.
[0056] Le principe de cette boucle, illustré figure 5, consiste à comparer à un seuil S
le niveau instantané de l'enveloppe expansée délivré en sortie du module de compression/expansion
122a. Si ce niveau est inférieur au seuil, le paramètre β est augmenté d'un pas fixe
pour l'adaptation de l'échantillon suivant. Inversement, si le niveau instantané de
l'enveloppe expansée est supérieur au seuil S, β est diminué d'un pas fixe.
[0057] Le pas d'augmentation ou de diminution ne sera pas le même dans un cas et dans l'autre.
En effet, si le niveau instantané de l'enveloppe expansée devient brusquement très
grand - dans le cas d'une percussion par exemple -, il faut que la diminution de β
intervienne très vite, pour éviter d'atteindre des niveaux excessivement importants.
En revanche, si le niveau instantané est faible, il est possible d'augmenter β plus
progressivement, d'autant plus qu'il convient de respecter les nuances du morceau
original : l'atténuation naturelle des notes de basses doit être respectée car, si
β augmentait aussi vite qu'il diminuait, les notes ne s'arrêteraient jamais.
[0058] La figure 7 illustre la manière dont le paramètre β varie en augmentation et en diminution
dans le cas d'un morceau de musique présentant une augmentation brusque de niveau,
suivie d'une diminution rapide de ce même niveau. On notera également que la variation
du paramètre β est limitée à une valeur minimale (par exemple β = 0) et à une valeur
maximale (par exemple β = +12 dB).
[0059] Le principe d'incrémentation/décrémentation de β est le suivant : une variable
flag prend la valeur 0 ou 1 en fonction du résultat de la comparaison entre le niveau
instantané de l'enveloppe expansée et le seuil S, et le pas d'adaptation de β est
calculé selon la formule :
x0 étant choisi en fonction du rapport souhaité entre l'augmentation et le pas de diminution
de β, et
coeff étant choisi en fonction de la vitesse d'adaptation souhaitée (si
coeff est petit, β évoluera doucement alors qu'il évoluera rapidement avec
coeff grand).
[0060] Les variations de β vont se traduire par un déplacement du point invariant I de la
caractéristique D de compression/expansion.
[0061] Les figures 8a et 8b illustrent la caractéristique D obtenue pour les deux valeurs
extrêmes de β, respectivement β = 0 dB et β = +12 dB (lorsque β varie, la droite D
oscille verticalement entre les deux positions extrêmes représentées figures 8a et
8b).
[0062] La zone de compression effective (c'est-à-dire la zone où le signal de sortie est
atténué par rapport au signal d'entrée) et la zone d'expansion effective (c'est-à-dire
la zone où le signal de sortie est amplifié par rapport au signal d'entrée) sont séparées
par le point invariant I, les secteurs compris entre la caractéristique D et la droite
de pente unité
y =
x définissant les régions de compression (en deçà du point I) et d'expansion (au-delà
du point I).
[0063] La boucle de rétroaction permet ainsi de compresser ou d'expanser l'enveloppe en
fonction de son niveau instantané, afin d'homogénéiser le niveau des composantes basses
réinjectées dans le signal original quel que soit le genre musical du morceau considéré
(les constantes de temps de l'asservissement étant choisies suffisamment faibles pour
ne pas affecter la décroissance naturelle des notes). Cela permet de générer des signaux
harmoniques d'amplitude relativement constante quel que soit le signal original. Ainsi,
un signal sonore basse fréquence de faible dynamique dans les basses fréquences sera
quand même sensiblement renforcé par le système, tandis qu'un signal sonore avec une
ligne de basse de forte énergie sera renforcé à un niveau limité, afin de conserver
un rendu naturel.
[0064] Cette méthode d'adaptation de l'enveloppe, combinant un module de compression/expansion
avec une boucle de contrôle par rétroaction, permet de générer un signal qui sera
perçu comme semblable au signal original si celui-ci était produit par une enceinte
acoustique de plus grandes dimensions.
Reconstitution finale du signal de sortie
[0065] Si l'on revient à la figure 3, une fois l'adaptation de l'enveloppe réalisée par
le circuit 122, le signal harmonique S
harm synthétisé dans la première branche 110 est modulé par l'enveloppe adaptée env
adapt(t) issue de la seconde branche 120, par multiplication opérée au moyen du circuit
103, puis le signal est sur-échantillonné d'un facteur 10 par le bloc 105 pour revenir
à la fréquence d'échantillonnage initiale. Il peut être avantageux d'introduire à
ce stade un filtre passe-bas dans le processus de sur-échantillonnage, car ce filtre
étant à phase linéaire, il n'introduit pas de distorsion de phase qui irait à l'encontre
de l'objectif recherché de réinjection du signal synthétisé en phase dans le signal
original.
[0066] Comme la réinjection du signal de sortie S
out filtré passe-haut et sur-échantillonné présente des risques de dépassement de la
dynamique, on utilise un limiteur en sortie du système 10 de reconstitution, pour
que le signal renvoyé aux haut-parleurs 11, 12 reste contenu sur une dynamique de
16 bits.
1. Un procédé de reconstitution de basses fréquences d'un signal audio en sortie d'un
dispositif de reproduction du son (11, 12) présentant une fréquence de coupure basse
(F
0), comprenant des étapes de :
- filtrage du signal audio au moyen d'un filtre passe-bas (101) de fréquence de coupure
sensiblement égale à ladite fréquence de coupure (F0) du dispositif de reproduction du son ;
- détermination d'une fréquence fondamentale à reconstituer à partir du signal audio
filtré passe-bas ; et
- génération d'un signal harmonique (Sharm) associé à ladite fréquence fondamentale à reconstituer ;
caractérisé par des étapes de :
- détection d'une enveloppe temporelle (env(t)) du signal audio filtré passe-bas ;
- adaptation dynamique de ladite enveloppe temporelle (env(t)) en fonction de la bande
de fréquences considérée ; et
- réinjection en phase dudit signal harmonique dans ledit signal audio par addition
après multiplication de ce signal harmonique (Sharm) avec l'enveloppe temporelle adaptée (envadapt(t)).
2. Le procédé de la revendication 1, dans lequel ladite étape d'adaptation est réalisée
par compression/expansion (122a) de l'enveloppe temporelle (env(t)).
3. Le procédé de la revendication 2, comprenant un contrôle par boucle de rétroaction
(122b) de ladite étape de compression/expansion.
4. Le procédé de la revendication 3, dans lequel ledit contrôle par boucle de rétroaction
de l'étape de compression/expansion est opéré conditionnellement après comparaison
du niveau du signal comprimé/expansé par rapport à un seuil (S) prédéterminé.
5. Le procédé de la revendication 3, dans lequel ledit contrôle par boucle de rétroaction
de l'étape de compression/expansion comprend la modification dynamique d'au moins
un paramètre de la caractéristique (D) de compression/expansion en fonction du niveau
du signal comprimé/expansé.
6. Le procédé de la revendication 5, dans lequel ladite modification dynamique dudit
paramètre est une modification opérée de manière itérative, par pas successifs.
7. Le procédé de la revendication 6, dans lequel le pas de modification dudit paramètre
en cas de niveaux forts, supérieurs à un seuil donné, du niveau du signal comprimé/expansé
est supérieur au pas de modification de ce même paramètre en cas de niveaux faibles,
supérieurs à un seuil donné, du signal comprimé/expansé.
8. Le procédé de la revendication 5, dans lequel ledit au moins un paramètre est la position
du point invariant (I) de la caractéristique de compression/expansion.
9. Le procédé de la revendication 8, dans lequel ladite caractéristique de compression/expansion
est une caractéristique linéaire (D), pour des entrées/sorties exprimées en échelle
logarithmique.
10. Le procédé de la revendication 9, dans lequel la pente (α) de ladite caractéristique
de compression/expansion est maintenue constante lors de la modification dudit paramètre.
11. Le procédé des revendications 8 et 9 prises en combinaison, dans lequel la modification
de la position dudit point invariant (I) est opérée par modification de l'ordonnée
à l'origine (β) de ladite caractéristique linéaire.
12. Le procédé de la revendication 11, dans lequel ladite modification de l'ordonnée à
l'origine de la caractéristique linéaire est une modification limitée par des valeurs
minimale et maximale.
13. Un module de reconstitution de basses fréquences d'un signal audio (S
in), en sortie d'un dispositif (11, 12) de reproduction du son présentant une fréquence
(F
0) de coupure pour lesdites basses fréquences, pour la mise en oeuvre du procédé selon
l'une des revendications précédentes, ce module comprenant :
- un filtre passe-bas (101) apte à filtrer ledit signal audio (Sin) à une fréquence de coupure sensiblement égale à la fréquence de coupure (F0) dudit dispositif (11, 12) de reproduction du son ; et
- une première branche (110) de traitement du signal audio filtré passe-bas destinée
à générer un signal harmonique (Sharm) associée à au moins une fréquence fondamentale à reconstituer dans le signal audio,
ladite première branche (110) comprenant un bloc (112) apte à déterminer ladite fréquence
fondamentale ;
module caractérisé en ce qu'il comporte en outre :
- une deuxième branche (120) de traitement du signal audio filtré passe-bas comprenant
un détecteur (121) d'enveloppe temporelle dudit signal et un circuit (122) d'adaptation
de ladite enveloppe temporelle en fonction de son niveau instantané ; et
- un circuit apte à réinjecter en phase ledit signal harmonique dans ledit signal
audio par addition après multiplication de ce signal harmonique (Sharm) avec l'enveloppe temporelle adaptée (envadapt(t)).
14. Le module de la revendication 13, dans lequel ledit circuit (122) d'adaptation comprend
un compresseur/expanseur (122a) de l'enveloppe temporelle.
15. Le module de la revendication 14, comprenant en outre une boucle de contrôle (122b)
dudit compresseur/expanseur (122a) par rétroaction en fonction du niveau du signal
comprimé/expansé.