(19)
(11) EP 2 113 913 A1

(12) DEMANDE DE BREVET EUROPEEN

(43) Date de publication:
04.11.2009  Bulletin  2009/45

(21) Numéro de dépôt: 09290310.3

(22) Date de dépôt:  29.04.2009
(51) Int. Cl.: 
G10L 21/02(2006.01)
H04R 3/04(2006.01)
(84) Etats contractants désignés:
AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO SE SI SK TR

(30) Priorité: 29.04.2008 FR 0802388

(71) Demandeur: Parrot
75010 Paris (FR)

(72) Inventeurs:
  • De Muynke, Julien
    75018 Paris (FR)
  • Pochon, Benoit
    75010 Paris (FR)
  • Pinto, Guillaume
    75004 Paris (FR)

(74) Mandataire: Dupuis-Latour, Dominique 
Bardehle Pagenberg Dost Altenburg Geissler 10, boulevard Haussmann
75009 Paris
75009 Paris (FR)

   


(54) Procédé et système de reconstitution de basses fréquences dans un signal audio


(57) Ce procédé comprend des étapes de : filtrage du signal audio au moyen d'un filtre passe-bas (101) de fréquence de coupure sensiblement égale à ladite fréquence de coupure (F0) du dispositif de reproduction du son ; détermination d'une fréquence fondamentale à reconstituer à partir du signal audio filtré passe-bas ; et génération d'un signal harmonique (Sharm) associé à ladite fréquence fondamentale à reconstituer. Il comprend en outre des étapes de : détection d'une enveloppe temporelle (env(t)) du signal audio filtré passe-bas ; adaptation dynamique de ladite enveloppe temporelle (env(t)) en fonction de la bande de fréquences considérée ; et réinjection en phase dudit signal harmonique dans ledit signal audio par addition après multiplication de ce signal harmonique (Sharm) avec l'enveloppe temporelle adaptée (envadapt(t)). L'adaptation est réalisée par compression/expansion de l'enveloppe temporelle avec contrôle par boucle de rétroaction, ajustée automatiquement sur la valeur de l'enveloppe en fonction de l'énergie moyenne du signal d'entrée, à une valeur qui maximise cette énergie dans une limite définie.




Description


[0001] L'invention concerne un procédé et un système de reconstitution de basses fréquences d'un signal audio, utilisable en sortie d'un dispositif de reproduction du son présentant une fréquence de coupure pour les basses fréquences.

[0002] L'invention trouve une application particulièrement avantageuse dans le domaine des équipements électro-acoustiques, notamment les enceintes stéréo pour la reproduction d'oeuvres musicales ou encore les enceintes d'ordinateurs personnels (PC) pour la reproduction de la bande son de fichiers vidéo.

[0003] On sait que toute enceinte acoustique possède une fréquence de coupure pour les basses fréquences en dessous de laquelle elle n'est plus capable de rayonner de l'énergie. Cette fréquence de coupure est directement liée aux dimensions du haut-parleur, et plus précisément à la taille de la membrane. Plus le haut-parleur est petit et plus la fréquence de coupure est élevée dans le spectre. Ainsi, une enceinte de petites dimensions imposera une atténuation naturelle au contenu basse fréquence d'un morceau de musique, et ceci au détriment de l'auditeur qui ne pourra pas bénéficier de cette information et ressentira de ce fait un effet désagréable lié à la perte des sonorités graves.

[0004] Une première solution à cette difficulté consiste à appliquer un filtre pour amplifier les basses fréquences atténuées par l'enceinte acoustique, en forçant mécaniquement la membrane du haut-parleur à rayonner ces fréquences graves. Cependant, cette solution présente de réels risques pour l'intégrité du haut-parleur. En effet, l'excursion de la membrane, c'est-à-dire l'amplitude de son déplacement par rapport à sa position d'équilibre, deviendrait trop importante, jusqu'à l'endommager, voire la rompre.

[0005] Une autre solution repose sur une propriété psycho-acoustique de l'oreille humaine qui permet de percevoir des fréquences basses même si elles ne sont pas effectivement transmises par un dispositif appartenant à la chaîne de reproduction du son, un haut-parleur d'enceinte acoustique par exemple. Cet effet de perception de tonalité ("pitch") résiduel, généralement connu sous le terme anglo-saxon de Missing-Fundamental Effect, résulte du fait que la perception du "pitch" d'un signal sonore n'est pas seulement liée à la présence de la fréquence fondamentale dans le signal mais également à celle d'harmoniques supérieures de cette fréquence. En d'autres termes, si la fréquence fondamentale, de 100 Hz par exemple, est éliminée d'un signal tout en conservant ses harmoniques supérieures, à 200, 300, 400 Hz, ... le "pitch" perçu sera le même, car dans ce cas c'est en fait l'écart fréquentiel, ici de 100 Hz, entre les harmoniques supérieures qui fixe le "pitch" et procure à l'auditeur l'impression d'entendre un signal de "pitch" 100 Hz. Bien entendu, cette troncature du signal, ainsi privé de sa fréquence fondamentale, se traduit par un timbre différent, ce dernier étant déterminé notamment par les amplitudes relatives de l'ensemble des harmoniques.

[0006] Il est donc possible de remédier à l'atténuation, totale ou partielle, des fréquences fondamentales des signaux audio inférieures à la fréquence de coupure, en générant en temps réel un signal harmonique synthétisé à partir d'harmoniques associées à chacune des fréquences fondamentales atténuées, et en réinjectant ce signal harmonique dans le signal audio original. On comprend en effet que, même si la fréquence fondamentale d'un son est atténuée ou complètement absorbée, les harmoniques supérieures, situées au-dessus de la fréquence de coupure du dispositif de reproduction du son, pourront être transmises et reconstituer le "pitch" du son par l'effet de tonalité résiduelle expliqué plus haut.

[0007] Ce procédé permettant d'étendre virtuellement vers le bas du spectre la bande passante d'un système électro-acoustique est désigné sous le terme de "génération de basses virtuelles".

[0008] Dans ce contexte, le US 5 930 373 A1 décrit un tel procédé, consistant à générer des harmoniques relatives aux fréquences basses du signal audio au moyen d'un système de modulation. Le signal de référence est multiplié par lui-même pour obtenir un signal de fréquence double, puis à nouveau multiplié par lui-même pour obtenir un signal de fréquence triple, etc. Ce système connu a l'avantage d'être rapide, car sans retard important, et de ne pas nécessiter d'information de fréquence. Il présente cependant l'inconvénient d'être non-linéaire. En effet, si le signal audio original contient une somme de fréquences, seront générées non seulement les harmoniques de chacune de ces fréquences mais également des harmoniques issues de termes d'intermodulation qui risquent de dégrader fortement les performances audio du système.

[0009] On connaît également d'après le US 6 134 330 A1 un procédé dans lequel le signal contenant les basses fréquences traverse une série de filtres non-linéaires constitués d'un redresseur et d'un intégrateur. Ce traitement donne naissance à une série d'harmoniques supérieures associées à chaque fréquence fondamentale. Toutefois, comme le précédent ce procédé présente les inconvénients d'un système non-linéaire, à savoir la génération d'artéfacts d'intermodulation pouvant affecter le signal résultant.

[0010] Une autre technique encore est décrite dans le WO 97/42789 A1, qui prévoit de filtrer le signal audio au moyen d'un filtre passe-bas de fréquence de coupure sensiblement égale à la fréquence de coupure du dispositif de reproduction du son, puis de déterminer les fréquences fondamentales à reconstituer par détection de passages par zéro du signal audio filtré. Les fréquences fondamentales devant être reconstituées en sortie étant déterminées par détection de passages par zéro, on en déduit très simplement les valeurs de leurs harmoniques supérieures de manière à synthétiser les signaux harmoniques associés à chaque fréquence fondamentale qui servent de base à la mise en oeuvre de l'effet de restitution de "pitch" exposé précédemment. Toutefois, la présence du filtre passe-bas introduit un déphasage variable qui interfère négativement sur le signal obtenu en sortie car le signal harmonique ne sera pas réinjecté en phase dans le signal audio d'origine. Ceci produit des niveaux d'harmoniques inégaux selon les fréquences, car potentiellement plus faibles pour les fréquences qui ne sont pas en phase avec celles du signal original.

[0011] Un autre problème tient au fait que le signal synthétisé présente des variations temporelles qui ne suivent pas fidèlement celles du signal original, ce qui a pour effet d'en altérer les nuances.

[0012] Le US 2003/223588 A1 propose à cet égard un dispositif de renforcement des basses où l'enveloppe du signal synthétique est ajustée par un système de compression/expansion dans lequel la pente ainsi qu'un décalage sont réglables. La pente et le décalage sont ajustés simultanément de manière que l'énergie moyenne de l'enveloppe soit compensée, ce contrôle simultané étant réglable par un potentiomètre ou tout autre moyen de réglage manuel.

[0013] Ce système présente l'inconvénient de ne pas être adapté à tous les types de signaux d'entrée, notamment si le but recherché est d'obtenir un rendu le plus naturel possible des tonalités, et non de produire des effets acoustiques en générant des composantes fréquentielles non contenues dans le signal original, comme dans le cas du US 2003/223588 A1 qui cherche essentiellement à élargir artificiellement le champ stéréo, augmenter la "brillance" du son ou encore introduire une distorsion rappelant la sonorité particulière des amplificateurs à tubes.

[0014] En effet, si l'on appliquait les enseignements de ce document à la reconstitution du "pitch" du son par l'effet de tonalité résiduelle expliqué plus haut, une ligne de basse de niveau modéré serait amplifiée d'une même valeur qu'une ligne de basse très forte, et l'effet serait perçu négativement par l'utilisateur.

[0015] Un autre problème, commun à toutes les techniques décrites dans les documents présentés ci-dessus, tient au fait que ces techniques ne tiennent pas compte des variations de la perception auditive humaine avec la fréquence (effet dit de la "perception du loudness"). En effet, selon le niveau sonore et selon la fréquence, une même variation d'un signal acoustique ne produira pas la même variation d'intensité perçue. Par exemple, pour passer une variation d'intensité perçue de 40 à 50 phones, il faut augmenter le signal acoustique de presque 10 dB à 100 Hz, alors qu'il ne faut que 5 ou 6 dB supplémentaires à 50 Hz.

[0016] Aussi, un but de l'invention est de proposer un procédé de reconstitution de basses fréquences d'un signal audio en sortie d'un dispositif de reproduction du son qui respecte les variations temporelles du signal original de façon à en préserver les nuances, et qui tienne également compte des variations de la perception auditive humaine avec la fréquence.

[0017] Le procédé de l'invention est du type divulgué par le WO 97/42789 A1 précité, c'est-à-dire un procédé de reconstitution de basses fréquences d'un signal audio en sortie d'un dispositif de reproduction du son présentant une fréquence de coupure basse (F0), et comprenant des étapes de :
  • filtrage du signal audio au moyen d'un filtre passe-bas de fréquence de coupure sensiblement égale à ladite fréquence de coupure du dispositif de reproduction du son ;
  • détermination d'une fréquence fondamentale à reconstituer à partir du signal audio filtré passe-bas ; et
  • génération d'un signal harmonique associé à ladite fréquence fondamentale à reconstituer.


[0018] Les buts précités sont atteints, conformément à l'invention, du fait que ce procédé comprend les étapes de :
  • détection d'une enveloppe temporelle du signal audio filtré passe-bas ;
  • adaptation dynamique de ladite enveloppe temporelle en fonction de la bande de fréquences considérée ; et
  • réinjection en phase dudit signal harmonique dans ledit signal audio par addition après multiplication de ce signal harmonique avec l'enveloppe temporelle adaptée.


[0019] L'adaptation dynamique de l'enveloppe temporelle en fonction de la bande de fréquences permet notamment de tenir compte des variations de la perception auditive humaine avec la fréquence, et la détection de l'enveloppe temporelle et sa prise en compte par multiplication avec le signal harmonique généré permet de moduler le signal synthétisé selon les variations temporelles de l'enveloppe.

[0020] En pratique, l'étape d'adaptation de l'enveloppe temporelle est réalisée par compression/expansion de l'enveloppe temporelle.

[0021] Il a été en particulier constaté qu'il était préférable d'amplifier le gain de l'enveloppe lorsque la ligne de basse est faible ou modérée, afin que l'effet proposé soit toujours perçu positivement par l'utilisateur.

[0022] Ainsi, contrairement au procédé de compression/expansion proposé par le US 2003/223588 A1 précité, qui prévoyait d'ajuster le décalage une fois pour toutes par un réglage manuel, l'invention propose d'automatiser dynamiquement l'ajustement du décalage de l'enveloppe par une boucle de rétroaction sur la valeur de l'enveloppe (avantageusement avec des constantes de temps différentes à la montée et à la descente). Ainsi, le décalage s'ajustera automatiquement, en fonction de l'énergie moyenne du signal d'entrée, à une valeur qui maximise cette énergie dans une limite définie.

[0023] Selon diverses caractéristiques subsidiaires avantageuses :
  • le contrôle de l'étape de compression/expansion est opéré conditionnellement après comparaison du niveau du signal comprimé/expansé par rapport à un seuil prédéterminé ;
  • ce contrôle comprend la modification dynamique d'au moins un paramètre de la caractéristique de compression/expansion en fonction du niveau du signal comprimé/expansé ;
  • cette modification dynamique est opérée de manière itérative, par pas successifs, le pas de modification dudit paramètre en cas de niveaux forts, supérieurs à un seuil donné, du niveau du signal comprimé/expansé étant supérieur au pas de modification de ce même paramètre en cas de niveaux faibles, supérieurs à un seuil donné, du signal comprimé/expansé ;
  • le paramètre en question est la position du point invariant de la caractéristique de compression/expansion ;
  • la caractéristique de compression/expansion est une caractéristique linéaire, pour des entrées/sorties exprimées en échelle logarithmique ;
  • la pente de la caractéristique de compression/expansion est maintenue constante lors de la modification du paramètre ;
  • la modification de la position du point invariant de la caractéristique de compression/expansion est opérée par modification de l'ordonnée à l'origine de ladite caractéristique linéaire, cette modification étant de préférence limitée par des valeurs minimale et maximale.


[0024] L'invention concerne également un module de reconstitution de basses fréquences d'un signal audio pour la mise en oeuvre du procédé précité, ce module comprenant :
  • un filtre passe-bas apte à filtrer le signal audio à une fréquence de coupure sensiblement égale à la fréquence de coupure du dispositif de reproduction du son ; et
  • une première branche de traitement du signal audio filtré passe-bas destinée à générer un signal harmonique associée à au moins une fréquence fondamentale à reconstituer dans le signal audio, cette première branche comprenant un bloc apte à déterminer la fréquence fondamentale.


[0025] Selon l'invention, ce module comporte en outre :
  • une deuxième branche de traitement du signal audio filtré passe-bas comprenant un détecteur d'enveloppe temporelle du signal et un circuit d'adaptation dynamique de cette enveloppe temporelle en fonction de son niveau instantané ; et
  • un circuit apte à réinjecter en phase le signal harmonique dans le signal audio par addition après multiplication de ce signal harmonique avec l'enveloppe temporelle adaptée.


[0026] Le circuit d'adaptation dynamique comprend très avantageusement un compresseur/expanseur de l'enveloppe temporelle, imbriqué dans une boucle à rétroaction qui permet de contrôler dynamiquement le niveau général de l'enveloppe temporelle afin de rehausser ce niveau dans le cas des signaux faibles et de l'atténuer dans le cas des signaux forts.

[0027] On va maintenant décrire un exemple de mise en oeuvre du dispositif de l'invention, en référence aux dessins annexés où les mêmes références numériques désignent d'une figure à l'autre des éléments identiques ou fonctionnellement semblables.

La figure 1 est un schéma de l'architecture générale d'un système de reconstitution de basses fréquences conforme à l'invention.

La figure 2 représente l'extension de bande-passante réalisée par le système de la figure 1.

La figure 3 est un schéma détaillé du module de reconstitution de basses fréquences du système de la figure 1.

La figure 4 est un bloc-diagramme du détecteur d'enveloppe temporelle du module de la figure 3.

La figure 5 est un schéma du compresseur/expanseur du circuit d'adaptation d'enveloppe du module de la figure 3.

La figure 6 est un diagramme de réponse du compresseur/expanseur de la figure 5.

La figure 7 illustre la manière dont évolue l'ordonnée à l'origine β du compresseur/expanseur de la figure 5, de façon différenciée dans le sens de l'augmentation et de la diminution, et avec application de seuils minimum et maximum.

Les figures 8a et 8b sont des diagrammes de réponse du compresseur/expanseur de la figure 5, respectivement dans une configuration de gain minimal et de gain maximal, montrant la manière dont la caractéristique est modifiée en fonction du niveau du gain appliqué par le compresseur/expanseur.



[0028] La description qui va suivre en regard des dessins annexés, donnée à titre d'exemple non limitatif, fera bien comprendre en quoi consiste l'invention et comment elle peut être réalisée.

Principe général de mise en oeuvre



[0029] Sur la figure 1 est représentée une architecture d'un système 10 de reconstitution de basses fréquences dans un signal audio, un signal stéréo par exemple, lesdites basses fréquences devant être reconstituées en sortie d'un dispositif de reproduction du son constitué par deux haut-parleurs 11, 12, associés à chaque signal de sortie stéréo Lout et Rout, desdits haut-parleurs présentant une fréquence de coupure F0 basse fréquence de 120 Hz par exemple.

[0030] Le système de reconstitution de la figure 1 comprend un module de reconstitution 100, désigné aussi par module de génération de "basses virtuelles", fonctionnant selon le principe de restitution de "pitch" expliqué plus haut qui consiste, en substance, à traiter un signal d'entrée Sin résultant de la moyenne des signaux stéréo d'entrée Lin et Rin de manière à générer un signal harmonique de sortie Sout associé à au moins une fréquence fondamentale inférieure à la fréquence de coupure F0 que l'on souhaite reconstituer en sortie des haut-parleurs 11, 12 par effet de restitution de "pitch". Le signal harmonique de sortie Sout ainsi généré est réinjecté en phase en sortie du module 100 de génération de basses virtuelles dans les signaux stéréo originaux Lin et Rin pour former les signaux de sortie stéréo Lout et Rout.

[0031] Dans la suite de cette description, on choisira de générer ledit signal harmonique de sortie Sout par sommation de trois composantes sinusoïdales de fréquences respectivement égales aux trois premières harmoniques du signal basse fréquence à reconstituer, à savoir la fréquence fondamentale, ou première harmonique, et les deux harmoniques supérieures suivantes, c'est-à-dire les harmoniques double et triple de la fréquence fondamentale. Bien entendu, d'autres choix sont possibles comme, par exemple, l'utilisation des quatre premières harmoniques, l'essentiel dans tous les cas étant que le signal harmonique généré contienne au moins deux harmoniques consécutives de manière à percevoir leur écart, lequel est égal au "pitch".

[0032] En conséquence, dans le cas envisagé ici, si la fréquence de coupure F0 est de 120 Hz, la plage de basses fréquences pouvant bénéficier d'une reconstitution par effet de "pitch" s'étend entre 60 et 120 Hz. Pour une fréquence fondamentale à reconstituer de 60 Hz, les harmoniques à considérer sont celles à 60, 120, 180 Hz. La bande passante du système 100 est donc "virtuellement" étendue vers le bas jusqu'à une nouvelle fréquence de coupure F'0 égale à 60 Hz, comme le montre la figure 2. La plage des fréquences comprises dans l'intervalle [F'0, F0] est dénommée FFR (Fundamental Frequency Range).

Reconstitution des fréquences basses



[0033] Le module de reconstitution 100 va maintenant être décrit en détail en référence à la figure 3.

[0034] Le module 100 comprend en entrée un premier filtre passe-bas 101 dont la fréquence de coupure est sensiblement égale à la fréquence de coupure F0. Ce filtre 101 est destiné à effectuer une première partition du FFR au sein de toutes les fréquences contenues dans le signal d'entrée Sin, et à limiter le phénomène de distorsion par repliement (aliasing). Puis, le signal Sin ainsi filtré est sous-échantillonné par 10 par le bloc 102, afin de réduire la complexité du filtrage tout en conservant une résolution suffisante pour l'estimation à venir des fréquences fondamentales à reconstituer.

[0035] Le signal Sin ainsi filtré passe-bas et sous-échantillonné est ensuite traité parallèlement dans deux branches 110, 120, du module 100.

[0036] La première branche 110 a pour but de générer un signal harmonique Sharm résultant de la synthèse de trois composantes sinusoïdales de fréquences respectives égales à une fréquence fondamentale contenue dans le FFR et ses deux premières harmoniques supérieures.

[0037] La deuxième branche 120 a pour but de construire une enveloppe temporelle envadapt(t) destinée à moduler le signal harmonique Sharm de façon à ce que le signal de sortie Sout reproduise les variations temporelles du signal original. Le signal de sortie Sout résulte donc, en particulier, de la multiplication par le circuit multiplicateur 103 du signal harmonique Sharm par l'enveloppe envadapt(t) :



[0038] Comme le montre la figure 3, la première branche 110 de traitement comprend un deuxième filtre passe-bas 111 prévu pour délimiter à nouveau le FFR et éliminer du signal original les fréquences s'étendant en dehors du FFR.

[0039] Ce filtre 111 incorpore avantageusement un étage passe-tout permettant de linéariser la phase du signal, en neutralisant l'effet de déphasage variable introduit par le filtrage passe-bas. L'effet de phase introduit par cette linéarisation est corrigé par un retard τ introduit (figure 1) sur le signal original Lin ou Rin avant que celui-ci ne soit combiné avec le signal harmonique de sortie Sout synthétisé par le module 100 et réinjecté en phase avec le signal original pour former les signaux de sortie Lout et Rout.

[0040] Les fréquences fondamentales, contenues dans le FFR et que l'on cherche à reconstituer par effet de "pitch", sont déterminées au moyen d'un bloc 112 de passages par zéro du signal issu du deuxième filtre passe-bas 111. Plus précisément, le bloc 112 détermine la durée des périodes fondamentales entre deux passages par zéro et en déduit les fréquences fondamentales correspondantes.

[0041] Pour chaque fréquence fondamentale déterminée par le bloc 112, un générateur 113 d'harmoniques fournit ensuite trois composantes sinusoïdales à la fréquence fondamentale elle-même (n=1), ainsi qu'aux deux harmoniques supérieures (n=2, n=3). Ces trois composantes sinusoïdales sont construites à partir d'une même table, dite "table de sinus" ou encore wavetable, stockée en mémoire, qui donne les valeurs d'une période de sinusoïde. Pour plus de détail sur cette technique, on pourra se référer à l'article de Laroche J. Synthesis of Sinusoids via Non-Overlapping Inverse Fourier Transform, IEEE Transactions on Speech and Audio Processing, IEEE Service Center, New York, NY, USA, vol. 8, n° 4, juillet 2000, pp. 471-477.

[0042] En pratique, le générateur 113 construit, à partir de la période fondamentale, les composantes sinusoïdales d'échantillon en échantillon en progressant selon un pas régulier dans la table. En fonction de la période détectée, le générateur 113 calcule un certain pas pour construire la composante à la fréquence fondamentale (n=1) et, partant du premier échantillon, il incrémente l'indice de ce pas afin de déterminer l'échantillon suivant. Le pas d'échantillonnage est choisi de manière à être compatible avec la puissance de calcul du microprocesseur du système 10, étant entendu que le procédé mis en oeuvre par l'invention est un procédé en temps réel et qu'en conséquence il ne doit pas introduire de retard entre les signaux. A titre d'exemple, la table de sinus peut comporter 4096 points sur une période entière.

[0043] Les deux harmoniques supérieures (n=2, n=3) sont générées de la même façon en prenant pour pas respectif le double et le triple du pas correspondant à la fréquence fondamentale.

[0044] On peut voir sur la figure 3 que les composantes sinusoïdales fournies par le générateur 113 sont ensuite soumises à une opération de pondération effectuée par un circuit 114 consistant à affecter à chaque composante un coefficient d'adaptation de timbre déterminé expérimentalement, ceci afin de donner au signal de sortie Sout un timbre proche de celui du signal original. La valeur de ces coefficients dépend essentiellement de l'ordre de l'harmonique considérée, c'est-à-dire première harmonique (n=1), ou fréquence fondamentale, deuxième (n=2) et troisième (n=3) harmoniques (on a vu en effet plus haut que le timbre d'un signal sonore est déterminé par le rapport d'énergie entre ses différentes composantes fréquentielles). Plus précisément, le circuit 114 reçoit du bloc 112 une information de fréquence et opère la pondération des harmoniques, qui dépend de la fréquence instantanée, à partir de tables de coefficients indexées par la fréquence détectée. Ainsi, par exemple, la pondération appliquée aux sinusoïdes 60 Hz, 120 Hz et 180 Hz sera différente de celle appliquée aux sinusoïdes 100 Hz, 200 Hz et 300 Hz.

[0045] Les composantes sinusoïdales pondérées sont sommées en sortie du circuit de pondération 114 par un circuit additionneur 115 pour former le signal harmonique synthétisé Sharm contenant les trois premières harmoniques de la fréquence fondamentale à reconstituer considérée.

Détermination et adaptation de l'enveloppe temporelle



[0046] Parallèlement à la génération des harmoniques dans la première branche 110, la seconde branche 120 du traitement extrait l'enveloppe temporelle env(t) du signal filtré passe-bas et sous-échantillonné issu du bloc 102, au moyen d'un détecteur d'enveloppe 121 représenté à la figure 4 qui, pour ce faire, effectue de manière classique un calcul de moindre carré RMS (Root Mean Square) consistant à élever le signal au carré par le bloc 121a, le filtrer à travers un filtre passe-bas 121b, puis à en prendre la racine carrée par le bloc 121c.

[0047] Par ailleurs, il faut remarquer que le signal harmonique synthétisé Sharm n'a pas la même composition spectrale que le signal de basse fréquence original puisqu'il se compose non seulement de la fréquence fondamentale mais aussi des deux premières harmoniques supérieures. Or, l'oreille humaine ne perçoit pas toutes les fréquences avec la même intensité, et les variations temporelles de deux signaux sonores ne sont pas perçues de la même façon si leur contenu spectral est différent. Afin de tenir compte de cette contrainte, les variations de l'enveloppe env(t) doivent être adaptées en fonction du FFR.

[0048] Conformément à la figure 3, cette adaptation est faite sur la deuxième branche 120 de traitement par un circuit 122 apte à réaliser une opération de compression/expansion selon la courbe de réponses entrée/sortie donnée sur la figure 6. L'enveloppe env(t) étant préalablement calculée en décibels, les niveaux les plus faibles de l'enveloppe inférieurs à un seuil donné -N dB par exemple -27 dB dans l'exemple illustré, sont atténués, alors que les niveaux plus forts, supérieurs à -N dB, sont encore augmentés. Cette adaptation, basée sur une échelle perceptive, permet de donner au signal ainsi généré des variations temporelles qui seront perçues comme semblables aux variations temporelles du signal original, permettant ainsi de garantir que le timbre généré sera fidèle au timbre original.

[0049] Comme le montre la représentation schématique de la figure 5, le circuit d'adaptation 122 est contrôlé par une boucle de rétroaction 122b de la façon suivante.

[0050] Pour simplifier la réalisation du circuit, et sans que cela ait d'incidence notable sur les résultats obtenus, on peut faire, dans la gamme de fréquences analysées (typiquement 40-120 Hz) la double approximation suivante :
  • le taux d'expansion, c'est-à-dire le facteur par lequel il faut multiplier une variation x donnée sur le signal original, exprimée en décibels, pour obtenir la même variation d'intensité perçue sur le signal harmonique, exprimée en phones, est constant pour une harmonique considérée ; et
  • le taux d'expansion ne dépend pas non plus de l'ordre de l'harmonique considérée (alors que, théoriquement, il augmenterait avec l'ordre de l'harmonique).


[0051] On choisira pour la valeur du taux d'expansion une moyenne des taux d'expansion pour toutes les fréquences, amplitudes et ordres d'harmonique considérés.

[0052] Le processus de compression/expansion, schématisé en 122a, sera appliqué sur l'enveloppe détectée déterminée par le détecteur d'enveloppe 121, puis cette enveloppe expansée sera utilisée pour moduler la somme des harmoniques synthétisées (puisque le taux d'expansion est le même pour toutes les harmoniques).

[0053] Le taux d'expansion, désigné par la suite α, correspond à la pente de la droite D représentée figure 6 (comme indiqué plus haut, après étude des courbes d'isophonie on peut considérer que cette pente sera constante). L'ordonnée à l'origine de cette droite D sera désignée β, et sera fonction du point invariant souhaité l, qui dans l'exemple illustré figure 6 est situé à (-27 dB, - 27 dB). La fonction de transfert du bloc 122a peut être exprimée sous la forme :



[0054] Si l'on souhaite que le système amplifie dans tous les cas le niveau sonore perçu des sons graves (c'est-à-dire même quand le niveau de l'enveloppe temporelle est inférieur à -N dB (-27 dB dans l'exemple illustré), et puisque α est fixé, il convient d'augmenter β d'une certaine valeur pour que la caractéristique D de compression/expansion passe au-dessus de la droite y = x de pente unité pour ce niveau faible de l'enveloppe. Inversement, dans le cas d'un niveau de basses important sur le signal original, il faut veiller à ne pas trop amplifier l'enveloppe.

[0055] Pour obtenir ce résultat, l'invention propose d'utiliser un système d'adaptation du niveau de l'enveloppe, basé sur une boucle de rétroaction.

[0056] Le principe de cette boucle, illustré figure 5, consiste à comparer à un seuil S le niveau instantané de l'enveloppe expansée délivré en sortie du module de compression/expansion 122a. Si ce niveau est inférieur au seuil, le paramètre β est augmenté d'un pas fixe pour l'adaptation de l'échantillon suivant. Inversement, si le niveau instantané de l'enveloppe expansée est supérieur au seuil S, β est diminué d'un pas fixe.

[0057] Le pas d'augmentation ou de diminution ne sera pas le même dans un cas et dans l'autre. En effet, si le niveau instantané de l'enveloppe expansée devient brusquement très grand - dans le cas d'une percussion par exemple -, il faut que la diminution de β intervienne très vite, pour éviter d'atteindre des niveaux excessivement importants. En revanche, si le niveau instantané est faible, il est possible d'augmenter β plus progressivement, d'autant plus qu'il convient de respecter les nuances du morceau original : l'atténuation naturelle des notes de basses doit être respectée car, si β augmentait aussi vite qu'il diminuait, les notes ne s'arrêteraient jamais.

[0058] La figure 7 illustre la manière dont le paramètre β varie en augmentation et en diminution dans le cas d'un morceau de musique présentant une augmentation brusque de niveau, suivie d'une diminution rapide de ce même niveau. On notera également que la variation du paramètre β est limitée à une valeur minimale (par exemple β = 0) et à une valeur maximale (par exemple β = +12 dB).

[0059] Le principe d'incrémentation/décrémentation de β est le suivant : une variable flag prend la valeur 0 ou 1 en fonction du résultat de la comparaison entre le niveau instantané de l'enveloppe expansée et le seuil S, et le pas d'adaptation de β est calculé selon la formule :


x0 étant choisi en fonction du rapport souhaité entre l'augmentation et le pas de diminution de β, et coeff étant choisi en fonction de la vitesse d'adaptation souhaitée (si coeff est petit, β évoluera doucement alors qu'il évoluera rapidement avec coeff grand).

[0060] Les variations de β vont se traduire par un déplacement du point invariant I de la caractéristique D de compression/expansion.

[0061] Les figures 8a et 8b illustrent la caractéristique D obtenue pour les deux valeurs extrêmes de β, respectivement β = 0 dB et β = +12 dB (lorsque β varie, la droite D oscille verticalement entre les deux positions extrêmes représentées figures 8a et 8b).

[0062] La zone de compression effective (c'est-à-dire la zone où le signal de sortie est atténué par rapport au signal d'entrée) et la zone d'expansion effective (c'est-à-dire la zone où le signal de sortie est amplifié par rapport au signal d'entrée) sont séparées par le point invariant I, les secteurs compris entre la caractéristique D et la droite de pente unité y = x définissant les régions de compression (en deçà du point I) et d'expansion (au-delà du point I).

[0063] La boucle de rétroaction permet ainsi de compresser ou d'expanser l'enveloppe en fonction de son niveau instantané, afin d'homogénéiser le niveau des composantes basses réinjectées dans le signal original quel que soit le genre musical du morceau considéré (les constantes de temps de l'asservissement étant choisies suffisamment faibles pour ne pas affecter la décroissance naturelle des notes). Cela permet de générer des signaux harmoniques d'amplitude relativement constante quel que soit le signal original. Ainsi, un signal sonore basse fréquence de faible dynamique dans les basses fréquences sera quand même sensiblement renforcé par le système, tandis qu'un signal sonore avec une ligne de basse de forte énergie sera renforcé à un niveau limité, afin de conserver un rendu naturel.

[0064] Cette méthode d'adaptation de l'enveloppe, combinant un module de compression/expansion avec une boucle de contrôle par rétroaction, permet de générer un signal qui sera perçu comme semblable au signal original si celui-ci était produit par une enceinte acoustique de plus grandes dimensions.

Reconstitution finale du signal de sortie



[0065] Si l'on revient à la figure 3, une fois l'adaptation de l'enveloppe réalisée par le circuit 122, le signal harmonique Sharm synthétisé dans la première branche 110 est modulé par l'enveloppe adaptée envadapt(t) issue de la seconde branche 120, par multiplication opérée au moyen du circuit 103, puis le signal est sur-échantillonné d'un facteur 10 par le bloc 105 pour revenir à la fréquence d'échantillonnage initiale. Il peut être avantageux d'introduire à ce stade un filtre passe-bas dans le processus de sur-échantillonnage, car ce filtre étant à phase linéaire, il n'introduit pas de distorsion de phase qui irait à l'encontre de l'objectif recherché de réinjection du signal synthétisé en phase dans le signal original.

[0066] Comme la réinjection du signal de sortie Sout filtré passe-haut et sur-échantillonné présente des risques de dépassement de la dynamique, on utilise un limiteur en sortie du système 10 de reconstitution, pour que le signal renvoyé aux haut-parleurs 11, 12 reste contenu sur une dynamique de 16 bits.


Revendications

1. Un procédé de reconstitution de basses fréquences d'un signal audio en sortie d'un dispositif de reproduction du son (11, 12) présentant une fréquence de coupure basse (F0), comprenant des étapes de :

- filtrage du signal audio au moyen d'un filtre passe-bas (101) de fréquence de coupure sensiblement égale à ladite fréquence de coupure (F0) du dispositif de reproduction du son ;

- détermination d'une fréquence fondamentale à reconstituer à partir du signal audio filtré passe-bas ; et

- génération d'un signal harmonique (Sharm) associé à ladite fréquence fondamentale à reconstituer ;

caractérisé par des étapes de :

- détection d'une enveloppe temporelle (env(t)) du signal audio filtré passe-bas ;

- adaptation dynamique de ladite enveloppe temporelle (env(t)) en fonction de la bande de fréquences considérée ; et

- réinjection en phase dudit signal harmonique dans ledit signal audio par addition après multiplication de ce signal harmonique (Sharm) avec l'enveloppe temporelle adaptée (envadapt(t)).


 
2. Le procédé de la revendication 1, dans lequel ladite étape d'adaptation est réalisée par compression/expansion (122a) de l'enveloppe temporelle (env(t)).
 
3. Le procédé de la revendication 2, comprenant un contrôle par boucle de rétroaction (122b) de ladite étape de compression/expansion.
 
4. Le procédé de la revendication 3, dans lequel ledit contrôle par boucle de rétroaction de l'étape de compression/expansion est opéré conditionnellement après comparaison du niveau du signal comprimé/expansé par rapport à un seuil (S) prédéterminé.
 
5. Le procédé de la revendication 3, dans lequel ledit contrôle par boucle de rétroaction de l'étape de compression/expansion comprend la modification dynamique d'au moins un paramètre de la caractéristique (D) de compression/expansion en fonction du niveau du signal comprimé/expansé.
 
6. Le procédé de la revendication 5, dans lequel ladite modification dynamique dudit paramètre est une modification opérée de manière itérative, par pas successifs.
 
7. Le procédé de la revendication 6, dans lequel le pas de modification dudit paramètre en cas de niveaux forts, supérieurs à un seuil donné, du niveau du signal comprimé/expansé est supérieur au pas de modification de ce même paramètre en cas de niveaux faibles, supérieurs à un seuil donné, du signal comprimé/expansé.
 
8. Le procédé de la revendication 5, dans lequel ledit au moins un paramètre est la position du point invariant (I) de la caractéristique de compression/expansion.
 
9. Le procédé de la revendication 8, dans lequel ladite caractéristique de compression/expansion est une caractéristique linéaire (D), pour des entrées/sorties exprimées en échelle logarithmique.
 
10. Le procédé de la revendication 9, dans lequel la pente (α) de ladite caractéristique de compression/expansion est maintenue constante lors de la modification dudit paramètre.
 
11. Le procédé des revendications 8 et 9 prises en combinaison, dans lequel la modification de la position dudit point invariant (I) est opérée par modification de l'ordonnée à l'origine (β) de ladite caractéristique linéaire.
 
12. Le procédé de la revendication 11, dans lequel ladite modification de l'ordonnée à l'origine de la caractéristique linéaire est une modification limitée par des valeurs minimale et maximale.
 
13. Un module de reconstitution de basses fréquences d'un signal audio (Sin), en sortie d'un dispositif (11, 12) de reproduction du son présentant une fréquence (F0) de coupure pour lesdites basses fréquences, pour la mise en oeuvre du procédé selon l'une des revendications précédentes, ce module comprenant :

- un filtre passe-bas (101) apte à filtrer ledit signal audio (Sin) à une fréquence de coupure sensiblement égale à la fréquence de coupure (F0) dudit dispositif (11, 12) de reproduction du son ; et

- une première branche (110) de traitement du signal audio filtré passe-bas destinée à générer un signal harmonique (Sharm) associée à au moins une fréquence fondamentale à reconstituer dans le signal audio, ladite première branche (110) comprenant un bloc (112) apte à déterminer ladite fréquence fondamentale ;
module caractérisé en ce qu'il comporte en outre :

- une deuxième branche (120) de traitement du signal audio filtré passe-bas comprenant un détecteur (121) d'enveloppe temporelle dudit signal et un circuit (122) d'adaptation de ladite enveloppe temporelle en fonction de son niveau instantané ; et

- un circuit apte à réinjecter en phase ledit signal harmonique dans ledit signal audio par addition après multiplication de ce signal harmonique (Sharm) avec l'enveloppe temporelle adaptée (envadapt(t)).


 
14. Le module de la revendication 13, dans lequel ledit circuit (122) d'adaptation comprend un compresseur/expanseur (122a) de l'enveloppe temporelle.
 
15. Le module de la revendication 14, comprenant en outre une boucle de contrôle (122b) dudit compresseur/expanseur (122a) par rétroaction en fonction du niveau du signal comprimé/expansé.
 




Dessins
















Rapport de recherche










Références citées

RÉFÉRENCES CITÉES DANS LA DESCRIPTION



Cette liste de références citées par le demandeur vise uniquement à aider le lecteur et ne fait pas partie du document de brevet européen. Même si le plus grand soin a été accordé à sa conception, des erreurs ou des omissions ne peuvent être exclues et l'OEB décline toute responsabilité à cet égard.

Documents brevets cités dans la description




Littérature non-brevet citée dans la description