<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE ep-patent-document PUBLIC "-//EPO//EP PATENT DOCUMENT 1.5//EN" "ep-patent-document-v1-5.dtd">
<ep-patent-document id="EP14741619B1" file="EP14741619NWB1.xml" lang="fr" country="EP" doc-number="3025342" kind="B1" date-publ="20170913" status="n" dtd-version="ep-patent-document-v1-5">
<SDOBI lang="fr"><B000><eptags><B001EP>ATBECHDEDKESFRGBGRITLILUNLSEMCPTIESILTLVFIROMKCYALTRBGCZEEHUPLSK..HRIS..MTNORS..SM..................</B001EP><B003EP>*</B003EP><B005EP>J</B005EP><B007EP>BDM Ver 0.1.63 (23 May 2017) -  2100000/0</B007EP></eptags></B000><B100><B110>3025342</B110><B120><B121>FASCICULE DE BREVET EUROPEEN</B121></B120><B130>B1</B130><B140><date>20170913</date></B140><B190>EP</B190></B100><B200><B210>14741619.2</B210><B220><date>20140721</date></B220><B240><B241><date>20160204</date></B241></B240><B250>fr</B250><B251EP>fr</B251EP><B260>fr</B260></B200><B300><B310>1357226</B310><B320><date>20130723</date></B320><B330><ctry>FR</ctry></B330></B300><B400><B405><date>20170913</date><bnum>201737</bnum></B405><B430><date>20160601</date><bnum>201622</bnum></B430><B450><date>20170913</date><bnum>201737</bnum></B450><B452EP><date>20170317</date></B452EP></B400><B500><B510EP><classification-ipcr sequence="1"><text>G10L  21/02        20130101AFI20150205BHEP        </text></classification-ipcr></B510EP><B540><B541>de</B541><B542>VERFAHREN ZUR UNTERDRÜCKUNG DES SPÄTEN NACHHALLS EINES AKUSTISCHEN SIGNALS</B542><B541>en</B541><B542>METHOD FOR SUPPRESSING THE LATE REVERBERATION OF AN AUDIBLE SIGNAL</B542><B541>fr</B541><B542>PROCÉDÉ DE SUPPRESSION DE LA RÉVERBÉRATION TARDIVE D'UN SIGNAL SONORE</B542></B540><B560><B562><text>TOMOHIRO NAKATANI ET AL: "Speech Dereverberation Based on Variance-Normalized Delayed Linear Prediction", IEEE TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING, IEEE SERVICE CENTER, NEW YORK, NY, USA, vol. 18, no. 7, 1 septembre 2010 (2010-09-01), pages 1717-1731, XP011316583, ISSN: 1558-7916, DOI: 10.1109/TASL.2010.2052251</text></B562><B562><text>KINOSHITA K ET AL: "Suppression of Late Reverberation Effect on Speech Signal Using Long-Term Multiple-step Linear Prediction", IEEE TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING, IEEE SERVICE CENTER, NEW YORK, NY, USA, vol. 17, no. 4, 1 mai 2009 (2009-05-01), pages 534-545, XP011252305, ISSN: 1558-7916, DOI: 10.1109/TASL.2008.2009015</text></B562><B562><text>EMANUEL A P HABETS ET AL: "Late Reverberant Spectral Variance Estimation Based on a Statistical Model", IEEE SIGNAL PROCESSING LETTERS, IEEE SERVICE CENTER, PISCATAWAY, NJ, US, vol. 16, no. 9, 1 septembre 2009 (2009-09-01), pages 770-773, XP011262219, ISSN: 1070-9908</text></B562><B562><text>WEIFENG LI ET AL: "Feature Denoising Using Joint Sparse Representation for In-Car Speech Recognition", IEEE SIGNAL PROCESSING LETTERS, IEEE SERVICE CENTER, PISCATAWAY, NJ, US, vol. 20, no. 7, 1 juillet 2013 (2013-07-01), pages 681-684, XP011511246, ISSN: 1070-9908, DOI: 10.1109/LSP.2013.2245894</text></B562><B562><text>EPHRAIM Y ET AL: "Speech Enhancement Using a- Minimum Mean- Square Error Short-Time Spectral Amplitude Estimator", IEEE TRANSACTIONS ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, IEEE INC. NEW YORK, USA, vol. ASSP-32, no. 6, 1 décembre 1984 (1984-12-01), pages 1109-1121, XP002435684, ISSN: 0096-3518, DOI: 10.1109/TASSP.1984.1164453</text></B562></B560></B500><B700><B720><B721><snm>LOPEZ, Nicolas</snm><adr><str>8 Rue de la Cour des Noues</str><city>75020 Paris</city><ctry>FR</ctry></adr></B721><B721><snm>RICHARD, Gaël</snm><adr><str>37 Rue Chanzy</str><city>78220 Viroflay</city><ctry>FR</ctry></adr></B721><B721><snm>GRENIER, Yves</snm><adr><str>26 Rue de la Chapelle</str><city>78114 Magny Les Hameaux</city><ctry>FR</ctry></adr></B721></B720><B730><B731><snm>Arkamys</snm><iid>101158098</iid><irf>26875 WO/EP</irf><adr><str>31 rue Pouchet</str><city>75017 Paris</city><ctry>FR</ctry></adr></B731></B730><B740><B741><snm>Ipside</snm><iid>101544436</iid><adr><str>7-9 Allées Haussmann</str><city>33300 Bordeaux Cedex</city><ctry>FR</ctry></adr></B741></B740></B700><B800><B840><ctry>AL</ctry><ctry>AT</ctry><ctry>BE</ctry><ctry>BG</ctry><ctry>CH</ctry><ctry>CY</ctry><ctry>CZ</ctry><ctry>DE</ctry><ctry>DK</ctry><ctry>EE</ctry><ctry>ES</ctry><ctry>FI</ctry><ctry>FR</ctry><ctry>GB</ctry><ctry>GR</ctry><ctry>HR</ctry><ctry>HU</ctry><ctry>IE</ctry><ctry>IS</ctry><ctry>IT</ctry><ctry>LI</ctry><ctry>LT</ctry><ctry>LU</ctry><ctry>LV</ctry><ctry>MC</ctry><ctry>MK</ctry><ctry>MT</ctry><ctry>NL</ctry><ctry>NO</ctry><ctry>PL</ctry><ctry>PT</ctry><ctry>RO</ctry><ctry>RS</ctry><ctry>SE</ctry><ctry>SI</ctry><ctry>SK</ctry><ctry>SM</ctry><ctry>TR</ctry></B840><B860><B861><dnum><anum>EP2014065594</anum></dnum><date>20140721</date></B861><B862>fr</B862></B860><B870><B871><dnum><pnum>WO2015011078</pnum></dnum><date>20150129</date><bnum>201504</bnum></B871></B870></B800></SDOBI>
<description id="desc" lang="fr"><!-- EPO <DP n="1"> -->
<heading id="h0001"><b><u>DOMAINE TECHNIQUE</u></b></heading>
<p id="p0001" num="0001">L'invention concerne un procédé de suppression de la réverbération tardive d'un signal sonore. L'invention est plus particulièrement, mais non exclusivement, adaptée au domaine du traitement de la réverbération dans un espace fermé.</p>
<heading id="h0002"><b><u>ÉTAT DE LA TECHNIQUE</u></b></heading>
<p id="p0002" num="0002">La <figref idref="f0001">figure 1</figref> montre une source sonore omnidirectionnelle 100 positionnée dans un espace fermé 110, tel qu'un véhicule automobile ou une salle, ainsi qu'un microphone 120. Un signal sonore émis par la source sonore omnidirectionnelle 100 se propage dans toutes les directions. Ainsi, le signal observé au niveau du microphone est formé par la superposition de plusieurs versions retardées et atténuées du signal sonore émis par la source sonore omnidirectionnelle 100. En effet, le microphone 120 capte tout d'abord le signal source 130, encore appelé signal direct 130, mais également des signaux réfléchis 140 sur les parois de l'espace fermé 110. Les différents signaux réfléchis 140 ont parcouru des chemins acoustiques de différentes longueurs et ont été atténués par l'absorption des parois de l'espace fermé 110, la phase et l'amplitude des signaux réfléchis 140 captés par le microphone 120 sont donc différentes.</p>
<p id="p0003" num="0003">Deux types de réflexions existent, les réflexions précoces et la réverbération tardive. Le microphone 120 capte les signaux de réflexion précoce avec un faible retard par rapport au signal source 130, de l'ordre de zéro milliseconde à cinquante millisecondes. Lesdits signaux de réflexion précoce sont séparés temporellement et spatialement du signal source 130, mais l'oreille humaine ne perçoit pas ces signaux de réflexion précoce et le signal source 130 séparément grâce à un effet dit «effet de précédence ». Dans le cas où le signal sonore émis par la source sonore omnidirectionnelle 100 est un signal de parole, l'intégration temporelle des signaux de réflexion précoce par l'oreille humaine permet de mettre en relief certaines caractéristiques de la parole, ce qui favorise l'intelligibilité du signal sonore.</p>
<p id="p0004" num="0004">Selon la taille de la salle, la frontière entre les réflexions précoces et la réverbération tardive est comprise entre cinquante millisecondes et quatre-vingt<!-- EPO <DP n="2"> --> millisecondes. La réverbération tardive comprend de nombreux signaux réfléchis rapprochés dans le temps et donc impossibles à séparer. L'ensemble de ces signaux réfléchis est donc considéré dans un cadre probabiliste comme une distribution aléatoire dont la densité augmente avec le temps. Dans le cas où le signal sonore émis par la source sonore omnidirectionnelle 100 est un signal de parole, la réverbération tardive dégrade la qualité dudit signal sonore et son intelligibilité. Ladite réverbération tardive affecte également les performances de systèmes de reconnaissance de la parole et de séparation de sources sonores.</p>
<p id="p0005" num="0005">Selon l'art antérieur, un premier procédé dit « par filtrage inverse » cherche à identifier la réponse impulsionnelle de l'espace fermé 110 pour ensuite construire un filtre inverse permettant de compenser les effets de la réverbération au niveau du signal sonore.</p>
<p id="p0006" num="0006">Ce type de procédé est par exemple décrit dans les publications scientifiques suivantes : <i>«</i> <nplcit id="ncit0001" npl-type="b"><text>BWGillespie, H S Malvar, and D A F Florêncio, Speech dereverberation via maximum-kurtosis subband adaptive filtering, Proc. International Conference on Acoustics, Speech, and Signal Processing, volume 6 of ICASSP '01, pages 3701-3704. IEEE, 2001 »</text></nplcit><i>, «</i> <nplcit id="ncit0002" npl-type="s"><text>M Wu and D L Wang. A two-stage algorithm for one-microphone reverberant speech enhancement, Audio, Speech, and Language Processing, IEEE Transactions on, 14(3) :774-784, 2006</text></nplcit> <i>», «</i> <nplcit id="ncit0003" npl-type="s"><text>Saeed Mosayyebpour, Abolghasem Sayyadiyan, Mohsen Zareian, and Ali Shahbazi, Single Channel Inverse Filtering of Room Impulse Response by Maximizing Skewness of LP Residual</text></nplcit><i>. ».</i></p>
<p id="p0007" num="0007">Ce procédé exploite dans le domaine temporel des distorsions introduites par la réverbération sur des paramètres d'un modèle de prédiction linéaire du signal sonore. Partant de l'observation que la réverbération modifie surtout le résiduel du modèle de prédiction linéaire du signal sonore, un filtre maximisant les moments d'ordre supérieur dudit résiduel est construit. Ce procédé est adapté pour des réponses impulsionnelles courtes et est surtout utilisé pour compenser les signaux de réflexion précoce.</p>
<p id="p0008" num="0008">Cependant, ce procédé suppose que la réponse impulsionnelle de l'espace fermé 110 est invariante dans le temps. De plus, ce procédé ne modélise pas la réverbération tardive. Ledit procédé doit ainsi être combiné à<!-- EPO <DP n="3"> --> un autre procédé traitant la réverbération tardive. Ces deux procédés combinés nécessitent de nombreuses itérations avant d'obtenir une convergence, de sorte que lesdits procédés ne peuvent être mis en oeuvre pour une application en temps réel. En outre, le filtrage inverse introduit des artéfacts tels que des pré-échos, qui doivent ensuite être compensés.</p>
<p id="p0009" num="0009">Un deuxième procédé dit « cepstral » vise à séparer l'effet de l'espace fermé 110 et du signal sonore dans le domaine cepstral. En effet, la réverbération modifie la moyenne et la variance des cepstres des signaux réfléchis par rapport à la moyenne et la variance des cepstres du signal source 130. Ainsi, lorsque la moyenne et la variance des cepstres sont normalisées, la réverbération est atténuée.</p>
<p id="p0010" num="0010">Ce type de procédé est par exemple décrit dans la publication scientifique suivante : «<nplcit id="ncit0004" npl-type="s"><text> D Bees, M Blostein, and P Kabal, Reverberant speech enhancement using cepstral processing, ICASSP '91 Proceedings of the Acoustics, Speech, and Signal Processing, 1991</text></nplcit> <i>».</i></p>
<p id="p0011" num="0011">Ce procédé est particulièrement utile pour des problèmes de reconnaissance vocale puisque les bases de données de référence des systèmes de reconnaissance peuvent également être normalisées pour se rapprocher des signaux captés par le microphone 120. Cependant, les effets de l'espace fermé 110 et du signal sonore ne sont pas complètement séparables dans le domaine cepstral. La mise en oeuvre du procédé provoque donc une distorsion du timbre du signal sonore émis par la source sonore omnidirectionnelle 100. En outre, ce procédé traite les réflexions précoces plutôt que la réverbération tardive.</p>
<p id="p0012" num="0012">Un troisième procédé dit « par estimation de la densité spectrale de puissance de la réverbération tardive » permet d'établir un modèle paramétrique de la réverbération tardive.</p>
<p id="p0013" num="0013">Ce type de procédé est par exemple décrit dans les publications scientifiques suivantes : « <nplcit id="ncit0005" npl-type="b"><text>E.A.P Habets, Single- and Multi-Microphone Speech Dereverberation using Spectral Enhancement, PhD thesis, Technische Universiteit Eindhoven, 2007</text></nplcit> <i>», «</i> <nplcit id="ncit0006" npl-type="b"><text>T. Yoshioka, Speech Enhancement, Reverberant Environments, PhD thesis, 2010</text></nplcit> <i>».</i></p>
<p id="p0014" num="0014">Selon ce troisième procédé, une estimation de la densité spectrale de<!-- EPO <DP n="4"> --> puissance de la réverbération tardive permet de construire un filtre de soustraction spectrale pour la déréverbération. La soustraction spectrale introduit des artéfacts, comme du bruit musical mais lesdits artéfacts peuvent être limités en appliquant des schémas de filtrage plus complexes, utilisés par des procédés de débruitage.</p>
<p id="p0015" num="0015">Cependant, un paramètre important pour estimer la densité spectrale de puissance de la réverbération tardive dans le cadre de ce troisième procédé est le temps de réverbération. Or, le temps de réverbération est un paramètre difficile à estimer avec précision. L'estimation du temps de réverbération est faussée par le bruit de fond et d'autres signaux sonores qui interfèrent. En outre, cette estimation du temps de réverbération est chronophage et donc allonge le temps d'exécution.</p>
<p id="p0016" num="0016">Un quatrième procédé exploite la parcimonie des signaux de parole dans le plan temps/fréquence.</p>
<p id="p0017" num="0017">Ce type de procédé est par exemple décrit dans la publication scientifique suivante : <i>«</i> <nplcit id="ncit0007" npl-type="b"><text>T. Yoshioka, Speech Enhancement in Reverberant Environments, PhD thesis, 2010</text></nplcit> <i>».</i></p>
<p id="p0018" num="0018">Dans cette publication, la réverbération tardive est modélisée comme une version retardée et atténuée de l'observation courante dont le facteur d'atténuation est déterminé par résolution d'un problème de maximum de vraisemblance, avec une contrainte de parcimonie.</p>
<p id="p0019" num="0019">Ce type de procédé est en outre décrit dans la publication scientifique suivante : <i>«</i><nplcit id="ncit0008" npl-type="b"><text> H Kameoka, T Nakatani, and T Yoshioka, Robust speech dereverberation based on nonnegativity and sparse nature of speech spectrograms, Proceedings of the 2009 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP '09, pages 45-48. IEEE Computer Society, 2009</text></nplcit> <i>».</i></p>
<p id="p0020" num="0020">La déréverbération est abordée dans cette publication comme un problème de déconvolution par factorisation en matrices non négatives, ce qui permet de séparer la réponse de l'espace fermé 110 et le signal sonore. Cependant, ce procédé introduit beaucoup de bruit et de distorsions. En outre, ledit procédé dépend de l'initialisation des matrices pour la factorisation.<!-- EPO <DP n="5"> --></p>
<p id="p0021" num="0021">De plus, les procédés cités nécessitent une pluralité de microphones pour traiter avec précision la réverbération.</p>
<heading id="h0003"><b><u>EXPOSÉ DE L'INVENTION</u></b></heading>
<p id="p0022" num="0022">L'invention a notamment pour but de résoudre tout ou partie des problèmes susmentionnés.</p>
<p id="p0023" num="0023">A cette fin, l'invention concerne un procédé de suppression de la réverbération tardive d'un signal sonore caractérisé en ce qu'il comporte les étapes suivantes :
<ul id="ul0001" list-style="bullet" compact="compact">
<li>captation d'un signal d'entrée formé par la superposition de plusieurs versions retardées et atténuées du signal sonore,</li>
<li>application d'une transformation temps-fréquence au signal d'entrée afin d'obtenir une transformée temps-fréquence complexe du signal d'entrée,</li>
<li>calcul d'une pluralité de vecteurs de prédiction,</li>
<li>création d'une pluralité de vecteurs d'observation à partir du module de la transformée temps-fréquence complexe du signal d'entrée,</li>
<li>construction d'une pluralité de dictionnaires de synthèse à partir de la pluralité de vecteurs d'observations,</li>
<li>estimation d'un spectre de réverbération tardive à partir de la pluralité de dictionnaires de synthèse et de la pluralité de vecteurs de prédiction,</li>
<li>filtrage de la pluralité de vecteurs d'observations afin d'éliminer le spectre de réverbération tardive et d'obtenir un module de signal déréverbéré.</li>
</ul></p>
<p id="p0024" num="0024">Ainsi, le procédé objet de l'invention est rapide et présente une complexité réduite. Ledit procédé est donc utilisable en temps réel. De plus, ce procédé n'introduit pas d'artéfacts et est robuste au bruit de fond. En outre, ledit procédé réduit le bruit de fond et est compatible avec des procédés de réduction de bruit.</p>
<p id="p0025" num="0025">L'invention peut être mise en oeuvre selon les modes de réalisation<!-- EPO <DP n="6"> --> avantageux exposés ci-après, lesquels peuvent être considérés individuellement ou selon toute combinaison techniquement opérante.</p>
<p id="p0026" num="0026">Avantageusement, le procédé comporte en outre les étapes suivantes :
<ul id="ul0002" list-style="bullet" compact="compact">
<li>création d'un module sous échantillonné en fréquence à partir du module de la transformée temps-fréquence complexe du signal d'entrée,</li>
<li>création d'une pluralité de vecteurs d'observation sous échantillonnés à partir dudit module sous échantillonné en fréquence,</li>
<li>construction d'une pluralité de dictionnaires d'analyse à partir de la pluralité de vecteurs d'observation sous échantillonnés,</li>
<li>calcul de la pluralité de vecteurs de prédiction à partir de la pluralité de vecteurs d'observation sous échantillonnés et de la pluralité de dictionnaires d'analyse.</li>
</ul></p>
<p id="p0027" num="0027">Avantageusement, l'étape de calcul de la pluralité de vecteurs de prédiction est effectuée en minimisant, pour chaque vecteur de prédiction, l'expression ∥<i>X̃v - D<sup>a</sup>α</i>∥<sub>2</sub>, qui est la norme euclidienne de la différence entre le vecteur d'observation sous échantillonné associé audit vecteur de prédiction et du dictionnaire d'analyse associé audit vecteur de prédiction multiplié par ledit vecteur de prédiction, en tenant compte de la contrainte ∥<i>α</i>∥<sub>1</sub> ≤ <i>λ</i>, selon laquelle la norme 1 dudit vecteur de prédiction est inférieure ou égale à un paramètre d'intensité maximale de la réverbération tardive.</p>
<p id="p0028" num="0028">Avantageusement, la valeur du paramètre d'intensité maximale de la réverbération tardive est comprise entre 0 et 1.</p>
<p id="p0029" num="0029">Avantageusement, le procédé comporte en outre l'étape suivante :
<ul id="ul0003" list-style="bullet" compact="compact">
<li>création d'un signal complexe déréverbéré à partir du module de signal déréverbéré et de la phase de la transformée temps-fréquence complexe du signal d'entrée.</li>
</ul></p>
<p id="p0030" num="0030">Avantageusement, le procédé comporte en outre l'étape suivante :<!-- EPO <DP n="7"> -->
<ul id="ul0004" list-style="bullet" compact="compact">
<li>application d'une transformation fréquence-temps au signal complexe déréverbéré afin d'obtenir un signal temporel déréverbéré.</li>
</ul></p>
<p id="p0031" num="0031">Avantageusement, le procédé comporte en outre une étape de construction d'un filtre de déréverbération selon le modèle <maths id="math0001" num=""><math display="block"><mrow><mi>G</mi><mo>=</mo><mfrac><mi>ξ</mi><mrow><mn>1</mn><mo>+</mo><mi>ξ</mi></mrow></mfrac><mi>exp</mi><mfenced><mrow><mstyle displaystyle="false"><mrow><msubsup><mrow><mo>∫</mo></mrow><mi>υ</mi><mi>∞</mi></msubsup></mrow></mstyle><mrow><mfrac><mrow><msup><mi>e</mi><mrow><mo>−</mo><mi>t</mi></mrow></msup></mrow><mi>t</mi></mfrac><mi mathvariant="italic">dt</mi></mrow></mrow></mfenced><mo>,</mo></mrow></math><img id="ib0001" file="imgb0001.tif" wi="46" he="13" img-content="math" img-format="tif"/></maths> où <i>ξ</i> est le rapport signal à bruit a priori, et où la borne d'intégration <i>υ</i> est calculée selon le modèle <maths id="math0002" num=""><math display="block"><mrow><mi>υ</mi><mo>=</mo><mi>γ</mi><mfrac><mi>ξ</mi><mrow><mn>1</mn><mo>+</mo><mi>ξ</mi></mrow></mfrac></mrow></math><img id="ib0002" file="imgb0002.tif" wi="23" he="12" img-content="math" img-format="tif"/></maths> où <i>γ</i> est le rapport signal à bruit a postériori.</p>
<p id="p0032" num="0032">L'invention concerne également un dispositif de suppression de la réverbération tardive d'un signal sonore caractérisé en ce qu'il comporte des moyens pour :
<ul id="ul0005" list-style="bullet" compact="compact">
<li>capter un signal d'entrée formé par la superposition de plusieurs versions retardées et atténuées du signal sonore,</li>
<li>appliquer une transformation temps-fréquence au signal d'entrée afin d'obtenir une transformée temps-fréquence complexe du signal d'entrée,</li>
<li>calculer une pluralité de vecteurs de prédiction,</li>
<li>créer une pluralité de vecteurs d'observation à partir du module de la transformée temps-fréquence complexe du signal d'entrée,</li>
<li>construire une pluralité de dictionnaires de synthèse à partir de la pluralité de vecteurs d'observations,</li>
<li>estimer un spectre de réverbération tardive à partir de la pluralité de dictionnaires de synthèse et de la pluralité de vecteurs de prédiction,</li>
<li>filtrer la pluralité de vecteurs d'observations afin d'éliminer le spectre de réverbération tardive et d'obtenir un module de signal déréverbéré.</li>
</ul><!-- EPO <DP n="8"> --></p>
<heading id="h0004"><b><u>PRÉSENTATION DES FIGURES</u></b></heading>
<p id="p0033" num="0033">L'invention sera mieux comprise à la lecture de la description suivante, donnée à titre d'exemple nullement limitatif, et faite en se référant aux figures qui représentent :
<ul id="ul0006" list-style="dash" compact="compact">
<li><figref idref="f0001">Figure 1</figref> (déjà décrite) : une représentation schématique d'une source sonore omnidirectionnelle et d'un microphone positionnés dans un espace fermé selon un exemple de réalisation de l'invention ;</li>
<li><figref idref="f0001">Figure 2</figref> : une représentation schématique d'un dispositif de déréverbération d'un signal sonore selon un exemple de réalisation de l'invention ;</li>
<li><figref idref="f0001">Figure 3</figref> : une représentation schématique d'une unité de déréverbération d'un dispositif de déréverbération d'un signal sonore selon un exemple de réalisation de l'invention ;</li>
<li><figref idref="f0001">Figure 4</figref> : une représentation schématique d'une unité d'estimation de la réverbération tardive d'un dispositif de déréverbération d'un signal sonore selon un exemple de réalisation de l'invention ;</li>
<li><figref idref="f0002">Figure 5</figref> : une représentation schématique d'un regroupement en sous bandes d'un module d'une transformée temps-fréquence complexe d'un signal d'entrée selon un exemple de réalisation de l'invention ;</li>
<li><figref idref="f0002">Figure 6</figref> : une représentation schématique d'une unité de calcul de vecteurs de prédiction d'un dispositif de déréverbération d'un signal sonore selon un exemple de réalisation de l'invention ;</li>
<li><figref idref="f0002">Figure 7</figref> : une représentation schématique d'une unité de calcul de vecteurs de prédiction d'un dispositif de déréverbération d'un signal sonore selon un exemple de réalisation de l'invention ;</li>
<li><figref idref="f0002">Figure 8</figref> : une représentation schématique d'une unité d'évaluation de la réverbération d'un dispositif de déréverbération d'un signal sonore selon un exemple de réalisation de l'invention ;</li>
<li><figref idref="f0003">Figure 9</figref> : un diagramme fonctionnel montrant différentes étapes du procédé selon un exemple de réalisation de l'invention.</li>
</ul></p>
<p id="p0034" num="0034">Dans ces figures, des références identiques d'une figure à une autre<!-- EPO <DP n="9"> --> désignent des éléments identiques ou analogues. Pour des raisons de clarté, les éléments représentés ne sont pas à l'échelle, sauf mention contraire.</p>
<heading id="h0005"><b><u>DESCRIPTION DÉTAILLÉE DE MODES DE RÉALISATION</u></b></heading>
<p id="p0035" num="0035">L'invention met en oeuvre un dispositif de déréverbération d'un signal sonore émis par une source sonore omnidirectionnelle 100 positionnée dans un espace fermé 110, tel qu'un véhicule automobile ou une salle, et capté par un microphone 120. Ledit dispositif de déréverbération est inséré dans la chaîne de traitement audio d'un appareil tel qu'un téléphone. Ce dispositif de déréverbération comporte une unité d'application d'une transformée temps-fréquence 200, une unité de déréverbération 210 et une unité d'application d'une transformée fréquence-temps 220 (cf. <figref idref="f0001">figure 2</figref>). L'unité de déréverbération 210 comporte une unité d'estimation de la réverbération tardive 300 et une unité de filtrage 310 (cf. <figref idref="f0001">figure 3</figref>). L'unité d'estimation de la réverbération tardive 300 comporte une unité de regroupement en sous bandes 400, une unité de calcul de vecteurs de prédiction 410 et une unité d'évaluation de la réverbération 420 (cf. <figref idref="f0001">figure 4</figref>). L'unité de calcul de vecteurs de prédiction 410 comporte une unité de construction d'observations 700, une unité de construction de dictionnaires d'analyse 710 et une unité de résolution du LASSO 720 (cf. <figref idref="f0002">figure 7</figref>). L'unité d'évaluation de la réverbération 420 comporte une unité de construction de dictionnaires de synthèse 800 (cf. <figref idref="f0002">figure 8</figref>).</p>
<p id="p0036" num="0036">Dans une étape 900, un microphone 120 capte un signal d'entrée <i>x</i>(<i>t</i>) formé par la superposition de plusieurs versions retardées et atténuées du signal sonore émis par la source sonore omnidirectionnelle 100. En effet, le microphone 120 capte tout d'abord le signal source 130, encore appelé signal direct 130, mais également des signaux réfléchis 140 sur les parois de l'espace fermé 110. Les différents signaux réfléchis 140 ont parcouru des chemins acoustiques de différentes longueurs et ont été atténués par l'absorption des parois de l'espace fermé 110, la phase et l'amplitude des signaux réfléchis 140 captés par le microphone 120 sont donc différentes.</p>
<p id="p0037" num="0037">Deux types de réflexions existent, les réflexions précoces et la réverbération tardive. Le microphone 120 capte les signaux de réflexion<!-- EPO <DP n="10"> --> précoce avec un faible retard par rapport au signal source 130, de l'ordre de zéro milliseconde à cinquante millisecondes. Lesdits signaux de réflexion précoce sont séparés temporellement et spatialement du signal source 130 mais l'oreille humaine ne perçoit pas ces signaux de réflexion précoce et le signal source 130 séparément grâce à un effet dit « effet de précédence ». Dans le cas où le signal sonore émis par la source sonore omnidirectionnelle 100 est un signal de parole, l'intégration temporelle des signaux de réflexion précoce par l'oreille humaine permet de mettre en relief certaines caractéristiques de la parole, ce qui favorise l'intelligibilité du signal sonore.</p>
<p id="p0038" num="0038">Le microphone 120 capte la réverbération tardive entre cinquante millisecondes et quatre-vingts millisecondes après l'arrivée du signal source 130. La réverbération tardive comprend de nombreux signaux réfléchis rapprochés dans le temps et donc impossibles à séparer. L'ensemble de ces signaux réfléchis est donc considéré dans un cadre probabiliste comme une distribution aléatoire dont la densité augmente avec le temps. Dans le cas où le signal sonore émis par la source sonore omnidirectionnelle 100 est un signal de parole, la réverbération tardive dégrade la qualité dudit signal sonore et son intelligibilité. Ladite réverbération tardive affecte également les performances de systèmes de reconnaissance de la parole et de séparation de sources sonores.</p>
<p id="p0039" num="0039">Le signal d'entrée <i>x</i>(<i>t</i>) est échantillonné à une fréquence d'échantillonnage <i>f<sub>s</sub></i>. Le signal d'entrée <i>x</i>(<i>t</i>) est ainsi subdivisé en échantillons. Afin de supprimer la réverbération tardive dudit signal d'entrée <i>x(t),</i> la densité spectrale de puissance de la réverbération tardive est estimée puis un filtre de déréverbération est construit par l'unité de déréverbération 210. L'estimation de la densité spectrale de puissance de la réverbération tardive, la construction du filtre de déréverbération et l'application dudit filtre de déréverbération sont effectués dans le domaine fréquentiel. Ainsi, dans une étape 901, une transformation temps-fréquence est appliquée au signal d'entrée <i>x</i>(<i>t</i>) par l'unité d'application de la Transformée de Fourier à Court Terme 200 afin d'obtenir une transformée temps-fréquence complexe du signal d'entrée <i>x</i>(<i>t</i>) notée <i>X<sup>C</sup></i>(cf. <figref idref="f0001">figure 2</figref>). Dans un exemple, la transformation<!-- EPO <DP n="11"> --> temps-fréquence est une Transformation de Fourier à Court Terme.</p>
<p id="p0040" num="0040">Chaque élément <maths id="math0003" num=""><math display="inline"><mrow><msubsup><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mi>C</mi></msubsup></mrow></math><img id="ib0003" file="imgb0003.tif" wi="7" he="6" img-content="math" img-format="tif" inline="yes"/></maths> de la transformée temps-fréquence complexe <i>X<sup>C</sup></i> est calculé de la façon suivante : <maths id="math0004" num=""><math display="block"><mrow><msubsup><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mi>C</mi></msubsup><mo>=</mo><mrow><mstyle displaystyle="true"><mrow><munderover><mrow><mo>∑</mo></mrow><mrow><mi>m</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>M</mi><mo>−</mo><mn>1</mn></mrow></munderover></mrow></mstyle><mrow><mi>x</mi><mfenced separators=""><mi>m</mi><mo>+</mo><mi mathvariant="italic">nR</mi></mfenced><mi>w</mi><mfenced><mi>m</mi></mfenced><msup><mi>e</mi><mrow><mo>−</mo><mfrac><mrow><mn>2</mn><mi mathvariant="italic">jπkm</mi></mrow><mi>M</mi></mfrac></mrow></msup></mrow></mrow></mrow></math><img id="ib0004" file="imgb0004.tif" wi="56" he="12" img-content="math" img-format="tif"/></maths> où k est un indice fréquentiel d'échantillonnage de valeur comprise entre 1 et un nombre K, n est un indice temporel de valeur comprise entre 1 et un nombre N, w(m) est une fenêtre glissante d'analyse, m est l'indice des éléments appartenant à une trame, M est la longueur d'une trame, c'est-à-dire le nombre d'échantillons d'une trame et R est le pas d'avancement de la transformation temps-fréquence.</p>
<p id="p0041" num="0041">Le signal d'entrée <i>x</i>(<i>t</i>) est analysé par trames de longueur M avec un pas d'avancement R égal à M/4 échantillons. Pour chaque trame du signal d'entrée <i>x</i>(<i>t</i>) dans le domaine temporel une transformée temps-fréquence Discrète d'indice fréquentiel d'échantillonnage k et d'indice temporel n est ainsi calculée grâce à l'algorithme de la transformation temps-fréquence pour obtenir un signal complexe <maths id="math0005" num=""><math display="inline"><mrow><msubsup><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mi>C</mi></msubsup></mrow></math><img id="ib0005" file="imgb0005.tif" wi="7" he="6" img-content="math" img-format="tif" inline="yes"/></maths> défini par <maths id="math0006" num=""><math display="block"><mrow><msubsup><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mi>C</mi></msubsup><mo>=</mo><mfenced open="|" close="|"><msub><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub></mfenced><msup><mi>e</mi><mrow><mo>−</mo><mi>j</mi><mo>∠</mo><msub><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub></mrow></msup><mo>,</mo></mrow></math><img id="ib0006" file="imgb0006.tif" wi="35" he="8" img-content="math" img-format="tif"/></maths> où |<i>X<sub>k,n</sub></i>| est le module du signal complexe <maths id="math0007" num=""><math display="inline"><mrow><msubsup><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mi>C</mi></msubsup></mrow></math><img id="ib0007" file="imgb0007.tif" wi="8" he="6" img-content="math" img-format="tif" inline="yes"/></maths> et <i>∠X<sub>k,n</sub></i> est la phase du signal complexe <maths id="math0008" num=""><math display="inline"><mrow><msubsup><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mi>C</mi></msubsup><mn>.</mn></mrow></math><img id="ib0008" file="imgb0008.tif" wi="8" he="6" img-content="math" img-format="tif" inline="yes"/></maths></p>
<p id="p0042" num="0042">L'estimation de la densité spectrale de puissance de la réverbération tardive est réalisée sur le module de la transformée temps-fréquence complexe du signal d'entrée <i>X<sup>C</sup>,</i> noté <i>X</i>. La phase du transformée temps-fréquence complexe <i>X<sup>C</sup>,</i> notée <i>∠X</i> est gardée en mémoire et est utilisée pour reconstruire un signal déréverbéré dans le domaine temporel après application du filtre de déréverbération.</p>
<p id="p0043" num="0043">Le module <i>X</i> de la transformée temps-fréquence complexe du signal d'entrée <i>X<sup>C</sup></i> est ensuite regroupé en sous bandes. Plus précisément, ledit module <i>X</i> comporte le nombre K de lignes spectrales notées <i>X<sub>k</sub>.</i> Le terme "ligne spectrale" désigne ici tous les échantillons du module <i>X</i> de la<!-- EPO <DP n="12"> --> transformée temps-fréquence complexe du signal d'entrée <i>X<sup>C</sup></i> pour l'indice fréquentiel d'échantillonnage k et tous les indices temporels n. Dans une étape 903, l'unité de regroupement en sous bandes 400 regroupe les K lignes spectrales <i>X<sub>k</sub></i> en un nombre J de sous bandes, afin d'obtenir un module sous échantillonné en fréquence noté <i>X̃</i> comportant un nombre J de lignes spectrales notées <i>X̃<sub>j</sub></i>, où j est un indice fréquentiel de sous échantillonnage compris entre 1 et le nombre J. Le nombre J est inférieur au nombre K. Chaque sous bande comporte ainsi une pluralité de lignes spectrales <i>X<sub>k</sub>,</i> l'indice fréquentiel k appartenant à un intervalle ayant une borne inférieure <i>b<sub>j</sub></i> et une borne supérieure <i>e<sub>j</sub></i>. Dans un exemple, chaque sous bande correspond à un octave afin de prendre en compte le modèle de perception sonore de l'oreille humaine. Ensuite, dans une étape 904, l'unité de regroupement en sous bandes 400 calcule, pour chaque sous bande, une moyenne Mean des lignes spectrales <i>X<sub>k</sub></i> de ladite sous bande afin d'obtenir les J lignes spectrales <i>X̃<sub>i</sub></i> du module sous échantillonné en fréquence <i>X̃</i> (cf. <figref idref="f0002">figure 5</figref>).</p>
<p id="p0044" num="0044">Ensuite, l'unité de calcul de vecteurs de prédiction 410 calcule pour chaque ligne spectrale <i>X̃<sub>j</sub></i> du module sous échantillonné en fréquence <i>X̃</i> et pour chaque indice temporel n un vecteur de prédiction <i>α<sub>j,n</sub></i> (cf. <figref idref="f0002">figure 6</figref>). Plus précisément, dans une étape 905, l'unité de construction d'observation 700 construit, pour chaque indice temporel n et indice fréquentiel j de sous échantillonnage, un vecteur d'observation sous échantillonné <i>X̃v<sub>j,n</sub></i> à partir de l'ensemble des échantillons <i>X̃</i><sub><i>j</i>,<i>n</i>1:<i>n</i></sub> appartenant à la j-ième ligne spectrale <i>X̃<sub>j</sub></i> du module sous échantillonné en fréquence <i>X̃</i> et compris entre les instants <i>n</i><sub>1</sub>=<i>n-N</i>+1 et <i>n,</i> où <i>n</i> est l'indice de l'instant courant et <i>n-n</i><sub>1</sub> est la taille de la mémoire du dispositif de déréverbération. Chaque vecteur d'observation sous échantillonné <i>X̃v<sub>j,n</sub></i> est définit par <maths id="math0009" num=""><math display="block"><mrow><mover><mi>X</mi><mrow><mo>˜</mo></mrow></mover><msub><mi>v</mi><mrow><mi>j</mi><mo>,</mo><mi>n</mi></mrow></msub><mo>:</mo><mo>=</mo><msup><mfenced open="[" close="]" separators=""><msub><mrow><mover><mi>X</mi><mrow><mo>˜</mo></mrow></mover></mrow><mrow><mi>j</mi><mo>,</mo><mi>n</mi></mrow></msub><mo>…</mo><msub><mrow><mover><mi>X</mi><mrow><mo>˜</mo></mrow></mover></mrow><mrow><mi>j</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>N</mi><mo>+</mo><mn>1</mn></mrow></msub></mfenced><mi>T</mi></msup><mo>,</mo></mrow></math><img id="ib0009" file="imgb0009.tif" wi="44" he="8" img-content="math" img-format="tif"/></maths></p>
<p id="p0045" num="0045">Chaque vecteur d'observation <i>X̃v<sub>j,n</sub></i> est de taille <i>N</i>×1, où le nombre N est la longueur de l'observation. La longueur de l'observation N est le nombre<!-- EPO <DP n="13"> --> de trames de la transformation temps-fréquence nécessaires pour l'estimation de la réverbération tardive. La longueur de l'observation N permet de définir la résolution temporelle de l'estimation. Quand la longueur de l'observation N augmente, la complexité du système diminue. Le sous-échantillonnage du module <i>X</i> de la transformée temps-fréquence complexe du signal d'entrée <i>X<sup>C</sup></i> permet entre autre l'application du procédé en temps réel.</p>
<p id="p0046" num="0046">Dans une étape 906, l'unité de construction de dictionnaires d'analyse 710 construit des dictionnaires d'analyse <i>D<sup>a</sup>.</i> Plus précisément, pour chaque indice temporel n et indice fréquentiel de sous échantillonnage j, un dictionnaire d'analyse <maths id="math0010" num=""><math display="inline"><mrow><msubsup><mi>D</mi><mrow><mi>j</mi><mo>,</mo><mi>n</mi></mrow><mi>a</mi></msubsup></mrow></math><img id="ib0010" file="imgb0010.tif" wi="7" he="6" img-content="math" img-format="tif" inline="yes"/></maths> est construit en concaténant un nombre L de vecteurs d'observations passées déterminés à l'étape 905. Le dictionnaire d'analyse <maths id="math0011" num=""><math display="inline"><mrow><msubsup><mi>D</mi><mrow><mi>j</mi><mo>,</mo><mi>n</mi></mrow><mi>a</mi></msubsup></mrow></math><img id="ib0011" file="imgb0011.tif" wi="7" he="6" img-content="math" img-format="tif" inline="yes"/></maths> se définit ainsi comme la matrice <maths id="math0012" num=""><math display="block"><mrow><msubsup><mi>D</mi><mrow><mi>j</mi><mo>,</mo><mi>n</mi></mrow><mi>a</mi></msubsup><mo>:</mo><mo>=</mo><mfenced open="[" close="]"><mtable><mtr><mtd><msub><mrow><mover><mi>X</mi><mrow><mo>˜</mo></mrow></mover></mrow><mrow><mi>j</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi></mrow></msub></mtd><mtd><msub><mrow><mover><mi>X</mi><mrow><mo>˜</mo></mrow></mover></mrow><mrow><mi>j</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mn>1</mn></mrow></msub></mtd><mtd><mo>⋯</mo></mtd><mtd><msub><mrow><mover><mi>X</mi><mrow><mo>˜</mo></mrow></mover></mrow><mrow><mi>j</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mi>L</mi><mo>+</mo><mn>1</mn></mrow></msub></mtd></mtr><mtr><mtd><msub><mrow><mover><mi>X</mi><mrow><mo>˜</mo></mrow></mover></mrow><mrow><mi>j</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mn>1</mn></mrow></msub></mtd><mtd><msub><mrow><mover><mi>X</mi><mrow><mo>˜</mo></mrow></mover></mrow><mrow><mi>j</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mn>2</mn></mrow></msub></mtd><mtd><mo>⋯</mo></mtd><mtd><msub><mrow><mover><mi>X</mi><mrow><mo>˜</mo></mrow></mover></mrow><mrow><mi>j</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mi>L</mi></mrow></msub></mtd></mtr><mtr><mtd><mo>⋮</mo></mtd><mtd><mo>⋮</mo></mtd><mtd><mo>⋮</mo></mtd><mtd><mo>⋮</mo></mtd></mtr><mtr><mtd><msub><mrow><mover><mi>X</mi><mrow><mo>˜</mo></mrow></mover></mrow><mrow><mi>j</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mi>N</mi><mo>+</mo><mn>1</mn></mrow></msub></mtd><mtd><msub><mrow><mover><mi>X</mi><mrow><mo>˜</mo></mrow></mover></mrow><mrow><mi>j</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mi>N</mi></mrow></msub></mtd><mtd><mo>⋯</mo></mtd><mtd><msub><mrow><mover><mi>X</mi><mrow><mo>˜</mo></mrow></mover></mrow><mrow><mi>j</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mi>L</mi><mo>−</mo><mi>N</mi><mo>+</mo><mn>2</mn></mrow></msub></mtd></mtr></mtable></mfenced></mrow></math><img id="ib0012" file="imgb0012.tif" wi="83" he="27" img-content="math" img-format="tif"/></maths> où L est le nombre de vecteurs d'observations passées et donc la taille du dictionnaire d'analyse <maths id="math0013" num=""><math display="inline"><mrow><msubsup><mi>D</mi><mrow><mi>j</mi><mo>,</mo><mi>n</mi></mrow><mi>a</mi></msubsup><mo>,</mo></mrow></math><img id="ib0013" file="imgb0013.tif" wi="9" he="6" img-content="math" img-format="tif" inline="yes"/></maths> et <maths id="math0014" num=""><math display="inline"><mrow><mi mathvariant="normal">δ</mi><mo>∈</mo><mi mathvariant="double-struck">R</mi><mo>*</mo></mrow></math><img id="ib0014" file="imgb0014.tif" wi="15" he="5" img-content="math" img-format="tif" inline="yes"/></maths> est le retard du dictionnaire d'analyse <maths id="math0015" num=""><math display="inline"><mrow><msubsup><mi>D</mi><mrow><mi>j</mi><mo>,</mo><mi>n</mi></mrow><mi>a</mi></msubsup><mn>.</mn></mrow></math><img id="ib0015" file="imgb0015.tif" wi="9" he="6" img-content="math" img-format="tif" inline="yes"/></maths> Plus précisément, le retard δ est le retard de trames entre le vecteur d'observation courante sous échantillonné <i>X̃v<sub>j,n</sub></i> et les autres vecteurs d'observations sous échantillonnés appartenant au dictionnaire d'analyse <maths id="math0016" num=""><math display="inline"><mrow><msubsup><mi>D</mi><mrow><mi>j</mi><mo>,</mo><mi>n</mi></mrow><mi>a</mi></msubsup><mn>.</mn></mrow></math><img id="ib0016" file="imgb0016.tif" wi="9" he="5" img-content="math" img-format="tif" inline="yes"/></maths> Ledit retard δ permet de réduire les distorsions introduites par le procédé. Ce retard δ permet en outre de d'améliorer la séparation de la réverbération tardive et des réflexions précoces. Pour calculer le vecteur d'observation courante <i>X̃v<sub>j,n</sub></i> et le dictionnaire d'analyse <maths id="math0017" num=""><math display="inline"><mrow><msubsup><mi>D</mi><mrow><mi>j</mi><mo>,</mo><mi>n</mi></mrow><mi>a</mi></msubsup></mrow></math><img id="ib0017" file="imgb0017.tif" wi="8" he="6" img-content="math" img-format="tif" inline="yes"/></maths> et donc le vecteur de prédiction <i>α<sub>j,n</sub></i> pour chaque ligne spectrale <i>X̃<sub>j</sub></i> et pour chaque indice temporel n, un nombre L+N+δ de trames doit être gardé en mémoire.</p>
<p id="p0047" num="0047">Dans une étape 907, l'unité de résolution du LASSO 720 résout un problème appelé "LASSO" qui est de minimiser la norme euclidienne <maths id="math0018" num=""><math display="inline"><mrow><msub><mrow><mo>‖</mo><mover><mi>X</mi><mrow><mo>˜</mo></mrow></mover><msub><mi>v</mi><mrow><mi>j</mi><mo>,</mo><mi>n</mi></mrow></msub><mo>−</mo><msubsup><mi>D</mi><mrow><mi>j</mi><mo>,</mo><mi>n</mi></mrow><mi>a</mi></msubsup><msub><mi>α</mi><mrow><mi>j</mi><mo>,</mo><mi>n</mi></mrow></msub><mo>‖</mo></mrow><mn>2</mn></msub></mrow></math><img id="ib0018" file="imgb0018.tif" wi="32" he="8" img-content="math" img-format="tif" inline="yes"/></maths> en tenant compte de la contrainte ∥<i>α<sub>j,n</sub></i>∥ ≤ <i>λ</i> où <i>λ</i> est un<!-- EPO <DP n="14"> --> paramètre d'intensité maximale. Pour résoudre ledit problème, la meilleure combinaison linéaire des L vecteurs du dictionnaire permettant d'approcher l'observation courante doit être trouvée. Dans un exemple, un procédé connu, appelé LARS, selon l'acronyme anglo-saxon de "Least Angle Regression" permet de résoudre ledit problème. La contrainte ∥<i>α<sub>j,n</sub></i>∥<sub>1</sub> ≤ <i>λ</i> permet de privilégier les solutions ayant peu d'éléments non nuls, c'est-à-dire les solutions parcimonieuses. Le paramètre d'intensité maximale λ permet de régler l'intensité maximale estimée de la réverbération tardive. Ce paramètre d'intensité maximale λ dépend <i>a priori</i> de l'environnement acoustique, c'est-à-dire dans un exemple de l'espace fermé 110. Pour chaque espace fermé 110, une valeur optimale du paramètre d'intensité maximale λ existe. Cependant, des essais ont montré que ledit paramètre d'intensité maximale λ peut être fixé à une valeur identique pour tous les espaces fermés 110, sans que ladite valeur introduise de dégradations par rapport à la valeur optimale. Ainsi le procédé fonctionne dans une grande variété d'espaces fermés 110 sans nécessiter de réglage particulier, ce qui permet de s'affranchir des erreurs d'estimation du temps de réverbération de l'espace fermé 110. En outre, le procédé selon l'invention ne nécessite pas de paramètre devant être estimé, ce qui permet l'application dudit procédé en temps réel. La valeur du paramètre d'intensité maximale λ est comprise entre 0 et 1. Dans un exemple, la valeur du paramètre d'intensité maximale λ est égale à 0,5, ce qui est un bon compromis entre la réduction de la réverbération et la qualité globale du procédé.</p>
<p id="p0048" num="0048">Dans une étape 908, pour chaque indice temporel n et chaque indice fréquentiel d'échantillonnage k, un vecteur d'observation courante <i>Xv<sub>k,n</sub></i> est créé à partir de l'ensemble des échantillons appartenant à la k-ième ligne spectrale <i>X<sub>k</sub></i> du module <i>X</i> de la transformée temps-fréquence complexe et compris entre les instants <i>n</i><sub>1</sub> et <i>n,</i> noté <i>X</i><sub><i>k,n1</i>:<i>n</i></sub> où <i>n</i> est l'indice d'instant courant et <i>n - n</i><sub>1</sub> est la taille de la mémoire du dispositif de déréverbération. Chaque vecteur d'observation <i>Xv<sub>k,n</sub></i> est définit par la formule <i>Xv<sub>k,n</sub></i> := [<i>X<sub>k,n</sub></i>...<i>X</i><sub><i>k,n-N</i>+1</sub>]<i><sup>T</sup></i>, et est de taille <i>N</i> × 1, où N est la longueur de l'observation.<!-- EPO <DP n="15"> --></p>
<p id="p0049" num="0049">Dans une étape 909, l'unité de construction d'un dictionnaire de synthèse 800 construit un dictionnaire de synthèse <i>D<sup>s</sup></i>. Plus précisément, pour chaque indice temporel n et chaque indice fréquentiel d'échantillonnage k, le dictionnaire de synthèse <maths id="math0019" num=""><math display="inline"><mrow><msubsup><mi>D</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mi>s</mi></msubsup></mrow></math><img id="ib0019" file="imgb0019.tif" wi="8" he="6" img-content="math" img-format="tif" inline="yes"/></maths> est construit en concaténant un nombre L de vecteurs d'observations passées déterminés à l'étape 908. Le dictionnaire de synthèse <maths id="math0020" num=""><math display="inline"><mrow><msubsup><mi>D</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mi>s</mi></msubsup></mrow></math><img id="ib0020" file="imgb0020.tif" wi="8" he="6" img-content="math" img-format="tif" inline="yes"/></maths> se définit ainsi comme la matrice <maths id="math0021" num=""><math display="block"><mrow><msubsup><mi>D</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mi>s</mi></msubsup><mo>:</mo><mo>=</mo><mfenced open="[" close="]"><mtable><mtr><mtd><msub><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi></mrow></msub></mtd><mtd><msub><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mn>1</mn></mrow></msub></mtd><mtd><mo>⋯</mo></mtd><mtd><msub><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mi>L</mi><mo>+</mo><mn>1</mn></mrow></msub></mtd></mtr><mtr><mtd><msub><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mn>1</mn></mrow></msub></mtd><mtd><msub><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mn>2</mn></mrow></msub></mtd><mtd><mo>⋯</mo></mtd><mtd><msub><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mi>L</mi></mrow></msub></mtd></mtr><mtr><mtd><mo>⋮</mo></mtd><mtd><mo>⋮</mo></mtd><mtd><mo>⋮</mo></mtd><mtd><mo>⋮</mo></mtd></mtr><mtr><mtd><msub><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mi>N</mi><mo>+</mo><mn>1</mn></mrow></msub></mtd><mtd><msub><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mi>N</mi></mrow></msub></mtd><mtd><mo>⋯</mo></mtd><mtd><msub><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi><mo>−</mo><mi>δ</mi><mo>−</mo><mi>L</mi><mo>−</mo><mi>N</mi><mo>+</mo><mn>2</mn></mrow></msub></mtd></mtr></mtable></mfenced></mrow></math><img id="ib0021" file="imgb0021.tif" wi="83" he="26" img-content="math" img-format="tif"/></maths> où L et δ sont les même paramètres que pour le dictionnaire d'analyse <maths id="math0022" num=""><math display="inline"><mrow><msubsup><mi>D</mi><mrow><mi>j</mi><mo>,</mo><mi>n</mi></mrow><mi>a</mi></msubsup><mn>.</mn></mrow></math><img id="ib0022" file="imgb0022.tif" wi="8" he="6" img-content="math" img-format="tif" inline="yes"/></maths></p>
<p id="p0050" num="0050">Dans une étape 910, pour chaque indice temporel n et chaque indice fréquentiel d'échantillonnage k, une estimation de la densité spectrale de puissance de la réverbération tardive ou du spectre de la réverbération tardive <maths id="math0023" num=""><math display="inline"><mrow><msubsup><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mrow><mo>ℓ</mo></mrow></msubsup></mrow></math><img id="ib0023" file="imgb0023.tif" wi="8" he="6" img-content="math" img-format="tif" inline="yes"/></maths> est construit par multiplication du dictionnaire de synthèse <maths id="math0024" num=""><math display="inline"><mrow><msubsup><mi>D</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mi>s</mi></msubsup></mrow></math><img id="ib0024" file="imgb0024.tif" wi="8" he="6" img-content="math" img-format="tif" inline="yes"/></maths> avec le vecteur de prédiction <i>α<sub>j,n</sub></i> selon la formule <maths id="math0025" num=""><math display="block"><mrow><msubsup><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mrow><mo>ℓ</mo></mrow></msubsup><mo>=</mo><msubsup><mi>D</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mi>s</mi></msubsup><msub><mi>α</mi><mrow><mi>j</mi><mo>,</mo><mi>n</mi></mrow></msub><mspace width="1em"/><mo>∀</mo><mi>k</mi><mo>∈</mo><mrow><mo>⌊</mo><msub><mi>b</mi><mi>j</mi></msub><mo>,</mo><msub><mi>e</mi><mi>j</mi></msub><mo>⌋</mo></mrow><mo>,</mo><mspace width="1em"/><mi mathvariant="italic">j</mi><mo>=</mo><mn>1</mn><mo>,</mo><mo>…</mo><mo>,</mo><mi>J</mi></mrow></math><img id="ib0025" file="imgb0025.tif" wi="72" he="7" img-content="math" img-format="tif"/></maths></p>
<p id="p0051" num="0051">Le vecteur de prédiction <i>α<sub>j,n</sub></i> indique donc les colonnes du dictionnaire de synthèse qui ont été retenues pour l'estimation de la réverbération, ainsi que la contribution de chacune d'elles à la réverbération. Le spectre de la réverbération tardive <i>X<sup>ℓ</sup></i> est considéré dans la suite du procédé comme un signal de bruit à éliminer.</p>
<p id="p0052" num="0052">A cette fin, un filtrage de la réverbération est effectué par l'unité de filtrage 310. Plus précisément, dans une étape 911, pour chaque indice temporel n et chaque indice fréquentiel d'échantillonnage k, un filtre de déréverbération <i>G<sub>k,n</sub></i> est construit selon la formule <maths id="math0026" num=""><math display="block"><mrow><msub><mi>G</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub><mo>=</mo><mfrac><mrow><msub><mi>ξ</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub></mrow><mrow><mn>1</mn><mo>+</mo><msub><mi>ξ</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub></mrow></mfrac><mi>exp</mi><mfenced><mrow><mstyle displaystyle="false"><mrow><msubsup><mrow><mo>∫</mo></mrow><mrow><msub><mi>υ</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub></mrow><mi>∞</mi></msubsup></mrow></mstyle><mrow><mfrac><mrow><msup><mi>e</mi><mrow><mo>−</mo><mi>t</mi></mrow></msup></mrow><mi>t</mi></mfrac><mi mathvariant="italic">dt</mi></mrow></mrow></mfenced></mrow></math><img id="ib0026" file="imgb0026.tif" wi="50" he="14" img-content="math" img-format="tif"/></maths> où <i>ξ<sub>k,n</sub></i> est le rapport signal à bruit <i>a priori,</i> calculé de la façon suivante <maths id="math0027" num=""><math display="block"><mrow><msub><mi>ξ</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub><mo>=</mo><mi>β</mi><msubsup><mi>G</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi><mo>−</mo><mn>1</mn></mrow><mn>2</mn></msubsup><msub><mi>γ</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi><mo>−</mo><mn>1</mn></mrow></msub><mo>+</mo><mfenced separators=""><mn>1</mn><mo>−</mo><mi>β</mi></mfenced><mi>max</mi><mfenced open="{" close="}" separators=""><msub><mi>γ</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub><mo>−</mo><mn>1</mn><mo>,</mo><mn>0</mn></mfenced></mrow></math><img id="ib0027" file="imgb0027.tif" wi="72" he="7" img-content="math" img-format="tif"/></maths><!-- EPO <DP n="16"> --> et où la borne d'intégration <i>ν<sub>k,n</sub></i> est calculée de la façon suivante <maths id="math0028" num=""><math display="block"><mrow><msub><mi>υ</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub><mo>=</mo><msub><mi>γ</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub><mfrac><mrow><msub><mi>ξ</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub></mrow><mrow><mn>1</mn><mo>+</mo><msub><mi>ξ</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub></mrow></mfrac></mrow></math><img id="ib0028" file="imgb0028.tif" wi="30" he="12" img-content="math" img-format="tif"/></maths> où <i>γ<sub>k,n</sub></i> est le rapport signal à bruit <i>a postériori,</i> calculé selon la formule <maths id="math0029" num=""><math display="block"><mrow><msub><mi>γ</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub><mo>=</mo><mfrac><mrow><msup><mfenced open="|" close="|"><msub><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub></mfenced><mn>2</mn></msup></mrow><mrow><msup><mfenced open="|" close="|"><msub><mi>R</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub></mfenced><mn>2</mn></msup></mrow></mfrac></mrow></math><img id="ib0029" file="imgb0029.tif" wi="22" he="15" img-content="math" img-format="tif"/></maths> où <i>R<sub>k,n</sub></i> est la réverbération tardive lissée calculée de la façon suivante <maths id="math0030" num=""><math display="block"><mrow><msub><mi>R</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub><mo>=</mo><msub><mi mathvariant="italic">αR</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi><mo>−</mo><mn>1</mn></mrow></msub><mo>+</mo><mfenced separators=""><mn>1</mn><mo>−</mo><mi>α</mi></mfenced><mfenced open="|" close="|"><msubsup><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mrow><mo>ℓ</mo></mrow></msubsup></mfenced></mrow></math><img id="ib0030" file="imgb0030.tif" wi="46" he="8" img-content="math" img-format="tif"/></maths> où α est une première constante de lissage et β est une seconde constante de lissage. Dans un exemple, la première constante de lissage α vaut 0.77 et la seconde constante de lissage β vaut 0.98.</p>
<p id="p0053" num="0053">En effet, la réverbération estimée est non stationnaire à long terme car le signal sonore émis par la source sonore omnidirectionnelle 100, qui provoque ladite réverbération estimée n'est pas stationnaire à long terme. Des variations trop rapides de la réverbération estimée peuvent introduire des artéfacts gênants lors du filtrage. Pour limiter ces effets, un lissage récursif est effectué pour calculer la densité spectrale de puissance de la réverbération tardive.</p>
<p id="p0054" num="0054">Dans une étape 912, pour chaque indice temporel n et chaque indice fréquentiel d'échantillonnage k, les vecteurs d'observations <i>Xv<sub>k,n</sub></i> sont filtrés par le filtre de déréverbération <i>G<sub>k,n</sub></i> calculé à l'étape 911 afin d'obtenir un module de signal déréverbéré <i>Y<sub>k,n</sub></i> calculé de la façon suivante <maths id="math0031" num=""><math display="block"><mrow><msub><mi>Y</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub><mo>=</mo><msub><mi>G</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub><msub><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow></msub><mn>.</mn></mrow></math><img id="ib0031" file="imgb0031.tif" wi="26" he="6" img-content="math" img-format="tif"/></maths></p>
<p id="p0055" num="0055">Le filtre construit à l'étape 911 atténue fortement certains vecteurs d'observations <i>Xv<sub>k,n</sub></i> ce qui génère des artéfacts nuisibles à la qualité du signal déréverbéré. Pour limiter lesdits artéfacts, une borne inférieure est imposée sur l'atténuation du filtre. Ainsi, pour chaque indice fréquentiel d'échantillonnage k et pour chaque indice temporel n, si le filtre de déréverbération <i>G<sub>k,n</sub></i> est inférieur ou égal à une valeur minimale du filtre de déréverbération Gmin, alors ledit filtre de déréverbération <i>G<sub>k,n</sub></i> est égal à ladite valeur minimale du filtre de<!-- EPO <DP n="17"> --> déréverbération Gmin.</p>
<p id="p0056" num="0056">Dans une étape 913, pour chaque indice fréquentiel d'échantillonnage k et chaque indice temporel n, le module de signal déréverbéré <i>Y<sub>k,n</sub></i> et la phase <i>∠X<sub>k,n</sub></i> du signal complexe <maths id="math0032" num=""><math display="inline"><mrow><msubsup><mi>X</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mi>C</mi></msubsup></mrow></math><img id="ib0032" file="imgb0032.tif" wi="7" he="6" img-content="math" img-format="tif" inline="yes"/></maths> sont multipliés afin de créer un signal complexe déréverbéré <i>Y<sup>C</sup>.</i></p>
<p id="p0057" num="0057">Dans une étape 914, une transformation fréquence-temps est appliquée par l'unité d'application d'une transformation fréquence-temps 220 au signal complexe déréverbéré <maths id="math0033" num=""><math display="inline"><mrow><msubsup><mi>Y</mi><mrow><mi>k</mi><mo>,</mo><mi>n</mi></mrow><mi>C</mi></msubsup></mrow></math><img id="ib0033" file="imgb0033.tif" wi="6" he="6" img-content="math" img-format="tif" inline="yes"/></maths> afin d'obtenir un signal temporel déréverbéré <i>y</i>(<i>t</i>) dans le domaine temporel. Dans un exemple, la transformation fréquence-temps est une Transformation de Fourier Inverse à Court Terme.</p>
<p id="p0058" num="0058">Dans une mise en oeuvre, la valeur du nombre de vecteurs d'observation L est égale à 10, la valeur du nombre de longueur d'observation N est égale à 8, la valeur du retard δ est égale à 5, la valeur du paramètre d'intensité maximale <i>λ</i> est égale à 0.5, la valeur du nombre K est égale à 257, la valeur du nombre J est égale à 10, la valeur de la longueur d'une trame M est égale à 512 et la valeur minimale du filtre de déréverbération Gmin est égale à -12 décibels. Ce choix de paramètres permet l'application du procédé en temps réel.</p>
<p id="p0059" num="0059">Le procédé de suppression de la réverbération tardive d'un signal sonore selon l'invention est rapide et présente une complexité réduite. Ledit procédé est donc utilisable en temps réel. En outre, ce procédé n'introduit pas d'artéfacts et est robuste au bruit de fond. De plus, ledit procédé réduit le bruit de fond et est compatible avec des procédés de réduction de bruit.</p>
<p id="p0060" num="0060">Le procédé de suppression de la réverbération tardive d'un signal sonore selon l'invention nécessite un seul microphone pour traiter avec précision la réverbération.</p>
</description>
<claims id="claims01" lang="fr"><!-- EPO <DP n="18"> -->
<claim id="c-fr-01-0001" num="0001">
<claim-text>Procédé de suppression de la réverbération tardive d'un signal sonore <b>caractérisé en ce qu'</b>il comporte les étapes suivantes :
<claim-text>• captation (900) d'un signal d'entrée (<i>x</i>) formé par la superposition de plusieurs versions retardées et atténuées du signal sonore,</claim-text>
<claim-text>• application (901) d'une transformation temps-fréquence au signal d'entrée (<i>x</i>) afin d'obtenir une transformée temps-fréquence complexe (<i>X<sup>C</sup></i>) du signal d'entrée (<i>x</i>),</claim-text>
<claim-text>• création d'un module sous échantillonné (<i>X̃</i>) en fréquence à partir du module de la transformée temps-fréquence complexe (<i>X<sup>C</sup></i>) du signal d'entrée (<i>x</i>),</claim-text>
<claim-text>• création (905) d'une pluralité de vecteurs d'observation sous échantillonnés à partir dudit module sous échantillonné (<i>X̃</i>) en fréquence,</claim-text>
<claim-text>• construction (906) d'une pluralité de dictionnaires d'analyse (<i>D<sup>a</sup></i>) à partir de la pluralité de vecteurs d'observation sous échantillonnés,</claim-text>
<claim-text>• calcul (907) d'une pluralité de vecteurs de prédiction (α) à partir de la pluralité de vecteurs d'observation sous échantillonnés et de la pluralité de dictionnaires d'analyse (<i>D<sup>a</sup></i>), en minimisant, pour chaque vecteur de prédiction (α), l'expression ∥<i>X̃v -D<sup>a</sup>α</i>∥<sub>2</sub>, qui est la norme euclidienne de la différence entre le vecteur d'observation sous échantillonné associé audit vecteur de prédiction (α) et du dictionnaire d'analyse (<i>D<sup>a</sup></i>) associé audit vecteur de prédiction (α) multiplié par ledit vecteur de prédiction (<i>α</i>), en tenant compte de la contrainte ∥<i>α</i>∥<sub>1</sub> ≤ <i>λ,</i> selon laquelle la norme 1 dudit vecteur de prédiction (α) est inférieure ou égale à un paramètre d'intensité maximale de la réverbération tardive (λ),<!-- EPO <DP n="19"> --></claim-text>
<claim-text>• création (908) d'une pluralité de vecteurs d'observation à partir du module de la transformée temps-fréquence complexe (<i>X<sup>C</sup></i>) du signal d'entrée (<i>x</i>),</claim-text>
<claim-text>• construction (909) d'une pluralité de dictionnaires de synthèse (<i>D<sup>s</sup></i>) à partir de la concaténation de la pluralité de vecteurs d'observations,</claim-text>
<claim-text>• estimation (910) d'un spectre de réverbération tardive (<i>X</i><sup>ℓ</sup>) à partir de la multiplication de la pluralité de dictionnaires de synthèse (<i>D<sup>s</sup></i>) avec la pluralité de vecteurs de prédiction (α),</claim-text>
<claim-text>• filtrage (912) de la pluralité de vecteurs d'observations afin d'éliminer le spectre de réverbération tardive (<i>X</i><sup>ℓ</sup>) et d'obtenir un module de signal déréverbéré (<i>Y</i>).</claim-text></claim-text></claim>
<claim id="c-fr-01-0002" num="0002">
<claim-text>Procédé selon la revendication 1, <b>caractérisé en ce que</b> la valeur du paramètre d'intensité maximale de la réverbération tardive (λ) est comprise entre 0 et 1.</claim-text></claim>
<claim id="c-fr-01-0003" num="0003">
<claim-text>Procédé selon l'une des revendications 1 ou 2, <b>caractérisé en ce qu'</b>il comporte en outre l'étape suivante :
<claim-text>• création (913) d'un signal complexe déréverbéré (<i>Y<sup>C</sup></i>) à partir du module de signal déréverbéré (<i>Y</i>) et de la phase (∠<i>X</i>) de la transformée temps-fréquence complexe (<i>X<sup>C</sup></i>) du signal d'entrée (<i>x</i>).</claim-text></claim-text></claim>
<claim id="c-fr-01-0004" num="0004">
<claim-text>Procédé selon la revendication 3, <b>caractérisé en ce qu'</b>il comporte en outre l'étape suivante :
<claim-text>• application (914) d'une transformation fréquence-temps au signal complexe déréverbéré (<i>Y<sup>C</sup></i>) afin d'obtenir un signal temporel déréverbéré (<i>y</i>).</claim-text><!-- EPO <DP n="20"> --></claim-text></claim>
<claim id="c-fr-01-0005" num="0005">
<claim-text>Procédé selon l'une des revendications 1 à 4, <b>caractérisé en ce qu'</b>il comporte en outre une étape de construction d'un filtre de déréverbération selon le modèle <maths id="math0034" num=""><math display="block"><mrow><mi>G</mi><mo>=</mo><mfrac><mi>ξ</mi><mrow><mn>1</mn><mo>+</mo><mi>ξ</mi></mrow></mfrac><mi>exp</mi><mfenced><mrow><mstyle displaystyle="false"><mrow><msubsup><mrow><mo>∫</mo></mrow><mi>υ</mi><mi>∞</mi></msubsup></mrow></mstyle><mrow><mfrac><mrow><msup><mi>e</mi><mrow><mo>−</mo><mi>t</mi></mrow></msup></mrow><mi>t</mi></mfrac></mrow><mi mathvariant="italic">dt</mi></mrow></mfenced><mo>,</mo></mrow></math><img id="ib0034" file="imgb0034.tif" wi="46" he="13" img-content="math" img-format="tif"/></maths> où <i>ξ</i> est le rapport signal à bruit <i>a priori,</i> et où la borne d'intégration <i>ν</i> est calculée selon le modèle <maths id="math0035" num=""><math display="block"><mrow><mi>υ</mi><mo>=</mo><mi>γ</mi><mfrac><mi>ξ</mi><mrow><mn>1</mn><mo>+</mo><mi>ξ</mi></mrow></mfrac></mrow></math><img id="ib0035" file="imgb0035.tif" wi="24" he="12" img-content="math" img-format="tif"/></maths> où <i>γ</i> est le rapport signal à bruit <i>a postériori.</i></claim-text></claim>
<claim id="c-fr-01-0006" num="0006">
<claim-text>Dispositif de suppression de la réverbération tardive d'un signal sonore <b>caractérisé en ce qu'</b>il comporte des moyens pour :
<claim-text>• capter un signal d'entrée (<i>x</i>) formé par la superposition de plusieurs versions retardées et atténuées du signal sonore,</claim-text>
<claim-text>• appliquer une transformation temps-fréquence au signal d'entrée (x) afin d'obtenir une transformée temps-fréquence complexe (<i>X<sup>C</sup></i>) du signal d'entrée (<i>x</i>),</claim-text>
<claim-text>• créer un module sous échantillonné (<i>X̃</i>) en fréquence à partir du module de la transformée temps-fréquence complexe (<i>X<sup>C</sup></i>) du signal d'entrée (<i>x</i>),</claim-text>
<claim-text>• créer d'une pluralité de vecteurs d'observation sous échantillonnés à partir dudit module sous échantillonné (<i>X̃</i>) en fréquence,</claim-text>
<claim-text>• construire une pluralité de dictionnaires d'analyse (<i>D<sup>a</sup></i>) à partir de la pluralité de vecteurs d'observation sous échantillonnés,</claim-text>
<claim-text>• calculer une pluralité de vecteurs de prédiction (α) à partir de la pluralité de vecteurs d'observation sous échantillonnés et de la pluralité de dictionnaires d'analyse (<i>D<sup>a</sup></i>), en minimisant, pour chaque vecteur de prédiction (α), l'expression ∥<i>X̃v -D<sup>a</sup>α</i>∥<sub>2</sub>, qui est la norme euclidienne de la différence entre le vecteur<!-- EPO <DP n="21"> --> d'observation sous échantillonné associé audit vecteur de prédiction (α) et du dictionnaire d'analyse (<i>D<sup>a</sup></i>) associé audit vecteur de prédiction (α) multiplié par ledit vecteur de prédiction (α), en tenant compte de la contrainte ∥<i>α</i>∥<sub>1</sub> ≤ <i>λ</i>, selon laquelle la norme 1 dudit vecteur de prédiction (α) est inférieure ou égale à un paramètre d'intensité maximale de la réverbération tardive (λ),</claim-text>
<claim-text>• créer une pluralité de vecteurs d'observation à partir du module de la transformée temps-fréquence complexe (<i>X<sup>C</sup></i>) du signal d'entrée (<i>x</i>),</claim-text>
<claim-text>• construire une pluralité de dictionnaires de synthèse (<i>D<sup>s</sup></i>) à partir de la concaténation de la pluralité de vecteurs d'observations,</claim-text>
<claim-text>• estimer un spectre de réverbération tardive (<i>X</i><sup>ℓ</sup>) à partir de la multiplication de la pluralité de dictionnaires de synthèse (<i>D<sup>s</sup></i>) avec la pluralité de vecteurs de prédiction (α),</claim-text>
<claim-text>• filtrer la pluralité de vecteurs d'observations afin d'éliminer le spectre de réverbération tardive (<i>X</i><sup>ℓ</sup>) et d'obtenir un module de signal déréverbéré (<i>Y</i>).</claim-text></claim-text></claim>
</claims>
<claims id="claims02" lang="de"><!-- EPO <DP n="22"> -->
<claim id="c-de-01-0001" num="0001">
<claim-text>Verfahren zur Unterdrückung des späten Nachhalls eines akustischen Signals, <b>dadurch gekennzeichnet, dass</b> es die folgenden Schritte umfasst:
<claim-text>- Erfassung (900) eines Eingangssignals (x), das durch die Überlagerung mehrerer verzögerter und gedämpfter Versionen des akustischen Signals gebildet ist,</claim-text>
<claim-text>- Anwendung (901) einer Zeit-Frequenz-Transformation am Eingangssignal (x), um eine komplexe Zeit-Frequenz-Transformierte (X<sup>c</sup>) des Eingangssignals (x) zu erhalten,</claim-text>
<claim-text>- Erzeugung eines hinsichtlich der Frequenz unterabgetasteten Moduls (X) aus dem Modul der komplexen Zeit-Frequenz-Transformierten (X<sup>c</sup>) des Eingangssignals (x),</claim-text>
<claim-text>- Erzeugung (905) einer Vielzahl von unterabgetasteten Beobachtungsvektoren aus dem hinsichtlich der Frequenz unterabgetasteten Modul (X),</claim-text>
<claim-text>- Erstellung (906) einer Vielzahl von Analysewörterbüchern (D<sup>a</sup>) aus der Vielzahl von unterabgetasteten Beobachtungsvektoren,<!-- EPO <DP n="23"> --></claim-text>
<claim-text>- Berechnung (907) einer Vielzahl von Prädiktionsvektoren (α) aus der Vielzahl von unterabgetasteten Beobachtungsvektoren und der Vielzahl von Analysewörterbüchern (D<sup>a</sup>), wobei für jeden Prädiktionsvektor (α) der Ausdruck ∥<i>X̃</i>v-D<sup>a</sup>α∥<sub>2</sub> minimiert wird, der die euklidische Norm der Differenz zwischen dem unterabgetasteten Beobachtungsvektor, der dem Prädiktionsvektor (α) zugeordnet ist, und dem Analysewörterbuch (D<sup>a</sup>), das dem Prädiktionsvektor (α) zugeordnet ist, multipliziert mit dem Prädiktionsvektor (α), unter Berücksichtigung der Anforderung ∥α∥<sub>1</sub>≤λ, nach der die Norm 1 des Prädiktionsvektors (α) kleiner oder gleich einem Parameter maximaler Intensität des späten Nachhalls (λ) ist,</claim-text>
<claim-text>- Erzeugung (908) einer Vielzahl von Beobachtungsvektoren aus dem Modul der komplexen Zeit-Frequenz-Transformierten (X<sup>c</sup>) des Eingangssignals (x),</claim-text>
<claim-text>- Erstellung (909) einer Vielzahl von Synthesewörterbüchern (D<sup>s</sup>) aus der Verkettung der Vielzahl von Beobachtungsvektoren,</claim-text>
<claim-text>- Schätzung (910) eines späten Nachhallspektrums (X<sup>ℓ</sup>) aus der Multiplikation der Vielzahl von Synthesewörterbüchern (D<sup>s</sup>) mit der Vielzahl von Prädiktionsvektoren (α),</claim-text>
<claim-text>- Filterung (912) der Vielzahl von Beobachtungsvektoren, um das späte Nachhallspektrum (X<sup>ℓ</sup>) zu eliminieren und ein Signalmodul ohne Nachhall (Y) zu erhalten.</claim-text><!-- EPO <DP n="24"> --></claim-text></claim>
<claim id="c-de-01-0002" num="0002">
<claim-text>Verfahren nach Anspruch 1, <b>dadurch gekennzeichnet, dass</b> der Wert des maximalen Intensitätsparameters des späten Nachhalls (λ) zwischen 0 und 1 beträgt.</claim-text></claim>
<claim id="c-de-01-0003" num="0003">
<claim-text>Verfahren nach einem der Ansprüche 1 oder 2, <b>dadurch gekennzeichnet, dass</b> es ferner den folgenden Schritt umfasst:
<claim-text>- Erzeugung (913) eines komplexen Signals ohne Nachhall (Y<sup>c</sup>) aus dem Signalmodul ohne Nachhall (Y) und der Phase (&lt;X) der komplexen Zeit-Frequenz-Transformierten (X<sup>c</sup>) des Eingangssignals (x).</claim-text></claim-text></claim>
<claim id="c-de-01-0004" num="0004">
<claim-text>Verfahren nach Anspruch 3, <b>dadurch gekennzeichnet, dass</b> es ferner den folgenden Schritt umfasst:
<claim-text>- Anwendung (914) einer Zeit-Frequenz-Transformierten am komplexen Signal ohne Nachhall (Y<sup>c</sup>), um ein Zeitsignal ohne Nachhall (y) zu erhalten.</claim-text></claim-text></claim>
<claim id="c-de-01-0005" num="0005">
<claim-text>Verfahren nach einem der Ansprüche 1 bis 4, <b>dadurch gekennzeichnet, dass</b> es ferner den Schritt der Erstellung eines Nachhallbeseitigungsfilters nach folgenden Modell umfasst: <maths id="math0036" num=""><math display="block"><mrow><mi>G</mi><mo>=</mo><mfrac><mi>ξ</mi><mrow><mn>1</mn><mo>+</mo><mi>ξ</mi></mrow></mfrac><mi>exp</mi><mfenced><mrow><mstyle displaystyle="false"><mrow><msubsup><mrow><mo>∫</mo></mrow><mi>υ</mi><mi>∞</mi></msubsup></mrow></mstyle><mrow><mfrac><mrow><msup><mi>e</mi><mrow><mo>−</mo><mi>t</mi></mrow></msup></mrow><mi>t</mi></mfrac><mi mathvariant="italic">dt</mi></mrow></mrow></mfenced><mo>,</mo></mrow></math><img id="ib0036" file="imgb0036.tif" wi="54" he="15" img-content="math" img-format="tif"/></maths> wobei ζ das Signal-Rausch-Verhältnis a priori ist, und wobei die Integrationsklemme v nach folgendem Modell berechnet wird <maths id="math0037" num=""><math display="block"><mrow><mi>υ</mi><mo>=</mo><mi>γ</mi><mfrac><mi>ξ</mi><mrow><mn>1</mn><mo>+</mo><mi>ξ</mi></mrow></mfrac></mrow></math><img id="ib0037" file="imgb0037.tif" wi="28" he="14" img-content="math" img-format="tif"/></maths><!-- EPO <DP n="25"> --> wobei y das Signal-Rausch-Verhältnis a posteriori ist.</claim-text></claim>
<claim id="c-de-01-0006" num="0006">
<claim-text>Vorrichtung zur Unterdrückung des späten Nachhalls eines akustischen Signals, <b>dadurch gekennzeichnet, dass</b> sie Mittel umfasst, um:
<claim-text>- ein Eingangssignal (x) zu erfassen, das durch die Überlagerung mehrerer verzögerter und gedämpfter Versionen des akustischen Signals gebildet ist,</claim-text>
<claim-text>- eine Zeit-Frequenz-Transformation am Eingangssignal (x) anzuwenden, um eine komplexe Zeit-Frequenz-Transformierte (X<sup>c</sup>) des Eingangssignals (x) zu erhalten,</claim-text>
<claim-text>- ein hinsichtlich der Frequenz unterabgetastetes Modul (X) aus dem Modul der komplexen Zeit-Frequenz-Transformierten (X<sup>c</sup>) des Eingangssignals (x) zu erzeugen,</claim-text>
<claim-text>- eine Vielzahl von unterabgetasteten Beobachtungsvektoren aus dem hinsichtlich der Frequenz unterabgetasteten Modul (<i>X̃</i>) zu erzeugen,</claim-text>
<claim-text>- eine Vielzahl von Analysewörterbüchern (D<sup>a</sup>) aus der Vielzahl von unterabgetasteten Beobachtungsvektoren zu erstellen,</claim-text>
<claim-text>- eine Vielzahl von Prädiktionsvektoren (α) aus der Vielzahl von unterabgetasteten Beobachtungsvektoren und der Vielzahl von Analysewörterbüchern (D<sup>a</sup>), wobei für jeden Prädiktionsvektor (α) der Ausdruck ∥<i>X̃</i>v-D<sup>a</sup>α∥<sub>2</sub> minimiert wird, der die euklidische Norm der Differenz zwischen dem unterabgetasteten Beobachtungsvektor, der dem Prädiktionsvektor<!-- EPO <DP n="26"> --> (α) zugeordnet ist, und dem Analysewörterbuch (D<sup>a</sup>), das dem Prädiktionsvektor (α) zugeordnet ist, multipliziert mit dem Prädiktionsvektor (α), unter Berücksichtigung der Anforderung ∥α∥<sub>1</sub>≤λ, nach der die Norm 1 des Prädiktionsvektors (α) kleiner oder gleich einem Parameter maximaler Intensität des späten Nachhalls (λ) ist,</claim-text>
<claim-text>- eine Vielzahl von Beobachtungsvektoren aus dem Modul der komplexen Zeit-Frequenz-Transformierten (X<sup>c</sup>) des Eingangssignals (x) zu erzeugen,</claim-text>
<claim-text>- eine Vielzahl von Synthesewörterbüchern (D<sup>s</sup>) aus der Verkettung der Vielzahl von Beobachtungsvektoren zu erstellen,</claim-text>
<claim-text>- ein spätes Nachhallspektrum (X<sup>ℓ</sup>) aus der Multiplikation der Vielzahl von Synthesewörterbüchern (D<sup>s</sup>) mit der Vielzahl von Prädiktionsvektoren (α) zu schätzen,</claim-text>
<claim-text>- die Vielzahl von Beobachtungsvektoren zu filtern, um das späte Nachhallspektrum (X<sup>ℓ</sup>) zu eliminieren und ein Signalmodul ohne Nachhall (Y) zu erhalten.</claim-text></claim-text></claim>
</claims>
<claims id="claims03" lang="en"><!-- EPO <DP n="27"> -->
<claim id="c-en-01-0001" num="0001">
<claim-text>Method for suppressing the late reverberation of a sound signal, <b>characterized in that</b> it includes the following steps:
<claim-text>• capturing (900) an input signal (<i>x</i>) formed by the superimposition of a multiplicity of delayed and attenuated versions of the sound signal,</claim-text>
<claim-text>• applying (901) a time-frequency transformation to the input signal (<i>x</i>) in order to obtain a complex time-frequency transform (<i>X<sup>C</sup></i>) of the input signal (<i>x</i>),</claim-text>
<claim-text>• generating a frequency-subsampled modulus (<i>X̃</i>) from the modulus of the complex time-frequency transform (<i>X<sup>C</sup></i>) of the input signal (<i>x</i>),</claim-text>
<claim-text>• generating (905) a plurality of subsampled observation vectors from said frequency-subsampled modulus (<i>X̃</i>),</claim-text>
<claim-text>• constructing (906) a plurality of analysis dictionaries (<i>D<sup>a</sup></i>) from the plurality of subsampled observation vectors,</claim-text>
<claim-text>• calculating (907) a plurality of prediction vectors (α) from the plurality of subsampled observation vectors and from the plurality of analysis dictionaries (<i>D<sup>a</sup></i>), by minimizing, for each prediction vector (α), the expression ∥<i>X̃v</i> - <i>D<sup>a</sup>α</i>∥<sub>2</sub>, which is the Euclidean norm of the difference between the subsampled observation vector associated with said prediction vector (α) and of<!-- EPO <DP n="28"> --> the analysis dictionary (<i>D<sup>a</sup></i>) associated with said prediction vector (α) multiplied by said prediction vector (α), while taking into consideration the constraint ∥<i>α</i>∥<sub>1</sub> ≤ <i>λ</i>, according to which the norm 1 of said prediction vector (α) is less than or equal to a maximum intensity parameter of the late reverberation (λ),</claim-text>
<claim-text>• generating (908) a plurality of observation vectors from the modulus of the complex time-frequency transform (<i>X<sup>C</sup></i>) of the input signal (<i>x</i>),</claim-text>
<claim-text>• constructing (909) a plurality of synthesis dictionaries (<i>D<sup>s</sup></i>) from the concatenation of the plurality of observation vectors,</claim-text>
<claim-text>• estimating (910) a late reverberation spectrum (<i>X<sup>ℓ</sup></i>) from the multiplication of the plurality of synthesis dictionaries (<i>D<sup>s</sup></i>) by the plurality of prediction vectors (α),</claim-text>
<claim-text>• filtering (912) the plurality of observation vectors in order to eliminate the late reverberation spectrum (<i>X</i><sup>ℓ</sup>) and to obtain a dereverberated signal modulus (<i>Y</i>).</claim-text></claim-text></claim>
<claim id="c-en-01-0002" num="0002">
<claim-text>Method according to Claim 1, <b>characterized in that</b> the value of the maximum intensity parameter of the late reverberation (A) is between 0 and 1.</claim-text></claim>
<claim id="c-en-01-0003" num="0003">
<claim-text>Method according to either of Claims 1 and 2, <b>characterized in that</b> it furthermore includes the following step:
<claim-text>• generating (913) a dereverberated complex signal (<i>Y<sup>C</sup></i>) from the dereverberated signal modulus (<i>Y</i>) and from the phase (<i>∠X</i>) of the complex time-frequency transform (<i>X<sup>C</sup></i>) of the input signal (<i>x</i>)<i>.</i></claim-text></claim-text></claim>
<claim id="c-en-01-0004" num="0004">
<claim-text>Method according to Claim 3, <b>characterized in that</b> it furthermore includes the following step:<!-- EPO <DP n="29"> -->
<claim-text>• applying (914) a frequency-time transformation to the dereverberated complex signal (<i>Y<sup>C</sup></i>) in order to obtain a dereverberated time signal (<i>y</i>).</claim-text></claim-text></claim>
<claim id="c-en-01-0005" num="0005">
<claim-text>Method according to one of Claims 1 to 4, <b>characterized in that</b> it furthermore includes a step of constructing a dereverberation filter in accordance with the model <maths id="math0038" num=""><math display="block"><mrow><mi>G</mi><mo>=</mo><mfrac><mi>ξ</mi><mrow><mn>1</mn><mo>+</mo><mi>ξ</mi></mrow></mfrac><mi>exp</mi><mfenced><mrow><mstyle displaystyle="false"><mrow><msubsup><mrow><mo>∫</mo></mrow><mi>υ</mi><mi>∞</mi></msubsup></mrow></mstyle><mrow><mfrac><mrow><msup><mi>e</mi><mrow><mo>−</mo><mi>t</mi></mrow></msup></mrow><mi>t</mi></mfrac><mi mathvariant="italic">dt</mi></mrow></mrow></mfenced><mo>,</mo></mrow></math><img id="ib0038" file="imgb0038.tif" wi="52" he="15" img-content="math" img-format="tif"/></maths> where <i>ξ</i> is the <i>a priori</i> signal-to-noise ratio, and where the bound of integration <i>v</i> is calculated in accordance with the model <maths id="math0039" num=""><math display="block"><mrow><mi>υ</mi><mo>=</mo><mi>γ</mi><mfrac><mi>ξ</mi><mrow><mn>1</mn><mo>+</mo><mi>ξ</mi></mrow></mfrac></mrow></math><img id="ib0039" file="imgb0039.tif" wi="27" he="14" img-content="math" img-format="tif"/></maths> where <i>γ</i> is the <i>a posteriori</i> signal-to-noise ratio.</claim-text></claim>
<claim id="c-en-01-0006" num="0006">
<claim-text>Device for suppressing the late reverberation of a sound signal, <b>characterized in that</b> it includes means for:
<claim-text>• capturing an input signal (<i>x</i>) formed by the superimposition of a multiplicity of delayed and attenuated versions of the sound signal,</claim-text>
<claim-text>• applying a time-frequency transformation to the input signal (<i>x</i>) in order to obtain a complex time-frequency transform (<i>X<sup>C</sup></i>) of the input signal (<i>x</i>),</claim-text>
<claim-text>• generating a frequency-subsampled modulus (<i>X̃</i>) from the modulus of the complex time-frequency transform (<i>X<sup>C</sup></i>) of the input signal (<i>x</i>),</claim-text>
<claim-text>• generating a plurality of subsampled observation vectors from said frequency-subsampled modulus (<i>X̃</i>),</claim-text>
<claim-text>• constructing a plurality of analysis dictionaries (<i>D</i><sup>a</sup>) from the plurality of subsampled observation vectors,</claim-text>
<claim-text>• calculating a plurality of prediction vectors (α) from the plurality of subsampled observation vectors and from the plurality of analysis<!-- EPO <DP n="30"> --> dictionaries (<i>D</i><sup>a</sup>), by minimizing, for each prediction vector (α), the expression ∥<i>X̃v - D<sup>a</sup>α</i>∥<sub>2</sub>, which is the Euclidean norm of the difference between the subsampled observation vector associated with said prediction vector (α) and of the analysis dictionary (<i>D<sup>a</sup></i>) associated with said prediction vector (α) multiplied by said prediction vector (α), while taking into consideration the constraint ∥<i>α</i>∥<sub>1</sub> ≤ <i>λ</i>, according to which the norm 1 of said prediction vector (α) is less than or equal to a maximum intensity parameter of the late reverberation (λ),</claim-text>
<claim-text>• generating a plurality of observation vectors from the modulus of the complex time-frequency transform (<i>X<sup>C</sup></i>) of the input signal (<i>x</i>),</claim-text>
<claim-text>• constructing a plurality of synthesis dictionaries (<i>D<sup>s</sup></i>) from the concatenation of the plurality of observation vectors,</claim-text>
<claim-text>• estimating a late reverberation spectrum (<i>X</i><sup>ℓ</sup>) from the multiplication of the plurality of synthesis dictionaries (<i>D<sup>s</sup></i>) by the plurality of prediction vectors (α),</claim-text>
<claim-text>• filtering the plurality of observation vectors in order to eliminate the late reverberation spectrum (<i>X<sup>ℓ</sup></i>) and to obtain a dereverberated signal modulus (<i>Y</i>).</claim-text></claim-text></claim>
</claims>
<drawings id="draw" lang="fr"><!-- EPO <DP n="31"> -->
<figure id="f0001" num="1,2,3,4"><img id="if0001" file="imgf0001.tif" wi="112" he="199" img-content="drawing" img-format="tif"/></figure><!-- EPO <DP n="32"> -->
<figure id="f0002" num="5,6,7,8"><img id="if0002" file="imgf0002.tif" wi="113" he="209" img-content="drawing" img-format="tif"/></figure><!-- EPO <DP n="33"> -->
<figure id="f0003" num="9"><img id="if0003" file="imgf0003.tif" wi="83" he="216" img-content="drawing" img-format="tif"/></figure>
</drawings>
<ep-reference-list id="ref-list">
<heading id="ref-h0001"><b>RÉFÉRENCES CITÉES DANS LA DESCRIPTION</b></heading>
<p id="ref-p0001" num=""><i>Cette liste de références citées par le demandeur vise uniquement à aider le lecteur et ne fait pas partie du document de brevet européen. Même si le plus grand soin a été accordé à sa conception, des erreurs ou des omissions ne peuvent être exclues et l'OEB décline toute responsabilité à cet égard.</i></p>
<heading id="ref-h0002"><b>Littérature non-brevet citée dans la description</b></heading>
<p id="ref-p0002" num="">
<ul id="ref-ul0001" list-style="bullet">
<li><nplcit id="ref-ncit0001" npl-type="b"><article><atl>Speech dereverberation via maximum-kurtosis subband adaptive filtering, Proc.</atl><book><author><name>BWGILLESPIE</name></author><author><name>H S MALVAR</name></author><author><name>D A F FLORÊNCIO,</name></author><book-title>International Conference on Acoustics, Speech, and Signal Processing</book-title><imprint><name>IEEE</name><pubdate>20010000</pubdate></imprint><vid>6</vid><location><pp><ppf>3701</ppf><ppl>3704</ppl></pp></location></book></article></nplcit><crossref idref="ncit0001">[0006]</crossref></li>
<li><nplcit id="ref-ncit0002" npl-type="s"><article><author><name>M WU</name></author><author><name>D L WANG</name></author><atl>A two-stage algorithm for one-microphone reverberant speech enhancement, Audio, Speech, and Language Processing</atl><serial><sertitle>IEEE Transactions on</sertitle><pubdate><sdate>20060000</sdate><edate/></pubdate><vid>14</vid><ino>3</ino></serial><location><pp><ppf>774</ppf><ppl>784</ppl></pp></location></article></nplcit><crossref idref="ncit0002">[0006]</crossref></li>
<li><nplcit id="ref-ncit0003" npl-type="s"><article><author><name>SAEED MOSAYYEBPOUR</name></author><author><name>ABOLGHASEM SAYYADIYAN</name></author><author><name>MOHSEN ZAREIAN</name></author><author><name>ALI SHAHBAZI</name></author><atl>Single Channel Inverse Filtering of Room Impulse Response</atl><serial><sertitle>Maximizing Skewness of LP Residual</sertitle></serial></article></nplcit><crossref idref="ncit0003">[0006]</crossref></li>
<li><nplcit id="ref-ncit0004" npl-type="s"><article><author><name>D BEES</name></author><author><name>M BLOSTEIN</name></author><author><name>P KABAL</name></author><atl>Reverberant speech enhancement using cepstral processing, ICASSP '91</atl><serial><sertitle>Proceedings of the Acoustics, Speech, and Signal Processing</sertitle><pubdate><sdate>19910000</sdate><edate/></pubdate></serial></article></nplcit><crossref idref="ncit0004">[0010]</crossref></li>
<li><nplcit id="ref-ncit0005" npl-type="b"><article><atl>E.A.P Habets, Single- and Multi-Microphone Speech Dereverberation using Spectral Enhancement</atl><book><book-title>PhD thesis</book-title><imprint><name>Technische Universiteit Eindhoven</name><pubdate>20070000</pubdate></imprint></book></article></nplcit><crossref idref="ncit0005">[0013]</crossref></li>
<li><nplcit id="ref-ncit0006" npl-type="b"><article><atl>Speech Enhancement, Reverberant Environments</atl><book><author><name>T. YOSHIOKA</name></author><book-title>PhD thesis</book-title><imprint><name/><pubdate>20100000</pubdate></imprint></book></article></nplcit><crossref idref="ncit0006">[0013]</crossref></li>
<li><nplcit id="ref-ncit0007" npl-type="b"><article><atl>Speech Enhancement in Reverberant Environments</atl><book><author><name>T. YOSHIOKA</name></author><book-title>PhD thesis,</book-title><imprint><name/><pubdate>20100000</pubdate></imprint></book></article></nplcit><crossref idref="ncit0007">[0017]</crossref></li>
<li><nplcit id="ref-ncit0008" npl-type="b"><article><atl>Robust speech dereverberation based on nonnegativity and sparse nature of speech spectrograms, Proceedings of the 2009</atl><book><author><name>H KAMEOKA</name></author><author><name>T NAKATANI</name></author><author><name>T YOSHIOKA</name></author><book-title>IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP '09</book-title><imprint><name>IEEE Computer Society</name><pubdate>20090000</pubdate></imprint><location><pp><ppf>45</ppf><ppl>48</ppl></pp></location></book></article></nplcit><crossref idref="ncit0008">[0019]</crossref></li>
</ul></p>
</ep-reference-list>
</ep-patent-document>
