Procédé et dispositif pour le traitement des sons pour correction auditive des malentendants

(19)

(11)

EP 1 006 511 B1

(12)	FASCICULE DE BREVET EUROPEEN

(45)	Mention de la délivrance du brevet:
	28.04.2004 Bulletin 2004/18

(21)	Numéro de dépôt: 99403027.8

(22)	Date de dépôt: 03.12.1999

(51)	Int. Cl.⁷: G10L 21/02, H04R 25/00

(54)	Procédé et dispositif pour le traitement des sons pour correction auditive des malentendants Tonverarbeitungverfahren und Vorrichtung zur Anpassung eines Hörgerätes für Hörbehinderte Sound processing method and device for adapting a hearing aid for hearing impaired

(84)	Etats contractants désignés:
	AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

(30)

Priorité:

04.12.1998 FR 9815354

(43)	Date de publication de la demande:
	07.06.2000 Bulletin 2000/23

(73)	Titulaire: Thales
	75008 Paris (FR)

(72)	Inventeurs:
	Quagliaro, Gilles 94117 Arcueil Cedex (FR) Gournay, Philippe 94117 Arcueil Cedex (FR) Chartier, Frédéric 94117 Arcueil Cedex (FR) Guilmin, Gwénael 94117 Arcueil Cedex (FR)

(56)

Documents cités: :

WO-A-96/16533
US-A- 4 791 672

US-A- 4 051 331
US-A- 5 737 719

Il est rappelé que: Dans un délai de neuf mois à compter de la date de publication de la mention de la délivrance de brevet européen, toute personne peut faire opposition au brevet européen délivré, auprès de l'Office européen des brevets. L'opposition doit être formée par écrit et motivée. Elle n'est réputée formée qu'après paiement de la taxe d'opposition. (Art. 99(1) Convention sur le brevet européen).

Description

[0001] La présente invention concerne un procédé et un dispositif de correction des sons pour malentendants. Elle s'applique aussi bien à la réalisation de prothèses auditives, que de logiciels exécutables sur des ordinateurs personnels ou des répondeurs téléphoniques et de manière générale à tous dispositifs destinés à améliorer le confort d'écoute et la compréhension de la parole des personnes atteintes de surdité.

[0002] Le problème posé par les malentendants provient essentiellement du caractère spécifique et dégradé de leur perception auditive.

[0003] Dans son besoin de communiquer, l'homme a depuis l'aube des temps construit un mode de communication oral, la parole, qui s'appuie sur les caractéristiques moyennes de production (la voix) et de perception (l'oreille) du signal sonore. Le langage courant est donc celui du plus grand nombre. A contrario l'audition du malentendant est très éloignée de la moyenne et le langage courant lui est difficilement, voire pas du tout, accessible.

[0004] La compréhension du langage courant est un passage obligé pour l'intégration du malentendant dans sa communauté. Dans ce qui peut être considéré comme un réflexe de survie sociale, tout malentendant est amené naturellement à se constituer un langage à lui et à mettre en oeuvre des procédés, des techniques, et une stratégie de communication lui permettant de transposer le langage commun vers son langage particulier. Un exemple connu et spectaculaire est celui de la lecture labiale, qui permet d'accéder à la parole normale au travers d'un alphabet visuel de position des lèvres.

[0005] Le vingtième siècle a vu un effort continu dans la conception de machines destinées à soulager les malentendants et à les aider.

[0006] Deux classes de machines ont été développées.

[0007] Une première classe s'adresse aux surdités « légères » et vise à corriger l'audition et à la rendre normale, autant que possible. C'est ce que font les prothèses usuelles largement disponibles sur le marché.

[0008] Une deuxième classe s'adresse aux surdités plus lourdes et vise à réaliser une transformation de la parole en une parole de synthèse accessible à la personne malentendante. Dans cette catégorie la plupart des réalisations s'adressent aux "sourds profonds". Un exemple remarquable est celui de l'implant cochléaire qui agit au moyen d'électrodes par stimulation directe du nerf auditif.

[0009] La présente invention vise à proposer une solution pour les personnes souffrant de surdité dites « intermédiaires ». Ces personnes n'ont actuellement pas d'aide technique adaptée. Elles sont trop touchées pour être servies par les prothèses usuelles, mais leur acquis auditif est suffisant pour pouvoir se passer des dispositifs pour sourds profonds.

[0010] Les prothèses usuelles mettent généralement en oeuvre un procédé d'amplification sélective de la parole en fonction de la fréquence. Dans sa mise en oeuvre un automatisme de régulation du niveau sonore agit sur le gain d'amplification, le but étant de donner le meilleur confort d'écoute et une protection contre les pics de puissance instantanés.

[0011] Pour des raisons de stratégie commerciale et en réponse à la demande des patients, ces prothèses sont miniaturisées pour être portées en contour d'oreille ou en insert, ce qui conduit à des performances relativement médiocres ne pouvant satisfaire que des corrections auditives très grossières. Typiquement, il est défini seulement trois bandes de fréquences pour la correction fréquencielle. Ces prothèses s'adressent sans ambiguïté aux surdités "légères" les plus fréquentes. Des surdités plus lourdes peuvent être soulagées, mais au prix d'inconvénients pénibles causés notamment par l'amplification du bruit de fond, et le phénomène du Larsen. D'autre part il n'y a pas de possibilité de correction dans les zones fréquencielles pour lesquelles il n'existe pas d'audition.

[0012] Sur l'historique des prothèses pour sourds profond on peut se reporter utilement aux travaux de M.J.M.TATO professeur d'ORL et MM VIGNERON et LAMOTTE cités dans l'article M J C LAFON ayant pour titre "Transposition et modulation", publié au bulletin d'audiophonologie annales scientifiques de Franche Comté, Volume XII, N°3&4, monographie 164, 1996. Ces prothèses exploitent le fait que les sourds sont rarement complètement sourds, et qu'un très faible reliquat de perception persiste, souvent dans les graves, dont il a souvent été essayé de tirer parti.

[0013] C'est ainsi qu'il est possible de redonner de manière très rustique, une perception du son aux sourds par des procédés dits de «transposition » des aiguës vers les graves. Malheureusement la compréhension du langage exige plus qu'une simple perception et il s'avère que la transmission de l'intelligibilité est inséparable d'une nécessaire « richesse " du son. Redonner cette « richesse » est devenu un des principaux sujets de préoccupation. C'est ainsi qu'il a été envisagé de créer une parole de synthèse dans le but de restituer les éléments structurels qui forment le support à l'intelligibilité du langage courant.

[0014] La technique mise en oeuvre en 1952 par M J.M. TATO, consiste à enregistrer la parole dite très rapidement et à la restituer à vitesse moitié. Ceci permet d'effectuer une transposition d'un octave dans les graves, tout en conservant la structure de la parole initiale. Des essais ont montré un certain avantage pour les sourds.

[0015] Mais le procédé présente l'inconvénient de ne pouvoir être utilisée qu'en temps différé. La technique développée en 1971 par MM C.VIGNERON et M.LAMOTTE permet d'effectuer une adaptation en «temps réel »par une découpe du temps en intervalles de 1/100 de secondes en supprimant un intervalle sur deux, et en appliquant le procédé de M J.M.TATO sur les intervalles restants. Mais ce système présente malheureusement un bruit de fond important.

[0016] L'idée de construire des sons « naturels » est également présente dans une prothèse également citée sous le nom GALAXIE dans l'article de M JC LAFON. Cette prothèse met en oeuvre une batterie de filtres et de mélangeurs répartis sur six sous bandes et réalise une transposition dans les graves utilisables pour les sourds profonds.

[0017] Malheureusement, ces procédés qui interviennent au niveau du signal présentent trop de distorsions et un inconfort d'écoute trop important pour pouvoir être utilisés par les personnes souffrant de surdités intermédiaires.

[0018] De l'article de M Jean Claude LAFON se dégagent trois orientations qui peuvent être retenues dans la réalisation d'un bon traitement prothétique.

1- Il parait important de pouvoir transposer la globalité de la structure acoustique c'est à dire de ramener les éléments structurels de la parole porteurs de l'intelligibilité dans la zone de perception du malentendant.

2- Il parait aussi important de produire des sons « naturels »c'est à dire de reproduire une parole synthétique porteuse de l'information qui a une structure en harmonie avec l'acquis auditif du malentendant.
Le brevet US 4 051 331 divulgue un procédé de correction auditive des malentendants où la restitution de la parole s'appuie sur des sources oscillatrices chacune centrées sur la fréquence centrale des formants.

3- Enfin il faut veiller à conserver la temporalité du signal de parole car le rythme est porteur d'information accessible au malentendant. L'idée à l'origine de l'invention est de pallier les inconvénients précités en utilisant un modèle paramétrique du signal de parole capable d'effectuer des transformations pertinentes en vue d'une correction auditive pour des malentendants en mettant en oeuvre une méthode capable de satisfaire les trois contraintes citées précédemment.

[0019] A cet effet l'invention a pour objet, un procédé pour la correction auditive des malentendants, du type consistant à analyser un signal de parole pour en extraire des paramètres caractérisant le pitch, le voisement, l'énergie et le spectre du signal de parole, à modifier les paramètres pour rendre la parole intelligible à un malentendant, et à synthétiser un signal de parole perceptible par le malentendant à partir des paramètres modifiés de la manière suivante :

Le paramètre caractérisant le pitch est modifié en appliquant à la valeur du pitch extrait un facteur multiplicateur,
Le paramètre caractérisant l'énergie est modifié par une fonction de compression,
Le paramètre caractérisant l'enveloppe spectrale est modifié par une compression homothétique de l'échelle des fréquences

Caractérisé en ce que

Le paramètre caractérisant le voisement est donné sous la forme d'une fréquence de transition entre une bande voisée et une bande haute non voisée, qui est modifiée par un facteur multiplicateur afin de créer une bande haute modifiée sur laquelle on génère un bruit blanc pseudo aléatoire lors de la phase de synthèse ; et en ce que
La durée de l'intervalle de temps pris en compte pour la phase de synthèse est modifié en multipliant l'intervalle de temps par un facteur temps.

[0020] L'invention a également pour objet , un dispositif pour la mise en oeuvre du procédé précité.

[0021] Le procédé et le dispositif selon l'invention ont pour avantages de mettre en oeuvre les modèles paramétriques qui sont couramment utilisés dans les vocodeurs pour les adaptateur à l'audition des malentendants. Ceci permet de travailler non plus au niveau du signal sonore, comme le font les techniques antérieures mais au niveau de la structure symbolique du signal de parole afin d'en préserver son intelligibilité Les vocodeurs présentent en effet l'avantage d'utiliser un alphabet qui intègre les notions de « pitch », « spectre », « voisement » et « énergie » qui sont très proches du modèle physiologique de la bouche et de l'oreille. En vertu de la théorie de SHANNON, l'information transmise est alors bien porteuse de l'intelligibilité de la parole. La matérialisation de l'intelligibilité de la parole sous une forme informatique ouvre ainsi une perspective nouvelle. L'intelligibilité peut ainsi être acquise lors de l'opération d'analyse, et elle est restituée lors de la synthèse.

[0022] Grâce à l'invention, l'opération de synthèse d'un vocodeur paramétrique peut dès lors être adaptée aux caractéristiques auditives des malentendants. Cette technique, associée à des procédés plus conventionnels, permet d'envisager un procédé prothétique particulièrement général pouvant servir une population très large, et notamment les personnes souffrant de surdité intermédiaire.

[0023] Comme autre avantage le procédé et le dispositif selon l'invention offrent une grande liberté dans les réglages, chaque paramètre pouvant être modifié indépendamment des autres sans impact réciproque, avec un réglage spécifique pour chaque oreille.

[0024] D'autres caractéristiques et avantages de l'invention apparaîtront à l'aide de la description qui suit faite en regard des dessins annexés qui représentent:

[0025] La figure 1, les paramètres de modélisation du signal de parole utilisés dans la mise en oeuvre de l'invention.

[0026] La figure 2, un modèle paramétrique de production du signal de parole.

[0027] La figure 3, les différentes étapes nécessaires à la mise en oeuvre du procédé selon l'invention sous la forme d'un organigramme.

[0028] La figure 4, une courbe de transformation lors de la synthèse du signal de parole de l'énergie du signal de parole mesurée lors du processus d'analyse du signal de parole.

[0029] La figure 5, un mode de réalisation d'un dispositif pour la mise en oeuvre du procédé selon l'invention.

[0030] Le procédé de traitement du signal de parole selon l'invention est basé sur une modélisation paramétrique du signal de parole du type de celle couramment mises en oeuvre dans la technique de réalisation des vocodeurs numériques HSX et dont une description peut être trouvée dans l'article de MM P.Goumay, F. Charité, intitulé "A 1200 bits/s HSX speech coder for very low bit rate communications", et publié dans IEEE Proceedings Workshop on Signal Processing System (Sips'98), Boston, 8-10 Octobre 1998.

[0031] Ce modèle est défini principalement par quatre paramètres :

un paramètre de voisement qui décrit le caractère plus ou moins périodique des sons voisés ou aléatoire des sons non voisés du signal de parole,
un paramètre définissant la fréquence fondamentale ou « PITCH » des sons voisés,
un paramètre représentatif de l'évolution temporelle de l'énergie,
et un paramètre représentatif de l'enveloppe spectrale du signal de parole.

[0032] L'enveloppe spectrale du signal, ou « spectre », peut être obtenue par une modélisation autorégressive à l'aide d'un filtre de prédiction linéaire ou par une analyse de Fourier à court terme synchrone avec le pitch. Ces quatre paramètres sont estimés périodiquement sur le signal de parole de une à plusieurs fois par trame selon le paramètre, pour une durée trame typiquement comprise entre 10 et 30 ms.

[0033] La restitution du signal de parole s'effectue de la façon représentée à la figure 2, en excitant par le pitch ou par un bruit stochastique, un filtre numérique de synthèse 1 qui modélise par sa fonction de transfert le conduit vocal selon que respectivement le son est voisé ou non voisé.

[0034] Un commutateur 2 assure la transmission du pitch ou du bruit à l'entrée du filtre de synthèse 1.

[0035] Un amplificateur 3 de gain variable en fonction de l'énergie du signal de parole est placé en sortie du filtre de synthèse 1.

[0036] Dans le cas d'un modèle paramétrique simple comportant une décision binaire son voisé / son non voisé, la procédure de synthèse peut se résumer à celle représentée sur la figure 2. Cependant le procédé selon l'invention qui est représenté à la figure 3 sous la forme d'un organigramme, est plus complexe et se déroule en quatre étapes, se décomposant en une étape 4 de prétraitement, une étape 5 d'analyse du signal obtenu à l'étape 4 pour l'extraction des paramètres caractérisant le pitch, le voisement, l'énergie, et le spectre du signal de parole, une étape 6 durant laquelle les paramètres obtenus à l'étape 5 sont modifiés et une étape 7 de synthèse d'un signal de parole composé à partir des paramètres modifiés de l'étape 6.

[0037] L'étape 4 est celle qui est classiquement mise en oeuvre dans les vocodeurs. Elle consiste notamment, après avoir converti le signal de parole en un signal numérique, à réduire le bruit de fond en utilisant par exemple la méthode décrite par M.D.Malah, publié dans IEEE trans.Acoust.,Speech Processing, Volume-12 N.6, pp.1109-1121 1984, ayant pour titre "Speech enhancement using a minimum square error short time spectral amplitude estimator", à annuler les échos acoustique en utilisant par exemple la méthode décrite dans l'article de MM.K.Murano, S. Unjani et F. Amano ayant pour titre: "Echo cancellation and applications" publié dans la revue IEEE Com. May, 28 (1), pp 49-55, janvier 1990, à réaliser une commande automatique de gain, ou encore à préaccentuer le signal.

[0038] Le traitement paramétrique du signal de parole obtenu en fin de l'étape 4 est effectué à l'étape 5. Il consiste à découper le signal de parole en échantillons de durée constante Tanalyse (typiquement 5 à 30 millisecondes) pour réaliser sur chacun d'eux l'estimation des paramètres du modèle de signal de parole. En utilisant le modèle d'analyse HSX décrite dans l'article de MM.Gournay et F.Chartier cité précédemment, le pitch et le voisement sont estimés toutes les 22,5 millisecondes. L'information de voisement est donnée sous la forme d'une fréquence de transition entre une bande basse voisée et une bande haute non voisée. L'énergie du signal est estimée toutes les 5,625 millisecondes. Lors des périodes non voisées du signal, elle est estimée sur une durée de 45 échantillons (5,625 ms) et exprimée en dB par échantillon. Lors des périodes voisées du signal, elle est estimée sur un nombre entier de périodes fondamentales au minimum égal à 45 et exprimée en dB par échantillon. L'enveloppe spectrale S(ω) est estimée toutes les 11,25 millisecondes. Elle est obtenue par prédiction linéaire (LPC) par une modélisation auto-régressive d'un filtre d'ordre OLPC= 16 de fonction de transfert :

où A(z) est défini par:

[0039] Dans ce qui suit les paramètres issus de l'analyse sont notés :

PitchAnalyse ;

VoisementAnalyse ;

EnergieAnalyse[i], i=O à 3 ;

LpcAnalyse[k], k=I à 16.

[0040] La procédure de synthèse consiste, pour chaque intervalle de durée Tanalyse, à stimuler le filtre de synthèse donnant S(ω) par la somme pondérée en fréquence (bande basse/ bande haute définie par la fréquence de voisement), d'un bruit blanc pseudo aléatoire pour la bande haute et d'un signal périodique en peigne de Dirac de fréquence fondamentale égale au pitch pour ia bande basse.

[0041] Selon l'invention de nombreuses transformations peuvent être appliquées aux paramètres issus de l'analyse de l'étape 5. Chaque paramètre peut en effet être modifié indépendamment des autres, sans interaction réciproque. De plus, ces transformations peuvent être constantes ou n'être activées que dans des conditions particulières (par exemple, déclenchement de la modification de l'enveloppe spectrale pour certaines configurations de répartition de l'énergie en fonction de la fréquence,... ).

[0042] Ces modifications sont effectuées aux étapes 6 ₁ à 6₄ et elles portent essentiellement sur la valeur du pitch qui caractérise la fréquence fondamentale, le voisement, l'énergie et l'enveloppe spectrale.

[0043] Pour le déroulement de l'étape 6 ₁ toute transformation définissant une nouvelle valeur de « pitch » à partir de la valeur du pitch d'analyse obtenue à l'étape 5 est applicable.

[0044] La transformation élémentaire est l'homothétie, définie par la relation :

avec les limitations suivantes :

[0045] Le facteur Facteur Pitch est ajustable pour le type de surdité considéré.

[0046] Comme pour le pitch la fréquence de voisement peut être modifiée par toute transformation définissant une « fréquence de voisement » pour chaque valeur de la fréquence de voisement analysée à l'étape 5.

[0047] Dans l'exemple de mise en oeuvre de l'invention la transformation choisie est une homothétie, définie par la relation :

avec les limitations suivantes :

[0048] Lorsque la fréquence de transition de voisement issue de l'analyse VoisementAnalyse est maximum (signal entièrement voisé, VoisementAnalyse = VoisementMaximum) la fréquence de voisement utilisée en synthèse est inchangée (VoisementSynthèse = VoisementMaximum). Lui appliquer un facteur multiplicatif serait en effet totalement arbitraire (VoisementAnalyse = VoisementMaximum ne signifie pas une absence de voisement au dessus de VoisementMaxmum). A titre d'exemple VoisementMaximum peut être fixé à 3625 Hz.

[0049] Le facteur Facteur Voisement est ajustable pour le type de surdité considéré.

[0050] Le traitement de l'énergie est effectué à l'étape 6 ₃ Comme précédemment toute transformation définissant une énergie à partir de l'énergie du signal de parole analysé à l'étape 6 ₃ est applicable. Dans l'exemple décrit ci après le procédé selon l'invention applique à l'énergie une fonction de compression à quatre segments linéaires de la manière représentée sur le graphe de la figure 4.

[0051] L'énergie utilisée en synthèse est donnée par la relation :

pour i=O à 3, avec

et avec les limitations suivantes :

Les paramètres de traitements EnergieAnalyseMin, EnergieSynthèseMax, PenteBasse, PenteHaute et EnergieSynthèseSeuil sont ajustables pour le type de surdité considéré.

[0052] Le traitement de l'enveloppe spectrale a lieu à l'étape 6 ₄ Dans cette étape toute transformation définissant un spectre S'(ω) à partir du spectre S(ω) analysé à l'étape 5 est applicable.

[0053] Dans le mode de réalisation de l'invention décrit ci après la transformation élémentaire sur le spectre qui est mise en oeuvre est une compression homothétique de l'échelle des fréquences.

[0054] L'échelle des fréquences est comprimée d'un facteur FacteurSpectre de sorte que les bandes utiles avant et après le traitement soient respectivement égales à [O..FECH/2] et à [O..FECH/(2*FacteurSpectre)], où FECH est la fréquence d'échantillonnage du système.

[0055] La mise en oeuvre de cette compression homothétique est très simple lorsque le facteur de compression est une valeur entière. Il suffit alors de remplacer z par z^{FacteurSpectre} dans l'expression du filtre tout pôle de synthèse, puis d'appliquer au signal synthétisé un filtrage passe-bas de fréquence de coupure FECH/(2*FacteurSpectre).

[0056] Une première justification théorique de la validité du procédé décrit ci-dessus consiste à dire que cette opération équivaut à opérer un suréchantillonnage d'un facteur FacteurSpectre de la réponse impulsionnelle du conduit vocal, par insertion de FacteurSpectre-1 échantillons nuls entre chaque échantillons de la réponse impulsionnelle du conduit vocal d'origine puis par filtrage passe-bas du signal synthétisé avec une fréquence de coupure égale à FECHI(2*FacteurSpectre).

[0057] Une seconde justification théorique consiste à considérer que cette opération équivaut à dupliquer et déplacer les pôles de la fonction de transfert.

[0058] En effet, en considérant que les OLPC pôles uniques notés zi=pi.exp(2iπFi) de la fonction de transfert 1/A(z), les "FacteurSpectre*OLPC pôles" de 1/A(Z^{FacteurSPectre}) sont alors les "FacteurSpectre" racines complexes de chacun des zi. Les pôles conservés par l'opération de filtrage passe-bas sont du type z'i = p_i ^{I/FacteurSpectre} exp(2. i.π.Fi/FacteurSpectre) ce qui montre que leur fréquence de résonance a effectivement subi une compression homothétique d'un facteur "FacteurSpectre".

[0059] Le filtre LPC utilisé en synthèse peut donc s'exprimer sous la forme;

OLPC2 = FacteurSpectre * OLPC ;

LpcSynthèse[k] = 0 pour k=I à OLPC2, k non multiple de FacteurSpectre.

LpcSynthèse [FacteurSpectre * k] = LpcAnalyse[k] pour k=I à OLPC ;

[0060] Il est possible de restreindre le facteur de compression de l'enveloppe spectrale à être un entier compris entre 1 et 4 tel que :

[0061] La parole restituée à l'étape 7 peut encore être accélérée ou ralentie par simple modification de la durée de l'intervalle de temps pris en compte pour la phase de synthèse.

[0062] En pratique, cette opération peut avoir lieu en implémentant une procédure de transformation homothétique définie par la relation :

[0063] Si FacteurTemps > 1, alors il s'agit d'un ralentissement de la parole. Si FacteurTemps < 1, alors il s'agit d'une accélération de la parole.

[0064] En plus des traitements précédents un certain nombre de post-traitements peuvent être envisagés consistant par exemple à effectuer un filtrage passe bande et une égalisation linéaire du signal synthétisé, ou encore un multiplexage du son sur les deux oreilles.

[0065] L'opération d'égalisation linéaire à pour objectif de compenser l'audiogramme du patient en amplifiant ou en atténuant certaines bandes de fréquences. Dans le cadre du prototype, le gain à 7 fréquences (0, 125, 250, 500, 1000, 2000 et 4000 Hz) peut être ajusté au cours du temps entre -80 et +10 dB selon les besoins du patient ou les spécificités de son audiogramme. Cette opération peut être réalisée par exemple par filtrage par une transformée de Fourier rapide (FFT) de la manière décrite par exemple dans le livre de M.D Elliott ayant pour titre "Handbook of Digital signal processing" publié en 1987 chez Academic Press.

[0066] L'opération de multiplexage permet une restitution monophonique (par exemple un signal traité seul) ou stéréophonique (par exemple un signal traité sur une voie et un signal non traité sur une autre). La restitution stéréophonique permet au malentendant d'adapter le traitement pour chacune de ses oreilles (deux égaliseurs linéaires pour compenser deux audiogrammes différents par exemple), et de conserver éventuellement intact sur une oreille une forme de signal auquel il est habitué et sur laquelle il peut s'appuyer pour, par exemple, se synchroniser.

[0067] Le dispositif pour la mise en oeuvre du procédé selon l'invention qui est représenté à la figure 5 comporte une première voie composée d'un dispositif d'analyse 8, d'un dispositif de synthèse 9 et d'un premier égaliseur 10 et d'une deuxième voie comportant un deuxième égaliseur 11, l'ensemble des deux voies étant couplé entre un dispositif de prise de son 13 et une paire d'écouteurs 12_a, 12_b .Les dispositifs d'analyse 8 et de synthèse 9 peuvent être mis en oeuvre en empruntant les techniques connues de réalisation des vocodeurs et notamment celle des vocodeurs HSX précitée. Les sorties des égaliseurs des deux voies sont multiplexées par un multiplexeur 14 pour permettre une restitution du son monophonique ou stéréophonique. Un dispositif de traitement 15 formé par un microprocesseur ou tout dispositif équivalent est couplé au dispositif de synthèse 9 pour assurer la modification des paramètres fournis par le dispositif d'analyse 8.

[0068] Un dispositif de prétraitement 16 interposé entre le dispositif de prise de son 13 et chacune des deux voies assure le débruitage et la conversion du signal de parole en échantillons numériques Les échantillons numériques débruités sont appliqués respectivement à l'entrée de l'égaliseur 11 et à l'entrée du dispositif d'analyse 8.

[0069] Suivant d'autres modes de réalisation du dispositif selon l'invention, le dispositif de traitement 15 peut être intégré au dispositif de synthèse 9, comme il est aussi possible d'intégrer l'ensemble des traitements d'analyse et de synthèse dans un même logiciel exécutable sur un ordinateur personnel ou sur un répondeur téléphonique par exemple.

Revendications

1. Procédé pour la correction auditive des malentendants, du type consistant à analyser un signal de parole (5) pour en extraire des paramètres caractérisant le pitch, le voisement, l'énergie et le spectre du signal de parole, à modifier (6) les paramètres pour rendre la parole intelligible à un malentendant, et à synthétiser (7) un signal de parole perceptible par le malentendant à partir des paramètres modifiés de la manière suivante :

• Le paramètre caractérisant le pitch est modifié (61) en appliquant à la valeur du pitch extrait un facteur multiplicateur,

• Le paramètre caractérisant l'énergie est modifié (63) par une fonction de compression,

• Le paramètre caractérisant l'enveloppe spectrale est modifié (64) par une compression homothétique de l'échelle des fréquences

Caractérisé en ce que

• Le paramètre caractérisant le voisement est donné sous la forme d'une fréquence de transition entre une bande voisée et une bande haute non voisée, qui est modifiée (62) par un facteur multiplicateur afin de créer une bande haute modifiée sur laquelle on génère un bruit blanc pseudo aléatoire lors de la phase de synthèse ; et en ce que

• La durée de l'intervalle de temps pris en compte pour la phase de synthèse est modifié (7) en multipliant l'intervalle de temps par un facteur temps.

2. Dispositif pour la mise en oeuvre du procédé selon la revendication 1, caractérisé en ce qu'il comprend un dispositif d'analyse (8) pour l'extraction des paramètres du signal de parole couplé à un dispositif de synthèse (9) ainsi qu'un dispositif de traitement (14) couplé au dispositif de synthèse (9) arrangé pour modifier les paramètres fournis par le dispositif d'analyse (8) selon les caractéristiques de la revendication 1 et appliquer les paramètres modifiés au dispositif de synthèse(9) afin de reconstituer un signal de parole avec les paramètres modifiés.

3. Dispositif selon la revendication 2, caractérisé en ce que le dispositif d'analyse (8) et le dispositif de synthèse (9) comportent un dispositif d'analyse et de synthèse de vocodeur à prédiction linéaire.

Claims

1. Method for the auditory correction of hearing impaired individuals, of the type consisting in analysing a speech signal (5) so as to extract therefrom parameters characterizing the pitch, the voicing, the energy and the spectrum of the speech signal, in modifying (6) the parameters so as to render the speech intelligible to a hearing impaired individual, and in synthesizing (7) a speech signal perceptible to the hearing impaired individual on the basis of the parameters modified in the following manner:

• the parameter characterizing the pitch is modified (61) by applying a multiplier factor to the value of the pitch extracted,

• the parameter characterizing the energy is modified (63) by a compression function,

• the parameter characterizing the spectral envelope is modified (64) by a homothetic compression of the frequency scale

characterized in that

• the parameter characterizing the voicing is given in the form of a frequency of transition between a voiced band and an unvoiced high band, which is modified (62) by a multiplier factor so as to create a modified high band on which pseudo-random white noise is generated during the synthesis phase; and in that

• the duration of the time interval taken into account for the synthesis phase is modified (7) by multiplying the time interval by a time factor.

2. Device for the implementation of the method according to Claim 1, characterized in that it comprises an analysis device (8) for extracting the parameters of the speech signal coupled to a synthesis device (9) as well as a processing device (14) coupled to the synthesis device (9) devised so as to modify the parameters provided by the analysis device (8) according to the characteristics of Claim 1 and to apply the modified parameters to the synthesis device (9) so as to reconstruct a speech signal with the modified parameters.

3. Device according to Claim 2, characterized in that the analysis device (8) and the synthesis device (9) comprise a linear prediction vocoder analysis and synthesis device.

Ansprüche

1. Verfahren zur Anpassung eines Hörgeräts für Hörbehinderte, das darin besteht, ein Wortsignal (5) zu analysieren, um daraus Parameter zu extrahieren, die die Tonhöhe, die Stimmhaftigkeit, die Energie und das Spektrum des Sprachsignals charakterisieren, die Parameter zu modifizieren (6), um das Wort für einen Hörbehinderten verstehbar zu machen, und ein für den Hörbehinderten wahrnehmbares Wortsignal aus den modifizierten Parametern auf folgende Weise zu synthetisieren (7):

- der die Tonhöhe charakterisierende Parameter wird modifiziert (61), in dem auf den Wert der extrahierten Tonhöhe ein Multiplikationsfaktor angewandt wird,

- der die Energie charakterisierende Parameter wird durch eine Kompressionsfunktion modifiziert (63),

- der die Spektrumeinhüllende charakterisierende Parameter wird durch eine homothetische Kompression der Frequenzskala modifiziert (64),

dadurch gekennzeichnet, dass

- der die Stimmhaftigkeit charakterisierende Parameter in Form einer Übergangsfrequenz zwischen einem stimmhaften Band und einem nicht stimmhaften Hochband gegeben ist, die durch einen Multiplikationsfaktor modifiziert (62) wird, um ein modifiziertes Hochband zu erzeugen, auf dem ein pseudostochastisches, weißes Rauschen erzeugt wird, und dass

- die Dauer des für die Synthesephase berücksichtigten Zeitintervalls modifiziert wird (7), indem das Zeitintervall mit einem Zeitfaktor multipliziert wird.

2. Vorrichtung zur Durchführung des Verfahrens nach Anspruch 1, dadurch gekennzeichnet, dass sie eine Analysevorrichtung (8) für das Extrahieren von Parametern des Wortsignals umfasst, die mit einer Synthesevorrichtung (9) verbunden ist, sowie eine Verarbeitungsvorrichtung (14), die mit der Synthesevorrichtung (9) verbunden ist und dafür ausgelegt ist, die durch die Analysevorrichtung (8) gelieferten Parameter entsprechend den Merkmalen des Anspruchs 1 zu modifizieren und die modifizierten Parameter an die Synthesevorrichtung (9) anzulegen, um ein Wortsignal mit den modifizierten Parametern zu erhalten.

3. Vorrichtung nach Anspruch 2, dadurch gekennzeichnet, dass die Analysevorrichtung (8) und die Synthesevorrichtung (9) eine Vocoderanalysevorrichtung und -synthesevorrichtung mit linearer Prädiktion sind.

Dessins