(19)
(11) EP 0 341 128 A1

(12) DEMANDE DE BREVET EUROPEEN

(43) Date de publication:
08.11.1989  Bulletin  1989/45

(21) Numéro de dépôt: 89401168.3

(22) Date de dépôt:  25.04.1989
(51) Int. Cl.4G10L 3/00
(84) Etats contractants désignés:
AT BE CH DE ES GB GR IT LI LU NL SE

(30) Priorité: 04.05.1988 FR 8806001

(71) Demandeur: THOMSON-CSF
75008 Paris (FR)

(72) Inventeur:
  • Laurent, Pierre André
    F-92045 Paris la Défense (FR)

(74) Mandataire: Lincot, Georges et al
THOMSON-CSF, SCPI, B.P. 329, 50, rue Jean-Pierre Timbaud
92402 Courbevoie Cédex
92402 Courbevoie Cédex (FR)


(56) Documents cités: : 
   
       


    (54) Procédé et dispositif de détection de signaux vocaux


    (57) Le procédé consiste : à découper le signal en trame, à échantillonner chaque trame pour obtenir un signal numérique comportant un nombre n déterminés d'échantillons, à préaccentuer (1) le signal numérique, à filtrer (2) le signal numérique préaccentué au moyen d'un filtre numérique passe haut pour obtenir un signal numérique filtré, à mesurer (3, 4) dans chaque trame l'énergie maximale du signal préaccentué et l'énergie maximale du signal numérique filtré, pour effectuer (5) un rapport d'énergie R entre l'énergie maximale du signal numérique filtré et l'énergie maximale du signal numérique préaccentué. Il consiste également à calculer entre deux bornes les valeurs moyennes à long terme de la valeur maximale de l'énergie du signal filtré et du rapport d'énergie, et à calcu­ler à partir des valeurs moyennes à long terme quatre valeurs de seuil, deux maximales constituant respectivement deux bornes inférieures de l'état parole pour le signal filtré et le rapport d'énergie, et deux minimales constituant respectivement deux bornes supérieures de l'état bruit pour le signal filtré et le rapport d'énergie, pour comparer à ces valeurs de seuil l'éner­gie du signal filtré maximale et le rapport d'énergie, pour décider de la présence du signal vocal dans le signal bruité lorsque l'énergie maximale du signal numérique filtré ou le rapport d'énergie sont supérieurs respectivement à leurs valeurs maximale de seuil.




    Description


    [0001] La présente invention concerne un procédé et un dispo­sitif de détection de signaux vocaux utilisables notamment dans les transmissions radioélectriques à l'alternat à bord de véhicu­les.

    [0002] La plupart des détecteurs d'activité vocale connus ne peuvent fonctionner correctement que pour des rapports signal à bruit suffisamment élevés, de l'ordre de 20 dB au minimum, ce qui correspond à des conditions de fonctionnement dans des environnements calmes de type bureau.

    [0003] A bord d'un véhicule, la discrimination parole/bruit doit tenir compte en revanche d'un rapport signal à bruit beau­coup plus faible, le plus souvent inférieur à 10 dB. Dans certai­nes conditions (régime moteur élevé dans un véhicule moyenne­ment insonorisé, par exemple) le niveau de bruit peut même dé­passer celui du signal.

    [0004] Enfin, le niveau et le type de bruit à discriminer va­rient selon les conditions inhérentes au véhicule (degré d'inso­norisation par exemple) mais aussi en fonction du parcours effec­tué, un cas particulièrement défavorable étant celui du parcours urbain où les bruits à prendre en compte sont généralement d'un niveau élevé, non stationnaire et naturellement très varié.

    [0005] Un exemple de réalisation d'un détecteur d'activité vo­cale prévu pour fonctionner dans des milieux bruyants est connu de la demande de brevet 79 24227 du 28 septembre 1979 déposée au nom de la demanderesse. Mais ce détecteur ne permet d'opti­miser la discrimination parole/bruit que pour les sons voisés et la décision est prise en comparant le signal vocal seulement à une tension de seuil variable asservie sur la valeur de l'ampli­tude crête du signal vocal, sans tenir compte du niveau réel de bruit. Il en résulte des performances insuffisantes pour permet­tre un fonctionnement correct dans un milieu fortement perturbé et où le signal de parole est noyé dans le bruit.

    [0006] Le but de l'invention est de pallier les inconvénients précités.

    [0007] A cet effet, l'invention a pour objet, un procédé de détection d'un signal vocal dans un signal noyé dans du bruit, caractérisé en ce qu'il consiste :
    - à découper le signal en trame,
    - à échantillonner chaque trame pour obtenir un signal numérique comportant un nombre n déterminés d'échantillons,
    - à préaccentuer le signal numérique pour obtenir un signal numérique préaccentué,
    - à filtrer le signal numérique préaccentué au moyen d'un filtre numérique passe haut pour obtenir un signal numéri­que filtré,
    - à mesurer dans chaque trame l'énergie maximale des échantillons du signal préaccentué et l'énergie maximale des échantillons du signal numérique filtré,
    - à effectuer un rapport d'énergie entre l'énergie maximale des échantillons du signal numérique filtré et l'éner­gie maximale des échantillons du signal numérique préaccentué,
    - à calculer entre deux bornes les valeurs moyennes à long terme de l'énergie des échantillons du signal filtré et du rapport d'énergie,
    - à calculer à partir des valeurs moyennes à long terme quatre valeurs de seuil, deux maximales constituant respec­tivement deux bornes inférieures de l'état parole pour le signal filtré et le rapport d'énergie, et deux minimales constituant respectivement deux bornes supérieures de l'état bruit pour le signal filtré et le rapport d'énergie, pour comparer à ces va­leurs de seuil, l'énergie maximale du signal filtré et le rap­port d'énergie,
    - à décider de la présence du signal vocal dans le signal bruité lorsque l'énergie maximale du signal numérique filtré, ou le rapport d'énergie sont supérieurs respectivement à leurs valeurs maximales de seuil
    - et à décider de l'absence d'un signal vocal dans le signal bruité lorsque l'énergie maximale du signal numérique filtré ou le rapport d'énergie R sont inférieurs respectivement à leurs valeurs minimales de seuil.

    [0008] L'invention a également pour objet un dispositif pour la mise en oeuvre du procédé précité.

    [0009] D'autres caractéristiques et avantages de l'invention apparaîtront ci-après à l'aide de la description faite en regard des dessins annexés qui représentent :

    Les figures 1 à 4 des organigrammes figurant les diffé­rentes étapes du procédé mis en oeuvre par l'invention.

    La figure 5 un dispositif de calcul du rapport d'éner­gie mettant en oeuvre les étapes 1 à 5 du procédé selon l'inven­tion.

    La figure 6 un mode de réalisation d'un dispositif pour le calcul de la valeur de l'échantillon ayant le maximum d'énergie dans une trame de signal filtré ou du signal préaccentué de la figure 5.

    La figure 7 un mode de réalisation d'un dispositif pour la mise en oeuvre des étapes 6 à 11 de la figure 1.

    Les figures 8A et 8B deux diagrammes représentant les procédés de détermination des seuils figurés aux étapes 12 à 22 de la figure 2.

    La figure 9 un mode de réalisation du dispositif de calcul des valeurs moyennes Xmoy ou Rmoy illustrées aux éta­pes 23 à 28 de la figure 3.

    Les figures 10A et 10B deux circuits pour le calcul des valeurs de seuil selon l'invention.

    Les figures 11A et 11B deux diagrammes pour illustrer le mode de comparaison par seuils adaptatifs selon l'invention.

    La figure 12 un mode de réalisation d'un dispositif de comparaison pour la mise en oeuvre des étapes 30 à 40 de la figure 4.

    La figure 13 un diagramme d'état figurant l'algorithme de décision permettant de définir la présence ou non d'un signal vocal dans le signal bruité.



    [0010] Le procédé selon l'invention qui est illustré aux figures 1 à 4, dans un exemple de mise en oeuvre pratique, opère sur des trames de signal bruité d'environ 20 millisecondes et échantillonnées à raison de 160 échantillons par trame pour donner des échantillons de signal S. Comme représenté aux éta­pes 1 à 5 de la figure 1, le signal numérique S sur lequel à lieu le traitement est d'abord préaccentué à l'étape 1 pour donner des échantillons de signal Sn, puis filtré à l'étape 2 pour donner des échantillons de signal Sph(n) par un filtre numérique passe haut de fréquence de coupure FC = 1200 Hz. Aux étapes 3 et 4 les paramètres suivants :
    X = {max (Sn)},
    et Xph = max { Sph(n)}, sont calculés ; n étant compris entre 1 et 160. Ces calculs consistent à rechercher dans chaque suite d'échantillons S(n) et Sph(n) l'échantillon qui a l'amplitude ou l'énergie maximale

    [0011] L'étape 5 consiste à calculer le rapport R = Xph/X entre les deux paramètres Xph et X calculés aux étapes 3 et 4.

    [0012] Les étapes 6 à 11 qui suivent consistent à calculer des paramètres X1 et R1 suivant les relations
    - X₁ = Xph si Xph est supérieur au paramètre X₁ calculé à la trame précédente et désigné par X1old sur la figure 1 ;
    - ou X₁ = TX.X1old + (1-TX.Xph) dans le cas contraire ;
    - R₁ = R si R est supérieur au rapport R calculé à la trame précédente et désigné par Rold sur la figure 1 ;
    - ou R₁ = Tr.R1old+ (1-Tr).R dans le cas con­traire. Ceci permet d'une trame à la suivante d'autoriser une croissance instantanée des valeurs des paramètres X1 et R1 alors que leurs décroissances s'effectuent plus lentement avec des constantes de temps respectivement égales à TX et Tr. Se­ lon un mode préféré de réalisation de l'invention la valeur des constantes de temps est fixée à 0,75 ce qui correspond à envi­ron 70 millisecondes. Les étapes 12 à 29 suivantes qui sont illustrées aux figures 2 et 3, consistent à déterminer quatre seuils de détection à partir de la valeur moyenne à long terme des paramètres Xph et R. Ces derniers sont tout d'abord bor­nés à l'étape 12 entre des valeurs maximales et minimales et constantes de manière à prohiber de trop grandes variations des seuils. Les bornes de variation de Xph et R sont notées Xphinf, Sphsup, R.inf, R.sup. Les étapes 13 à 22 consis­tent à calculer deux paramètres X₂ et R₂ vérifiant les rela­tions
    X₂ = MAX{MIN{Xph,Xph .sup,Xph.inf}
    R₂ = MAX{MIN{R, R.sup}, R.inf}
    Les moyennes à long terme des paramètres Xph et R notés respectivement Xmoy et Rmoy sont calculées aux étapes 23 à 28 en application des relations suivantes :
    - Xmoy = Tm.Xmoy.old + (1-Tm).X₂, si X₂ est supé­rieur au paramètre Xmoy calculé à la trame précédente et désigné par Xmoy.old sur la figure 3 ;
    - ou Xmoy = Td.Xmoy.old + (1-Td).X₂ dans le cas contraire.
    - Rmoy = Tm.Rmoy.old + (1-Tm)R₂, si R₂ est supé­rieur au paramètre Rmoy calculé à la trame précédente et dési­gné par Rmoy.old sur la figure 3 ;
    - ou Rmoy = Td.Rmoy.old + (1-Td).R₂ dans le cas contraire.

    [0013] Dans ces relations la constante de temps de montée Tm assure une montée exponentiellement lente, alors que la constante de temps de descente Td permet une descente exponen­tiellement rapide afin que la valeur moyenne considérée retombe rapidement à un niveau correspondant au bruit. Les valeurs de ces constantes de temps sont dans le mode de réalisation préféré de l'invention fixées à 0,95 pour la montée, soit environ 400 millisecondes et à 0,2 pour la descente, soit environ 13 millisecondes. Enfin les quatre valeurs de seuils sont calcu­lés à l'étape 29 à partir des valeurs X moy et R moy définies précédemment par les relations :
    SX₁ parole = a.Xmoy + Xph.inf
    SX₁ bruit = b.Xmoy + Xph.inf
    SR₁ parole = a.Rmoy + R.inf
    SR₁ bruit = b.R moy + R.inf

    [0014] Les valeurs des coefficients multiplicateurs a et b sont dans l'exemple de réalisation préféré de l'invention fixées à 1,8 et 1,25. Il faut noter que par ailleurs, si l'un des para­mètres Xph ou R est inférieur à la borne inférieure corres­pondante, la décision bruit est prise automatiquement.

    [0015] Un dispositif de calcul du rapport d'énergie mettant en oeuvre les étapes 1 à 5 du procédé est représenté à la figure 5. Ce dispositif comprend un premier filtre 43, passe haut, de fonction de transfert H(z) = 1 - 0,86 z⁻¹, qui réalise une préaccentuation du signal représenté à l'étape 1, ce filtre est couplé par sa sortie d'une part, à un deuxième filtre passe haut 44 ayant une fréquence de coupure d'environ 1200 Hz et d'autre part, à un dispositif de calcul d'énergie 46. Le deuxième filtre passe haut 44 est également couplé par sa sortie à un dispositif de calcul d'énergie 45 similaire au dispositif de calcul d'énergie 46. Le filtre 44 et le dispositif de calcul d'énergie 45 fournissent le paramètre Xph en exécution des étapes 2 et 3 du procédé et le dispositif de calcul d'énergie 46 fourni le paramètre X. Les paramètres X et Xph sont appliqués respectivement sur une première entrée et une deuxième entrée d'opérande d'un circuit diviseur 47 pour réaliser le calcul du paramètre R conformément à l'étape 5.

    [0016] Un mode de réalisation des dispositifs de calcul d'énergie 45 et 46 est représenté à la figure 6. Ce circuit comprend un circuit comparateur 48 couplé à un registre 49 au travers d'un circuit aiguilleur 50. Le circuit comparateur 48 possède deux entrées, une première entrée reçoit les échantil­lons de signal S(n) fourni par le filtre numérique 43 ou les échantillons de signal fourni par le filtre numérique 44 ; la deuxième entrée est reliée à la sortie du registre 49. Le cir­cuit aiguilleur 50 est commandé par la sortie du circuit compara­teur 48 et aiguille les échantillons de signal S(n) ou Sph à l'entrée du registre 49 lorsque la valeur de l'échantillon de signal S(n) ou Sph(n) est supérieure au contenu du registre 49. Dans le cas contraire le registre 49 reste rebouclé sur lui-même.

    [0017] Un mode de réalisation du dispositif pour la mise en oeuvre des étapes 6 à 11 est représenté à la figure 7. Ce dispo­sitif comprend un circuit comparateur 51 couplé à un circuit accumulateur 52 au travers d'un circuit aiguilleur 53. Un cir­cuit multiplicateur 54 est relié par une première entrée d'opérande à une première entrée du circuit comparateur 51 et reçoit sur sa deuxième entrée d'opérande les paramètres 1-TX ou 1-Tr figurés aux étapes 8 et 11 du procédé. Un deuxième circuit multiplicateur 55 est relié par une première entrée d'opérande à la sortie du circuit accumulateur 52 et reçoit sur une deuxième entrée d'opérande les paramètres TX ou Tr figurés aux étapes 8 et 11 du procédé. Les sorties des circuits multiplicateurs 54 et 55 sont reliées respectivement à une pre­mière entrée et une deuxième entrée d'opérande d'un circuit additionneur 56 dont la sortie est reliée à une première entrée du circuit aiguilleur 53. La sortie du circuit accumulateur 52 est d'autre part reliée à la deuxième entrée d'opérande du cir­cuit comparateur 51. Conformément aux étapes 6 à 11, les para­mètres Xph ou R sont appliqués sur la première entrée du circuit comparateur 51 et sont comparés aux contenus X.old ou R.old du circuit accumulateur 52. Si conformément à l'étape 6 ou à l'étape 9 les paramètres Xph ou R sont supérieurs au conte­nu X.old ou R.old du circuit accumulateur 52, le circuit aiguil­leur 53 met à jour le contenu de l'accumulateur 52 par l'un des paramètres Xph ou R conformément aux étapes 7 et 10. Dans le cas contraire le circuit aiguilleur 53 commute la sortie du circuit additionneur 56 à l'entrée du circuit accumulateur 52, pour mettre à jour le contenu de l'accumulateur par les paramè­tres X1 ou R1 définis par les relations décrites précédemment des étapes 8 et 11. Dans ces relations le produit (1 - Tx) x Xph ou le produit (1-Tr) x R sont effectués par le circuit multiplicateur 64 et les produits TX x X.old ou TR par R.old sont effectués par le circuit multiplicateur 55. La somme des produits obtenus est réalisée par le circuit addi­tionneur 56.

    [0018] Les étapes 12 à 22 du procédé représenté à la figure 2 sont exécutées à l'aide d'amplificateurs à seuil non représentés dont les caractéristiques qui sont par contre représentées aux figure 8A et 8B, permettent de ne pas prendre en compte les valeurs trop élevées des paramètres X₁ ou R₁. D'après ces caractéristiques chaque paramètre X₁ ou R₁ est limité entre deux valeurs X1ph.inf et X1ph.sup ou R₁.inf et R₁.sup. Ces caractéristiques permettent de générer les paramètres X₂ et R₂ suivant des lois linéaires des paramètres X₁ et R₁ entre les valeurs de seuil X1ph.inf et X1ph.sup ou R₁.inf et R₁.sup, les paramètres X₂ et R₂ étant limités en ampli­tude pour les valeurs des paramètres X₁ et R₁ extérieures à ces seuils.

    [0019] Un mode de réalisation d'un dispositif de calcul des valeurs moyennes XM ou RM illustré par les étapes 23 à 28 du procédé est représenté à la figure 9. Ce dispositif comprend, reliés dans cet ordre en série, un circuit soustracteur 57, un circuit multiplicateur 58, un circuit additionneur 59 et un registre 60. Le circuit soustracteur 57 comprend une premier entrée d'opérande sur laquelle sont appliqués les paramètres X₂ ou R₂ et une deuxième entrée d'opérande qui est reliée à la sortie du registre 60. Le dispositif comprend également un circuit comparateur 61 à deux entrées reliées respectivement aux entrées du circuit soustracteur 57. La sortie du circuit compara­teur 61 est reliée à une entrée de commande d'un circuit aiguil­leur 62. Le circuit aiguilleur 62 possède deux entrées sur les­quelles sont appliquées les constantes de temps Tm et Td. La sortie du circuit aiguilleur 62 est reliée à une première entrée d'opérande du circuit multiplicateur 58, la deuxième entrée d'opérande du circuit multiplicateur 58 étant reliée à la sortie du circuit soustracteur 57. La sortie du circuit multipli­cateur 58 est d'autre part reliée à une première entrée d'opérande du circuit additionneur 59, la deuxième entrée d'opérande du circuit additionneur 59, étant reliée à la pre­mière entrée d'opérande du circuit soustracteur 57. Ce disposi­tif permet d'effectuer les opérations du procédé représenté aux étapes 23 à 28. Conformément à l'étape 23 ou à l'étape 26, les paramètres X₂ ou R₂ sont appliqués sur la première entrée de comparaison du circuit comparateur 61 pour être comparés au contenu Xmoy.old du registre 60, et si leur valeur respective est supérieure au contenu du registre 60, le circuit comparateur 61 commande le circuit aiguilleur 62 pour appliquer la constante de temps Tm sur la première entrée d'opérande du circuit multiplicateur 58. Le circuit multiplicateur 58 reçoit sur sa deuxième entrée d'opérande le résultat de la soustraction effec­tuée entre le contenu Xmoy.old du registre 60 et les valeurs des paramètres X₂ ou R₂ appliquées sur sa première entrée d'opérande. Les résultats des multiplications Tm(Xmoy.old - X₂) ou Tm.(Rmoy.old-R₂) effectuées par le circuit multiplicateur 58 sont appliqués sur la première entrée d'opérande du circuit additionneur 59 pour être addition­nés aux paramètres X₂ ou R₂ appliqués sur sa deuxième entrée d'opérande. Le résultat de l'addition effectuée par le circuit additionneur 69 est alors transféré à l'intérieur du registre 60. Cependant, si aux étapes 23 ou 26 les valeurs des paramètres X₂ ou R₂ ne sont pas supérieures aux valeurs Xmoy.old ou Rmoy.old trouvées dans le registre 60, le cir­cuit aiguilleur 62 est commandé par le circuit comparateur 61 pour appliquer sur la première entrée d'opérande du circuit multiplicateur 58 la valeur de la constante de temps Td. Dans ces conditions, les calculs sont menés de façon similaire à la description précédente, la valeur de la constante de temps Tm étant remplacée par la valeur de la constante de temps Td conformément aux relations indiquées aux étapes 25 et 28 du procédé.

    [0020] Les calculs des valeurs de seuil de parole ou de bruit (SX₁ "parole" et SX₁ "bruit", SR₁ "parole", et SR₁ "bruit") conformément aux relations établies à l'étape 29 du procédé sont effectuées par les circuits décrits aux figures 10A et 10B. Les seuils SX₁ "parole" ou SR₁ "parole" sont calcu­lés au moyen d'un circuit multiplicateur 63 relié à un circuit additionneur 64. Le circuit multiplicateur 63 reçoit sur une première entrée d'opérande les paramètres Xmoy ou Rmoy fournis par le registre 60 de la figure 9 et il possède une deuxième entrée d'opérande sur laquelle est appliqué le paramè­tre a. Le résultat de la multiplication est appliqué sur une première entrée d'opérande du circuit additionneur 64 pour être additionné au seuil SPH.inf qui est appliqué sur sa deuxième entrée d'opérande. La sortie du circuit additionneur 64 fournit le seuil SX₁ "parole" ou SR₁ "parole".

    [0021] De manière similaire, les seuils SX₁ "bruit" et/ou SR₁ "bruit" sont calculés au moyen du circuit multiplicateur 65 et du circuit additionneur 66. La première entrée d'opérande du circuit multiplieur 65 reçoit les paramètres Xmoy ou Rmoy fournis par le registre 60 de la figure 9, il possède une deuxième entrée d'opérande sur laquelle est appliqué le paramè­tre b. Sa sortie est reliée à une première entrée d'opérande du circuit additionneur 66 dont la deuxième entrée d'opérande re­çoit la valeur du paramètre de seuil Xph.inf. La sortie du circuit additionneur 66 délivre la valeur de seuil SX₁ "bruit" et SR₁ "bruit". Ces valeurs de seuil permettent de comparer les paramètres X₁ et R₁ conformément aux étapes 30 à 40 du procédé et selon les diagrammes représentés aux figures 11A et 11B. Un dispositif de comparaison correspondant est représenté à la figure 12. Ce circuit comprend un ensemble de quatre cir­cuits comparateurs référencés de 67 à 70 couplés respectivement à quatre entrées d'un discriminateur de parole/bruit 71. Le circuit comparateur 67 compare le paramètre X₁ au seuil de parole SX₁ "parole", le comparateur 68 compare le paramètre X₁ au seuil SX₁ "bruit", le comparateur 69 compare le para­mètre R1 au seuil SR₁ "parole" et le comparateur 70 compare le paramètre R₁ au seuil SR₁ "bruit". Le discriminateur pa­role/bruit 71 élabore un signal d'activité vocale DAV conformé­ment au diagramme d'état qui est représenté à la figure 13. Ce diagramme d'état possède deux états stables DAV0 et DAV1 et des états instables figurés par les lettres L1 à L4. L'état stable DAV0 est l'état "bruit" dans lequel se trouve le détec­teur d'activité vocale en l'absence de signal de parole, et l'état stable DAV1 est l'état dans lequel se trouve le détecteur d'activité locale lorsque le signal qui est appliqué à son en­trée comprend un signal de parole. Lorsque le détecteur est dans l'état "bruit" DAV0 il ne passe à l'état parole DAV1 que si l'un des deux paramètres X₁ et R₁ est supérieur au seuil de parole correspondant SX₁ "parole" ou SR₁ "parole" en transi­tant par l'état instable L1. Sinon la décision bruit est mainte­nue, c'est-à-dire si le paramètre X₁ est inférieur au seuil SX₁ "parole" et que le paramètre R₁ est inférieur au paramè­tre SR1 "parole".

    [0022] Par contre, lorsque le détecteur d'activité vocale est dans l'état parole DAV1 il ne passe à l'état bruit DAV0 que si l'un des deux paramètres X₁ et R₁ est inférieur au seuil de bruit correspondant c'est-à-dire si X₁ est inférieur au seuil SX₁ bruit et R₁ inférieur à SR₁ bruit. Dans ces conditions il transite par l'état instable L2. Cet algorithme des change­ments d'états du signal DAV est figuré aux étapes 30 à 39 de la figure 4. Après chaque changement d'état du signal DAV, et après une phase d'initialisation représentée à l'étape 40 le procédé retourne exécuter l'étape 6 de la figure 1.

    [0023] Cependant, comme ceci est représenté aux étapes 41 et 42 du diagramme de la figure 4, le passage à l'état bruit DAV0 n'est effectif qu'au bout d'un certain temps, calculé par un compteur de temporisation, noté "Hang", non représenté qui est chargé à une valeur de compte maximale aux étapes 35 et 39 chaque fois qu'un état "parole" DAV1 est décidé, et dont le contenu est diminué de une unité à chaque fois que la décision DAV0 a lieu à l'étape 36. Ceci permet d'éviter des passages systématiques à l'état bruit dans les trous de parole du locu­teur ou de couper la fin d'un mot si elle est de faible énergie.

    [0024] Il est bien évident que l'exemple de mise en oeuvre du procédé selon l'invention n'est pas limité au dispositif qui vient d'être décrit et qu'il peut tout aussi bien être mis en oeuvre au moyen d'une structure comprenant des moyens de calcul microprogrammés, enregistrés par exemple dans les mémoi­res mortes ou de données d'un microprocesseur de traitement du signal.


    Revendications

    1. Procédé de détection d'un signal vocal dans un signal noyé dans du bruit, caractérisé en ce qu'il consiste :
    - à découper le signal en trame,
    - à échantillonner chaque trame pour obtenir un signal numérique comportant un nombre n déterminés d'échantillons,
    - à préaccentuer (1) le signal numérique pour obtenir un signal numérique préaccentué,
    - à filtrer (2) le signal numérique préaccentué au moyen d'un filtre numérique passe haut (44) pour obtenir un signal numérique filtré,
    - à mesurer (3, 4) dans chaque trame l'énergie maxi­male des échantillons du signal préaccentué et l'énergie maxi­male des échantillons du signal numérique filtré,
    - à effectuer (5) un rapport d'énergie R entre l'éner­gie maximale du signal numérique filtré et l'énergie maximale des échantillons du signal numérique préaccentué,
    - à calculer (12..28) entre deux bornes les valeurs moyennes à long terme de la valeur maximale de l'énergie des échantillons du signal filtré et du rapport d'énergie,
    - à calculer (29) à partir des valeurs moyennes à long terme quatre valeurs de seuil, deux maximales constituant respec­tivement deux bornes inférieures de l'état parole pour le signal filtré et le rapport d'énergie, et deux minimales constituant respectivement deux bornes supérieures de l'état bruit pour le signal filtré et le rapport d'énergie, pour comparer à ces va­leurs de seuil l'énergie du signal filtré maximale et le rapport d'énergie,
    - à décider (30..40) de la présence du signal vocal dans le signal bruité lorsque l'énergie maximale du signal numé­rique filtré, ou le rapport d'énergie sont supérieurs respective­ment à leurs valeurs maximale de seuil,
    - et à décider (30..40) de l'absence d'un signal vocal dans le signal bruité lorsque l'énergie maximale du signal numé­ rique filtré ou le rapport d'énergie R sont inférieurs respecti­vement à leurs valeurs minimales de seuil.
     
    2. Procédé selon la revendication 1, caractérisé en ce que la préaccentuation du signal numérique est effectuée à l'aide d'un filtre numérique passe haut (43) de transformée en z (H(z) = 1 - 0,86 z⁻¹.
     
    3. Procédé selon l'une quelconque des revendications 1 et 2, caractérisé en ce que le filtre numérique passe haut (44) a une fréquence de coupure d'environ 1200 Hz.
     
    4. Procédé selon l'une quelconque des revendications 1 à 3, caractérisé en ce que la mesure de l'énergie maximale (45, 46) dans chaque trame a lieu sur l'échantillon d'amplitude maxi­mum.
     
    5. Procédé selon l'une quelconque des revendications 1 à 4, caractérisé en ce que la détermination de la valeur moyenne à long terme Xm de la valeur maximale de l'énergie du signal filtré est calculée (24, 25) en appliquant dans chaque trame courante une relation de récurrence de la forme :
    Xmoy = Tm.Xmoy.old + (1-Tm)X₂
    si la valeur du paramètre X₂ est supérieure au paramètre Xmoy.old
    ou suivant une relation de la forme
    Xmoy = Td.Xmoy.old + (1-Td)X₂
    si la valeur du paramètre X₂ est inférieure au paramètre Xmoy.old
    où : la valeur X₂ est égale à la valeur de l'échantillon Xph d'énergie maximale dans chaque trame, limitée entre deux valeurs de seuil Xp.sup et Xph.inf, Xmoy.old est la valeur moyenne à long terme calculée dans la trame précédente, et Tm et Td sont des constantes de temps ; Tm étant une constante de temps supérieure à Td.
     
    6. Procédé selon la revendication 5, caractérisé en ce que la détermination de la valeur moyenne Rmoy de la valeur maximale du rapport d'énergie R est calculée (27, 28) en appli­ quant dans chaque trame courante une relation de récurrence de la forme :
    Rmoy = Tm Rmoy.old + (1-Tm)R₂
    si le paramètre R₂ est supérieur au paramètre Rmoy.old et suivant une relation de récurrence de la forme :
    Rmoy = Td Rmoy.old + (1-Td)Ré
    si le paramètre R₂ est inférieur au paramètre Rmoy ; Rmoy.old désignant le rapport d'énergie moyen à long terme calculé dans la trame précédente.
     
    7. Procédé selon les revendications 5 et 6, caractéri­sé en ce que les quatre valeurs de seuil sont calculées (29) en appliquant les relations :
    SX₁ parole = a.Xmoy + Xph.inf
    SX₁ bruit = b.Xmoy + Xph.inf
    SR₁ parole = a.Rmoy + R.inf
    SR₁ bruit = b.R moy + R.inf
    les paramètres a et b étant des constantes.
     
    8. Procédé selon la revendication 7, caractérisé en ce que a = 1,8 et b = 1,25.
     
    9. Dispositif pour la mise en oeuvre du procédé selon l'une quelconque des revendications 1 à 8, caractérisé en ce qu'il comprend des premiers moyens (43-47) pour calculer dans chaque trame le rapport entre l'énergie maximale du signal préaccentué et l'énergie maximale du signal numérique filtré
    - des deuxièmes moyens moyens (52..52) pour calculer les va­leurs moyennes à long terme de la valeur maximale de l'énergie du signal filtré et du rapport d'énergie,
    - des troisièmes moyens (63..66) couplés aux deuxièmes moyens pour calculer des valeurs de seuils adaptatifs maximales et minimales pour le signal numérique filtré et le rapport d'éner­gie,
    - et des moyens de décision (67 ... 71) couplés aux troisièmes moyens pour décider de la présence ou de l'absence d'un signal vocal dans le signal numérique.
     
    10. Dispositif pour la mise en oeuvre du procédé selon l'une quelconque des revendications 1 à 7 caractérisé en ce qu'il comprend des moyens de calcul microprogrammés.
     
    11. Dispositif selon la revendication 9 caractérisé en ce que les moyens de calcul microprogrammé sont formés par un processeur de traitement du signal.
     




    Dessins

























    Rapport de recherche