(19)
(11) EP 0 620 546 A2

(12) DEMANDE DE BREVET EUROPEEN

(43) Date de publication:
19.10.1994  Bulletin  1994/42

(21) Numéro de dépôt: 94400779.8

(22) Date de dépôt:  11.04.1994
(51) Int. Cl.5G10L 3/00
(84) Etats contractants désignés:
BE DE GB NL

(30) Priorité: 16.04.1993 FR 9304519

(71) Demandeur: SEXTANT AVIONIQUE
F-92360 Meudon-la-Forêt (FR)

(72) Inventeur:
  • Pastor, Dominique
    F-92402 Courbevoie Cédex (FR)

(74) Mandataire: Chaverneff, Vladimir et al
THOMSON-CSF SCPI B.P. 329 50, rue Jean-Pierre Timbaud
92402 Courbevoie Cédex
92402 Courbevoie Cédex (FR)


(56) Documents cités: : 
   
       


    (54) Procédé de détection énergétique de signaux noyés dans du bruit


    (57) Le procédé de détection énergétique de signaux utiles noyés dans du bruit, consiste, selon l'invention à partir d'une trame d'échantillons d'un signal bruité groupés en trames successives, à effectuer une pré-classification en comparant les énergies des échantillons successifs de chaque trame à un seuil optimal déterminé et en classant dans une première classe "bruit seul" les échantillons qui présentent une forte probabilité d'appartenir à cette classe, on détecte ensuite, pour chacun de ces échantillons, ceux présentant une énergie suffisamment élevée pour que leur probabilité d'appartenance à une deuxième classe "bruit + signal utile" soit élevée, cette deuxième classe étant définie en prenant comme référence la première classe.


    Description


    [0001] La présente invention se rapporte à un procédé de détection énergétique de signaux noyés dans du bruit.

    [0002] Lorsqu'on dispose d'un modèle du signal, des outils de détection de ce signal sont largement disponibles dans la littérature, les méthodes les plus connues étant basées sur la notion de filtre adapté et, plus généralement, sur la théorie de la décision en traitement du signal (P. Y. ARQUES, Collection Technique et Scientifique des Télécommunications, MASSON). Ces techniques président à l'élaboration des récepteurs cohérents et non cohérents en communications numériques (Principle of Coherent Communication A.J.VITERBI, MacGraw-Hill).

    [0003] Par contre, la présente invention se place dans le cas où l'on ne dispose pas de modèle susceptible de permettre l'application directe de la théorie de la détection. On suppose être en présence d'un bruit de fond, et de temps en temps se produit une "anomalie", qui, suivant le contexte, peut en fait représenter un signal qu'il serait souhaitable de détecter.

    [0004] Des exemples de détection d'un signal dit "utile" dans un bruit se trouvent largement dans la littérature concernant la détection de la parole. En effet, le signal de parole, par sa grande variabilité, ne se prête pas à une modélisation efficace et un des moyens les plus naturels pour le détecter consiste à effectuer un seuillage énergétique.

    [0005] Ainsi, beaucoup de recherches actuelles portent soit sur l'amplitude instantanée par référence à un seuil déterminé expérimentalement (La discrimination parole-bruit et ses applications V. PETIT, F. DUMONT Revue Technique THOMSON-CSF - Vol. 12 - N° 4 - Dec. 1980), soit sur un seuillage empirique de l'énergie ("Suppression of Acoustic Noise in Speech Using Spectral Substraction", S.F. BOLL, IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol.ASSP-27, N°.2, April 1979), soit sur l'énergie du signal total sur une tranche temporelle de durée T, en seuillant, toujours expérimentalement, cette énergie à l'aide d'histogrammes locaux, par exemple ("Problème de détection des frontières de mots en présence de bruits additifs",.P.WACRENIER, Mémoire de D.E.A. de l'université de PARIS-SUD, Centre d'ORSAY). D'autres techniques sont présentées dans "A Study of Endpoint Detection Algorithms in Adverse Conditions : Incidence on a DTW and HMM Recognizer", J.C. JUNQUA, B. REAVES, B. MAK EUROSPEECH 1991.

    [0006] Dans toutes ces approches, une grande part est faite à l'heuristique, et peu d'outils théoriques puissants sont utilisés.

    [0007] Il faut rappeler les travaux présentés dans "Evaluation of Linear and Non-Linear Spectral Substraction Methods for Enhancing Noisy Speech", A. LE FLOC'H, R. SALAMI, B. MOUY and J-P. ADOUL, Proceedings of "Speech Processing in Adverse Conditions", ESCA WORKSHOP, CANNES-MANDELIEU, 10-13 November 1992, où toutes les énergies supérieures à un certain seuil expérimental sont considérées comme révélatrices de la présence de signal utile et où toutes les énergies inférieures à ce seuil sont considérées comme des énergies dues au bruit seul lorsque la distance usuelle (valeur absolue de leur différence) les séparant est inférieure à un seuil, expérimental lui aussi. Cependant dans ce document de Le Floc'h et al, les auteurs travaillent sur la notion de distances entre énergies, mais la distance utilisée est une simple valeur absolue de la différence des énergies et leurs travaux font grandement appel à l'heuristique.

    [0008] La présente invention a pour objet un procédé de détection énergétique de signaux utiles noyés dans du bruit, procédé qui mette essentiellement en oeuvre des moyens rigoureux sans pratiquement faire appel à l'heuristique, et qui soit optimisé, c'est-à-dire qui permette de détecter pratiquement tous les signaux utiles noyés dans du bruit, même intense, avec le plus faible taux possible de fausses détections.

    [0009] Le procédé conforme à l'invention consiste, à partir d'un ensemble d'échantillons d'un signal bruité groupés en trames successives, à effectuer une pré-classification en comparant les énergies des trames successives les unes par rapport aux autres au sens d'une distance qui est la valeur absolue de la différence des logarithmes des deux énergies, de manière à classer dans une première classe "bruit seul" les trames qui présentent une forte probabilité d'appartenir à cette classe, on détecte ensuite, pour les autres trames, celles présentant une énergie suffisamment élevée par rapport à une énergie de référence calculée à partir des énergies des trames "bruit seul" de manière que ces trames détectées présentent une forte probabilité d'appartenance à une deuxième classe "bruit + signal utile".

    [0010] Le procédé de l'invention suppose que lorsque le signal utile est présent, I'énergie du signal observé appartient à une certaine classe notée C₁, et que lorsque le signal utile est absent, l'énergie observée appartient à une classe notée C₂. Une des caractéristiques nouvelles de la présente invention est de pouvoir mettre en évidence de telles énergies de la classe C₂ (donc des énergies de bruit seul), utilisées alors de manière à optimiser la détection d'énergies de la classe C₁ (donc d'énergies révélant la présence de signal utile), par un procédé optimisé.

    [0011] On considère une distance entre énergies, mais la distance dont il est question dans l'invention, entre deux énergies U et V, n'est pas la distance usuelle |U-V| mais |Log(U/V)|, ce qui revient à considérer que deux énergies U et V sont proches l'une de l'autre lorsqu'on a 1/s < U/V < s, ce qui équivaut à |Log(U/V)| < Log(s). Cette distance et le seuillage qui lui est attaché sont très avantageux. En effet, considérons le cas où le signal utile s(n) et le bruit x(n) sont tous les deux blancs et gaussiens, s(n) étant de variance σs² et x(n) de variance σx2.. En présence de s(n), on observe


    avec u(n) = s(n) + x(n). En l'absence de s(n), on observe


    Des résultats classiques en statistique nous permettent d'écrire :


    et V εN(Nσx², 2Nσx⁴). Si U et V sont considérées comme indépendantes,


    Désignons par r = σs²/σx² le rapport signal à bruit. On peut encore écrire :


    Le résultat dépend de σx² et de r, ce qui montre qu'un seuillage de la distance |U-V| n'est pas valide lorsqu'on ne connaît pas σx². Par contre, si on considère le rapport U/V, on démontre que la densité de probabilité de U/V ne dépend plus que de r, et est donc indépendante de σx². Ce résultat remarquable valide l'utilisation d'un seuil sur U/V lorsqu'on ne connaît que r.

    [0012] De façon résumée, selon le procédé de l'invention, on observe L*N échantillons u(n) d'un signal.
    Chaque ensemble Ti ={u(iN+k)/k ε{0,...,N -1}}, lorsque i varie de 0 à L-1, est appelé trame et est associé à une énergie E(Ti) notée Ui = E(Ti), ce qui permet de définir E={Ui/i ε{0,...,L-1}}. Lorsque le signal utile est absent, les échantillons u(iN+k) sont exactement égaux aux échantillons du bruit noté x(iN+k) (u(iN+k) = x(iN+k)). Lorsque le signal utile (noté s(iN+k)) est présent, les échantillons u(iN+k) sont exactement égaux à u(iN+k) = s(iN+k) + x(iN+k). On met en évidence par un premier procédé, décrit ci-après (procédé dit de pré-classification) un sous-ensemble Δ d'éléments de E qui sont vraisemblablement des énergies de la classe C₂. Il est alors possible de calculer un modèle autorégressif du bruit x(n) qui viendra blanchir les trames que l'on traitera par la suite, ou un spectre moyen du bruit x(n) qui peut servir à débruiter les trames suivantes (ni le blanchiment ni le débruitage ne sont impératifs mais sont utilisés suivant le contexte particulier traité). On utilise ensuite un second procédé (procédé dit de détection) décrit ci-dessous, qui détectera au mieux parmi les éléments de E (blanchis ou non, débruités ou non) les énergies de la classe C₁. Soient alors N nouveaux échantillons, réunis sous forme d'une trame associée à une nouvelle énergie. On peut soit utiliser cette nouvelle énergie pour venir réactualiser l'ensemble Δ en utilisant le procédé de pré-classification, soit décider au sens d'un aspect particulier du procédé si cette nouvelle énergie appartient ou non à C₁, après un éventuel débruitage ou un éventuel blanchiment. Ce processus est réitéré pour chaque trame de N échantillons acquis. Le procédé de l'invention est caractérisé par l'utilisation d'outils théoriques nouveaux de traitement du signal et de statistiques. Ainsi, il fait appel à un modèle des lois statistiques que suivent les énergies des signaux, celui des Variables Aléatoires Gaussiennes Positives (VAGP) décrit ci-après. On utilise alors une propriété originale concernant le rapport de deux VAGP.

    [0013] On va maintenant définir les Variables Aléatoires Gaussiennes "Positives" (VAGP) utilisées par l'invention.
    Une variable aléatoire X sera dite positive lorsque Pr{ X < 0 } << 1. Soit X₀ la variable centrée normalisée associée à X, on a :



    [0014] Dès que m/σ est suffisamment grand, X peut être considérée comme positive. Lorsque X est gaussienne, on désigne par F(x) la fonction de répartition de la variable gaussienne normale et on a : Pr { X < 0 } = F(-m/σ) pour X ε N(m,σ²). Pour une Variable Aléatoire Gaussienne Positive X ε N(m,σ²), on définira le paramètre α de cette variable par α = m/σ, de sorte que l'on peut encore écrire X ε N(m,m²/α²).
    Modèles des énergies : exemples de variables gaussiennes "positives"
    Signal à énergie déterministe

    [0015] Soient les échantillons x(0),...x(N-1) d'un signal quelconque, dont l'énergie est déterministe et constante, ou approximable par une énergie déterministe ou constante (comme précisé ci-dessous).
    On a donc






    [0016] Prenons comme exemple le signal x(n) = A cos(n+ϑ) où ϑ est équiréparti entre [0,2π].
    Pour N suffisamment grand, on a : (1/N) Σ0≦n≦N-1x(n)² # E[x(n)²] = A²/2. Pour N assez grand, U peut être assimilé à NA²/2 et donc à une énergie constante.

    [0017] On va maintenant examiner le cas de l'énergie d'un Processus Gaussien quelconque. Considérons un processus x(n), stationnaire du second ordre, mais gaussien, de variance σx². On démontre le résultat suivant : U = Σ0≦ n≦ N-1 x(n)² ε N( Tr(Cx,N) , 2Tr(Cx,N²) ) , où Cx,N est la matrice de covariance du vecteur


    Comme le processus est stationnaire au second ordre, il vient


    Donc


    Un calcul simple amène à Tr(Cx,N²) = Σ0≦i≦N-1,0≦j≦N-1 Γx(i-j)² où Γx(i) est la fonction de corrélation du processus. Le paramètre α vaut:


    Cette variable sera une variable gaussienne positive si la fonction de corrélation le permet. Il existe des cas particuliers intéressants décrits ci-dessous, permettant d'accéder à cette fonction d'autocorrélation.

    [0018] Cas de l'énergie d'un Processus Blanc Gaussien.

    [0019] On considère le cas d'un processus blanc gaussien x(n) où n est compris entre 0 et N-1. Les échantillons sont indépendants et sont tous de même variance σx² = E[x(n)²].
    On a alors Cx,N = σx² IN, où IN est la matrice identité de dimension NxN.
    On en déduit : Tr(Cx,N²) = Nσx⁴ de sorte que :


    Le paramètre α est α = (N/2)½

    [0020] Cas de l'énergie d'un Processus Gaussien Bande Etroite.
    On suppose que le signal numérique x(n) est issu de l'échantillonnage du processus x(t), lui-même issu du filtrage d'un bruit blanc gaussien b(t) par un filtre passe-bande h(t) de fonction de transfert:
    H(f) = U[-f0-B/2,-f0+B/2](f) + U[f0-B/2,f0+B/2](f), où U désigne la fonction caractéristique de l'intervalle en indice et f₀ la fréquence centrale du filtre.
    La fonction de corrélation Γx(τ) de x(t) vaut Γx(τ) =Γx(0)cos(2πf₀τ)sinc(πBτ) où sinc(x) = sin(x)/x.
    La fonction de corrélation de x(n) est alors :


    Si gf0,B,Te(k) = cos(2πkf₀Te)sinc(πkBTe), on a :


    On a : U ε N(Nσx², 2σx⁴Σ0≦i≦ N-1,0≦j≦N-1gf0,B,Te(i-j)²). Cette variable est une variable aléatoire gaussienne positive. Le paramètre α de cette variable est



    [0021] Ces relations restent valables même si f₀ = 0.

    [0022] Cas de l'énergie d'un processus gaussien quelconque "sous-échantillonné".
    Ce modèle est plus pratique que théorique. Si la fonction de corrélation est inconnue, on sait cependant que : lim k → + ∞ Γx(k) = 0. Donc, pour k assez grand tel que k > k₀, la fonction de corrélation tend vers 0. Aussi, au lieu de traiter la suite d'échantillons x(0)...x(N-1), peut-on traiter la sous-suite x(0), x(k₀),x(2k₀),..., et l'énergie associée à cette suite reste une variable aléatoire positive gaussienne, à condition qu'il reste dans cette sous-suite suffisamment de points pour pouvoir appliquer les approximations dues au théorème central-limite.

    [0023] Cette façon de procéder peut permettre dans certains cas difficiles d'appliquer les règles de décision qui sont décrites ci-dessous.
    Résultat théorique fondamental.
    Si X = X₁/X₂ où X₁ et X₂ sont toutes deux gaussiennes, indépendantes, telles que :



    [0024] Lorsque α₁ et α₂ sont suffisamment grands pour pouvoir supposer que X₁ et X₂ sont des variables aléatoires gaussiennes positives, la densité de probabilité fX(x) de X = X₁/X₂ peut alors être approchée par :


    où U(x) est la fonction indicatrice de R⁺ :




    où F désigne la fonction de répartition de la variable normale, et où


    De plus:



    [0025] Dans toute la suite, lorsque l'on utilise des couples de VAGP caractérisés par les paramètres α₁, α₂ et m, on supposera connaître les valeurs de ces paramètres fixées par une connaissance a priori ou par l'heuristique.

    [0026] On va maintenant exposer l'étape de pré-classification du procédé de l'invention. On suppose que C₁ = N(m₁, σ₁²) représente les énergies observables en présence de signal utile et que C₂ = N(m₂, σ₂²) représente les énergies observables en absence de signal utile. On pose m = m₁/m₂,
    α₁ = m₁/σ₁ et α₂ = m₂/σ₂ et on suppose α₁ et α₂ suffisamment grands pour que les éléments de C₁ et de C₂ soient des VAGP.

    [0027] E = {U₁,...,Un} est l'ensemble des énergies dont on dispose.
    Chacune de ces énergies Ui vaut


    où les ui(k) pour k allant de 0 à N-1 représentent les échantillons de la trame Ti, N le nombre de ces échantillons ui(k), c'est-à-dire la longueur des trames Ti. Les énergies Ui sont supposées indépendantes entre elles. L'étape de pré-classification cherche à mettre en évidence quelques énergies seulement, qui sont vraisemblablement des énergies de la classe C₂. Cette étape fait appel aux notions présentées ci-dessous.
    Notion de compatibilité entre énergies :
    Soit (U, V) ε (C₁UC₂)X(C₁UC₂) et X = U/V. On définit les hypothèses suivantes :
    H₁ : (U,V) ε (C₁XC₁)U(C₂UC₂) et H₂ : (U,V) ε (C₁XC₂)U(C₂UC₁). Si on a: 1/s < X < s ⇔ on décide que U et V appartiennent à la même classe, c'est-à-dire que H₁ est considérée comme vraie. On dira que U et V sont compatibles. Cette décision sera notée D₁. Mais si on a : X < 1/s ou X > s ⇔ on décide que U et V n'appartiennent pas à la même classe, c'est-à-dire que H₂ est considérée comme vraie. On dira que U et V sont incompatibles. Cette décision sera notée D₂.
    Si I = [1/s,s], la règle s'exprime selon : x ε I ⇔ D = D₁, x ε R - I ⇔ D = D₂.
    On cherche à optimiser cette règle de décision qui permet d'associer les réalisations de variables aléatoires entre elles. Pour ce faire, on calcule le seuil s optimal. Ce calcul est différent suivant que l'on connaît ou non la probabilité p. Lorsque p est connue, on applique directement le critère du maximum de vraisemblance. Lorsque p est inconnue, et comme les hypothèses sont réduites au nombre de 2, on utilise le critère de Neyman-Pearson.
    Critère du Maximum de vraisemblance :

    [0028] On démontre que la probabilité de décision correcte est :


    Le seuil optimal s vérifie





    [0029] Cette équation se résout sur calculateur, une fois fixées les valeurs m, p, α₁ et α₂.
    Critère de Neyman-Pearson :

    [0030] Lorsque p est inconnu, on utilise une approche du type Neyman-Pearson. On dira qu'il y a détection si on prend la décision D₁, c'est-à-dire si on décide que les deux variables aléatoires sont de la même classe. On définit alors les probabilités de non détection Pnd et de fausse alarme Pfa par : Pnd = Pr{D₂|H₁} (probabilité de décider de l'incompatibilité, alors que les variables sont de la même classe) et Pfa= Pr {D₁| H₂} (probabilité de décider de la compatibilité alors que les variables sont incompatibles). Le critère de Neyman-Pearson consiste à minimiser Pnd lorsque Pfa est fixée (ou inversement). Ce type de critère s'applique lorsqu'une erreur est beaucoup plus grave que l'autre. Comme il est question ici de savoir si les variables aléatoires observées appartienent ou non à une même classe, il est évident que l'on cherchera à n'avoir, dans les réalisations retenues comme étant des réalisations de variables d'une même classe, que peu d'erreurs. C'est donc la Pfa que l'on va fixer de manière à n'avoir que très peu de fausses alarmes.


    et


    de sorte que lorsque α₁ ≠ α₂, Pnd
    dépend de p, qui est inconnu et est inaccessible.

    [0031] Dans le cas où α₁ = α₂ = α, alors Pnd = 2.P (s,1|α,α) - 1 et est donc accessible. On peut fixer Pnd dans ce cas. Ayant l'expression de Pfa (ou de Pnd), on fixe cette probabilité, cequi permet d'obtenir leseuil s correspondant.
    Compatibilités entre plusieurs énergies.

    [0032] Lorsque le seuil a été calculé suivant un des deux procédés précités, il est intéressant de généraliser cette notion de compatibilité entre plusieurs énergies. Soient alors U₁, ..., UN, N énergies, on dira que ces énergies sont compatibles entre elles, si et seulement si, ∀ i et j, Ui et Uj sont compatibles au sens évoqué ci-dessus, autrement dit, si toutes ces énergies sont compatibles deux à deux.

    [0033] Pour la mise en oeuvre du procédé, on fait les hypothèses suivantes :
    • les énergies de la classe C₂ sont plus faibles statistiquement que celles de la classe C₁ ;
    • la trame présentant l'énergie la plus faible est une trame de la classe C₂. Soit Ti0, cette trame.


    [0034] Le calcul se déroule alors comme suit :

    [0035] L'ensemble Δ est initialisé : Δ = {Ti0} ;
    POUR i décrivant {E(T₁), ..., E(Tn)} - {E(Ti0)}
    FAIRE
    Si E(Ti) est compatible avec chaque élément de Δ : Δ = Δ U {E(Ti)}.
    FIN POUR

    [0036] Le procédé de confirmation de bruit fournit un certain nombre de trames qui peuvent être considérées comme du bruit avec une très forte probabilité. On calcule, à partir de la donnée des échantillons temporels, un modèle autorégressif du bruit. Si x(n) désigne les échantillons de bruit, on modélise x(n) selon:


    où p est l'ordre du modèle, les ai sont les coefficients du modèle à déterminer et e(n) est le bruit de modélisation, supposé blanc et gaussien si on suit une approche par maximum de vraisemblance. Ce type de modélisation est largement décrit dans la littérature "Spectrum Analysis - A modern Perspective", S. M. KAY/ S.L. MARPLE JR., Proceedings of the IEEE, Vol. 69, N° 11, November 1981, notamment. Quant aux procédés de calcul du modèle, de nombreuses méthodes sont disponibles (Burg, Levinson-Durbin, Kalman, Fast Kalman ...). De façon avantageuse, on met en oeuvre des procédés du type Kalman et Fast Kalman : "Le Filtrage Adaptatif Transverse", O. MACCHI, M. BELLANGER, Traitement du signal, Vol. 5, N° 3, 1988 et "Analyse des signaux et filtrage numérique adaptatif", M. BELLANGER, Collection CNET-ENST, MASSON, qui présentent de très bonnes performances temps réel. Disposant d'un modèle autorégressif du bruit, il est alors aisé de blanchir ce bruit, ce qui permet de travailler sur un bruit blanc gaussien aisément manipulable.

    [0037] Soit u(n) = s(n) + x(n) le signal total, composé du signal utile s(n) et du bruit x(n). Soit le filtre


    Appliqué au signal U(z), il vient H(z)U(z) = H(z)S(z) + H(z)X(z).
    Or H(z)X(z) = E(z) ⇒ H(z)U(z) = H(z)S(z) + E(z). Le filtre réjecteur H(z) blanchit le signal, de sorte que le signal en sortie de ce filtre est un signal utile (filtré donc déformé), additionné d'un bruit généralement blanc et gaussien. Travailler sur un bruit blanchi permet de se rapprocher d'hypothèses idéales, notamment lors de l'application du procédé de détection. Cependant ce blanchiment n'est pas obligatoire et on peut appliquer directement le procédé de détection sans passer par cet intermédiaire.

    [0038] Etant donné qu'après mise en oeuvre du procédé de l'invention, on dispose d'un certain nombre de trames confirmées comme étant des trames de bruit, on peut aussi calculer un spectre moyen de ce bruit, de manière à implanter un filtrage spectral du type soustraction spectrale ou filtrage de WIENER, type largement décrit dans la littérature : "Suppression of Acoustic Noise in Speech Using Spectral Substraction" S. F. BOLL, IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. ASSP-27, N° 2, April 1979; "Enhancement and Bandwidth Compression of Noisy Speech", J. S. LIM, A. V. OPPENHEIM, Proceedings of the IEEE, Vol. 67, N° 12, Dec. 1979, et "Noise Reduction For Speech Enhancement In Cars: Non-Linear Spectral Subtraction, Kalman Filtering", P. LOCKWOOD, C. BAILLARGEAT, J. M. GILLOT, J. BOUDY, G. FAUCON, EUROSPEECH 91. Cet aspect peut être intéressant dans ces certaines applications, voir par exemple: "Procédé de détection de la parole", D. PASTOR, demande de brevet français N° 92 12582, déposée le 21.10.92.

    [0039] Détection selon le procédé de l'invention.

    [0040] Disposant d'un ensemble Δ dont les composantes sont vraisemblablement des énergies de la classe C₂ (après un éventuel blanchiment), on cherche à détecter grâce à ces références les énergies de la classe C₁. Si V représente la valeur moyenne des énergies de l'ensemble Δ, cette variable est aussi une VAGP. Si Δ = {V₁, ..., VM}, on a, avec les notations déjà utilisées, ∀ i ε {1, ..., M}, Vi ε N(m₂, σ₂²).


    puisque les Vi sont indépendantes. On pose m = m₁/m₂, α₁ = m₁/σ et α₂ = m₂/σ₂.

    [0041] On passe alors à la règle de décision optimale.
    Application du critère du maximum de vraisemblance (on connaît la probabilité p de décision correcte) :
    soit p = Pr {U ε C₁}. La règle de décision optimale est alors :




    Application du critère de Neyman-Pearson :

    [0042] Lorsqu'on ne connaît pas la valeur de p, on peut :
    • soit la fixer arbitrairement par une approche heuristique,
    • soit la fixer à p = 0,5, ce qui place dans le cas le plus défavorable,
    • soit utiliser le critère de Neyman-Pearson ou le critère de la médiane qui consiste à avoir :

    probabilité de fausse alarme = probabilité de non détection.

    [0043] Si l'on veut appliquer le critère Neyman-Pearson ou le critère de la médiane, la règle de détection sera de la forme :




    Le seuil λ est fixé pour atteindre une valeur a priori de la probabilité de fausse alarme (ou la probabilité de décision correcte).

    [0044] Cette probabilité PFA de fausse alarme vaut :



    [0045] Il n'y a a priori pas de calcul théorique simple de cette expression, donc pas de moyen théorique d'évaluer le seuil λ. Le calcul de λ peut cependant se faire sous simulation, suivant le cas particulier traité. La règle de décision simplifiée exposée ci-dessous est plus pratique à utiliser dans ce cas.
    Règle de décision simplifiée.
    Cette règle est:


    Cas du critère du maximum de vraisemblance :
    la probabilité Pc de désicion correcte est :



    [0046] Le seuil optimal est obtenu pour :


    Cas du critère de Neyman-Pearson :
    Lorsque la probabilité p est inconnue, on peut :
    • soit la fixer arbitrairement par une approche heuristique,
    • soit la fixer à p = 0,5, ce qui place dans le cas le plus défavorable,
    • soit utiliser le critère de Neyman-Pearson ou le critère de la médiane qui consiste à avoir Probabilité de fausse alarme = Probabilité de non-détection.


    [0047] Pour appliquer le critère de Neyman-Pearson ou le critère de la médiane on définit les probabilités de non-détection et de fausse alarme :



    [0048] On a :



    [0049] On fixe alors Pfa ou Pnd, pour déterminer la valeur du seuil.

    [0050] Le critère de la médiane amène à :


    Mise en oeuvre.



    [0051] Lorsque la règle de décision a été définie à l'aide des outils théoriques rappelés ci-dessus, et disposant d'une énergie E₀ de "référence" de bruit, on effectue la détection sur E(T₁), ..., E(Tn), avec :


    où les ui (n) sont les N échantillons constituant la trame Ti.

    [0052] Parmi les trames dont on dispose au départ, l'algorithme de préclassification a mis en évidence un ensemble Δ de trames presque sûrement de la classe "bruit". La moyenne des énergies des trames de l'ensemble Δ permet d'obtenir une valeur de référence Eo qui va être utilisée par l'algorithme de détection de manière à classifier les énergies des trames autres que celles de l'ensemble Δ ainsi que les nouvelles trames acquises ultérieurement.
       POUR E(Ti) décrivant {E(T₁), ..., E(Tn)}
       FAIRE
          X = E(Ti)/E₀
          Cas de la détection optimale :


    détection
          sur la trame Ti.
          Cas d'une détection à seuil :
       SI X > s détection sur la trame Ti
       FIN POUR
       POUR chaque nouvelle trame T représentée par les échantillons u(0), ..., u (N-1),
          FAIRE


          X = E(Ti)/E₀
          Cas de la détection optimale.


    détection sur la trame Ti
          Cas d'une détection à seuil.
          SI X > s Détection sur la trame Ti
    (s'il n'y a pas de détection, la trame acquise peut être considérée comme du bruit et éventuellement venir réactualiser Δ ainsi que la valeur Eo de référence).
       FIN POUR
    Exemples d'application.

    [0053] Il est possible de traiter un grand nombre d'exemples permettant de mettre en évidence l'intérêt du procédé de l'invention. En fait, il existe autant d'exemples que de couples de modèles que l'on peut former à partir de ceux décrits ci-dessus (voir les exemples de VAGP donnés ci-dessus) :
    • détection d'un bruit blanc gaussien dans un autre bruit blanc gaussien ;
    • détection d'un bruit blanc gaussien dans un bruit gaussien bande étroite ;
    • détection d'une énergie déterministe dans un bruit gaussien bande étroite...

    Détection d'un signal d'énergie bornée dans un bruit gaussien bande étroite :
    Hypothèse 1 : nous supposons ne pas connaître le signal utile dans sa forme, mais nous ferons l'hypothèse suivante : pour toute réalisation s(0), ..., s(N-1) de s(n), l'énergie S définie par :
    S = (1/N)Σ0≦ n≦ N-1 s(n)² est bornée par µs², et ce, dès que N est suffisamment grand, de sorte que : S = Σ0≦ n≦ N-1s(n)² > Nµs².
    Hypothèse 2 : Le signal utile est perturbé par un bruit additif noté x(n), que l'on suppose gaussien et bande étroite. On suppose que le processus x(n) traité est obtenu par filtrage bande étroite d'un bruit blanc gaussien.

    [0054] La fonction de corrélation d'un tel processus est alors :


    Si on considère N échantillons x(n) de ce bruit, on a alors :


    avec:


    Le paramètre α de cette variable est :


    Hypothèse 3 : Les signaux s(n) et x(n) sont supposés indépendants. On suppose alors que l'indépendance entre s(n) et x(n) implique la décorrélation au sens temporel du terme, c'est-à-dire que l'on peut écrire :


    Ce coefficient de corrélation n'est que l'expression dans le domaine temporel du coefficient de corrélation spatial défini par :
    E[s(n)x(n)]/(E[s(n)²]E[x(n)²])½ lorsque les processus sont ergodiques.
    Soit u(n) = s(n) + x(n) le signal total, et


    On approxime U par :


    Comme on a :


    on aura :


    Hypothèse 4 : Comme nous supposons que le signal présente une énergie moyenne bornée, nous supposerons qu'un procédé capable de détecter une énergie µs², sera capable de détecter tout signal d'énergie supérieure.

    [0055] Compte tenu des hypothèses précédentes, on définit la classe C₁ comme étant la classe des énergies lorsque le signal utile est présent. Selon l'hypothèse 3, U ≧ Nµs² + Σ0≦ n≦ N-1 x(n)², et selon l'hypothèse 4, si on détecte l'énergie Nµs² + Σ0≦ n≦ N-1 x(n)², on saura détecter aussi l'énergie totale U.
    D'après l'hypothèse 2,


    Donc C₁ = N( Nµs² + Nσx² , 2σx⁴Σ0≦i≦N-1,0≦j≦N-1gf0,B,Te(i,j)²) et le paramètre α de cette variable vaut : α₁ = N(1+r)/[2Σ0≦i≦ N-1,0≦j≦N-1gf0,B,Te(i-j)²]½, où r = µs²/σx² représente le rapport signal à bruit.
    C₂ est la classe des énergies correspondant au bruit seul. D'après l'hypothèse 2, si les échantillons de bruit sont x(0),...,x(M-1), il vient :


    Le paramètre α de cette variable est :


    On a donc :




    et


    D'où m = m₁/m₂ = (N/M)(1+r),


    et


    On peut alors mettre en oeuvre les étapes du procédé de l'invention exposées ci-dessus.

    Détection de code PN



    [0056] On considère une modulation BPSK étalée par un code PN de longueur L très grande devant 1. La durée d'émission d'un élément binaire dn est Tb. La durée d'émission d'un élément binaire du code PN est T'.

    [0057] Sur l'intervalle de [nTb,(n+1)Tb]. le signal émis est :


    avec :
    • Λ[kTc,(k+1)Tc](t) = 1 si t ε [kT',(k+1)T'] et
      Λ[kT',(k+1)T'](t) = 0 si t ∉ [kT',(k+1)T'],
    • K désigne le nombre d'échantillons du code PN vus sur cet intervalle, et.
    • φ la phase aléatoire équirépartie sur [0,2π]


    [0058] Ce signal émis est noyé dans un bruit de fond qui est b(t), que l'on suppose blanc et gaussien.

    [0059] On cherche alors à détecter le signal s(t) à partir du signal reçu r(t) = m(t) + b(t), en supposant que l'on ne connaît pas le code PN, donc ni les valeurs ck ni la durée L, ni le temps Tb, ni la fréquence ω₀.

    [0060] Soit alors la variable aléatoire :


    où :
    • T est une durée d'intégration assez grande pour que les échantillons du code PN vus sur cet intervalle soient suffisamment nombreux et décorrélés, tout en restant assez faibles pour qu'on n'atteigne pas la prériodicité L du code PN. Si K est le nombre d'éléments binaires du code PN vu sur cet intervalle, on suppose donc: L >> 1, K << L et K >> 1.
      T vérifie en outre ω₀T >> 1
    • ω est une fréquence qui sert à essayer de récupérer la porteuse, telle que ωT >> 1

    On pose:


    et:







    [0061] En utilisant le théorème central-limite, et après des calculs tels que décrits dans "Performance of a Direct Sequence Spread Spectrum System with Long Period and Short Period Code Sequences", R. SINGH, IEEE Transactions on Communications, Vol. Com-31, N° 3, March 1983, on montre que s(n) est une variable gaussienne, de moyenne nulle et de variance : σs² = (Tb/T)(Eb/2K)sinc²(π(ω - ω₀)/K).

    [0062] En pratique, on suppose que les s(n) sont indépendants, de sorte que la suite des échantillons s(n) constitue un processus discret blanc gaussien.

    [0063] De même, la suite des échantillons x(n) constitue un processus blanc gaussien de moyenne nulle et de variance σs² = σb². Détecter le code PN, c'est détecter s(n), donc détecter un bruit blanc gaussien noyé dans un autre bruit blanc gaussien.

    [0064] Soit alors la variable U = Σ0≦ n≦ N-1 u(n)². En reprenant les résultats énoncés ci-dessus à propos des VAGP, on a :


    Le paramètre α de cette variable est α₁ = (N/2)½

    [0065] Soit alors la variable V = Σ0≦ n≦M-1 x(n)². On a :



    [0066] Le paramètre α de cette variable est α₂ = (M/2)½. On peut donc modéliser comme dans le cas d'une détection entre les deux classes :


    On a alors :


    On notera que si


    Le procédé décrit ci-dessus est donc applicable à ce problème.


    Revendications

    1. Procédé de détection énergétique de signaux utiles noyés dans du bruit, caractérisé par le fait qu'il consiste, à partir d'un ensemble d'échantillons d'un signal bruité groupés en trames successives, à effectuer une pré-classification en comparant les énergies des trames successives les unes par rapport aux autres au sens d'une distance qui est la valeur absolue de la différence des logarithmes des deux énergies, de manière à classer dans une première classe "bruit seul" les trames qui présentent une forte probabilité d'appartenir à cette classe, on détecte ensuite, pour les autres trames, celles présentant une énergie suffisamment élevée par rapport à une énergie de référence calculée à partir des énergies des trames "bruit seul" de manière que ces trames détectées présentent une forte probabilité d'appartenance à une deuxième classe "bruit + signal utile".
     
    2. Procédé selon la revendication 1, caractérisé par le fait que le calcul d'un seuil optimal fait par application du critère du maximum de vraisemblance lorsque l'on connaît la probabilité de décision correcte.
     
    3. Procédé selon la revendication 1, caractérisé par le fait que le calcul du seuil optimal est fait par application du critère de Neyman-Pearson lorsque l'on ne connaît pas la probabilité de décision correcte.
     
    4. Procédé selon l'une des revendications précédentes, caractérisé par le fait que l'appartenance à la deuxième classe est déterminée par application du critère du maximum de vraisemblance lorsque l'on connaît la probabilité de décision correcte.
     
    5. Procédé selon l'une des revendications 1 à 3, caractérisé par le fait que l'appartenance à la deuxième classe est déterminée par application du critère de Neyman-Pearson lorsque l'on ne connaît pas la probabilité de décision correcte.
     
    6. Procédé selon l'une des revendications précédentes, caractérisé par le fait qu'après avoir traité une première trame d'échantillons, on calcule un modèle autorégressif du bruit que l'on utilise pour blanchir les trames suivantes, à partir d'un ensemble de trames constituées, avec une forte probabilité, uniquement de bruit.
     
    7. Procédé selon l'une des revendications 1 à 5, caractérisé par le fait qu'après avoir mis en évidence un ensemble de trames constituées, avec une forte probabilité, de bruit seul, on calcule un spectre moyen du bruit et qu'on applique un débruitage aux trames suivantes.
     
    8. Procédé selon l'une des revendications précédentes, caractérisé par le fait que qu'on se sert des résultats acquis pour une trame d'échantillons pour réactualiser les résultats de la trame précédente.