EP 0111947 A1 19840627 - Arrangement for the detection of silence in speech signals.
Title (en)
Arrangement for the detection of silence in speech signals.
Title (de)
Anordnung zur Erkennung von Sprachpausen.
Title (fr)
Dispositif pour la détection des silences dans les signaux de parole.
Publication
Application
Priority
DE 3243232 A 19821123
Abstract (en)
[origin: CA1206620A] : Method of recognizing speech pauses. The described method of recognizing speech pauses in a speech signal enables the recognition of a pause also when a slowly varying noise signal is superposed on the speech signal. For the purpose of speech pause recognition, mean values which are an approximate measure of the average power of approximately 100ms-long sections of the disturbed signal are determined from short-time Fourier coefficients of the disturbed speech signal. The sequence of these short-time mean values are then smoothed by means of linear filtration or using a median filter. An estimate of the noise signal power averaged over a few seconds is recovered from the sequence of short-time mean values in parallel with the smoothing operation. When the smoothed short-time mean value is more than once below a threshold which is proportional to the above-mentioned estimate, then it is decided that there is a speech pause.
Abstract (de)
Die beschriebene Anordnung zur Erkennung von Pausen in einem Sprachsignal ermöglicht die Pausenerkennung auch dann, wenn dem Sprachsignal ein langsam veränderliches Störsignal überlagert ist. Zur Pausenerkennung werden aus Kurzzeit-Fourier-Koeffizienten des gestörten Sprachsignales Mittelwerte bestimmt, die ein ungefähres Maß für die mittlere Leistung von etwa 100ms langen Abschnitten des gestörten Sprachsignales sind. Die Folge dieser Kurzzeitmittelwerte wird dann durch lineare Filterung oder durch ein Medianfilter geglättet. Parallel zum Glättungsvorgang wird aus der Folge der Kurzzeitmittelwerte ein Schätzwert für die über einige Sekunden gemittelte Leistung des Störsignales gewonnen. Ist der geglättete Kurzzeitmittelwert mehrmals kleiner als eine zum erwähnten Schätzwert proportionale Schwelle, so wird auf Sprachpause entschieden.
IPC 1-7
IPC 8 full level
G10L 15/02 (2006.01); G10L 25/78 (2013.01)
CPC (source: EP US)
G10L 25/78 (2013.01 - EP US)
Citation (search report)
- [A] FR 2316814 A1 19770128 - TELETTRA LAB TELEFON [IT]
- [A] FR 2389963 A1 19781201 - PHILIPS NV [NL]
- [A] FR 2451680 A1 19801010 - SOUMAGNE JOEL
- [AP] DE 3235279 A1 19830421 - NISSAN MOTOR [JP]
- [A] IEEE TRANSACTIONS ON ACOUSTICS, SPEECH & SIGNAL PROCESSING, Band ASSP-27, Nr. 5, Oktober 1979, Seiten 512-530, New York, US
Designated contracting state (EPC)
BE DE FR GB IT SE
DOCDB simple family (publication)
EP 0111947 A1 19840627; AU 2154683 A 19840531; AU 561287 B2 19870507; CA 1206620 A 19860624; DE 3243232 A1 19840524; JP S59105696 A 19840619; US 4682361 A 19870721
DOCDB simple family (application)
EP 83201642 A 19831117; AU 2154683 A 19831121; CA 441365 A 19831117; DE 3243232 A 19821123; JP 22047183 A 19831122; US 55299483 A 19831117