[0001] Die Erfindung betrifft, gemäß Patentanspruch 1, eine Anordnung zur akustischen Überwachung
von Umgebungen. Weiterhin betrifft die Erfindung, gemäß Patentanspruch 6, ein Verfahren
zur akustischen Überwachung von Umgebungen.
[0002] Überwachungssysteme zur Überwachung einer Freifläche oder einem Bereich in einem
Gebäude oder Gebäudekomplex, wobei das Überwachungssystem eine Mehrzahl von Mikrofonen
umfasst, welche in dem Überwachungsbereich anordenbar und/oder angeordnet sind und
welche zur Aufnahme von Audiosignalen eines Objekt als Audiosignalquelle in dem Überwachungsbereich
ausgebildet sind, sind seit langem bekannt. Beispielsweise ist aus der
DE 10 2012 211 154 B4 ein Überwachungssystem bekannt, welches ein Analysemodul zur Klassifizierung des
Audiosignals und zur Ausgabe einer Klassifikationsinformation umfasst. Die Klassifikationsinformation
ist insbesondere eine inhaltliche Beschreibung des Audiosignals und beschreibt die
Geräuschart. Im Speziellen bezeichnet die Klassifikationsinformation die Entstehungsart
des Audiosignals. Weiterhin ist ein Analysemodulvorgesehen, welches ein anliegendes
Audiosignal mit einem Muster und/oder einem abgespeicherten Audiosignal vergleicht.
Insbesondere ist das Analysemodul derart ausgebildet, ein Audiosignal als unbeabsichtigtes
Geräusch, nämlich als ein Einbruchsgeräusch und/oder als ein Beschädigungsgeräusch
und/oder als ein Störgeräusch einer Aktion des Objekts als Geräuschart zu klassifizieren.
Da nicht zu erwarten, dass derartige Personen bei einem unautorisierten Aufhalten
im Überwachungsbereich schreien oder eine Trillerpfeife betätigen, ist das Überwachungssystem
auf die unbeabsichtigten Geräusche ausgerichtet, die die Personen entweder nicht verhindern
können (Schrittgeräusche oder Geräusche einer Aktion) oder aus Versehen nicht ausreichend
verhindern Das Überwachungssystem umfasst ferner ein Lokalisierungsmodul zur Lokalisierung
der Position des Objekts durch akustische Ortung der Position der Audiosignalquelle
des klassifizierten Audiosignals in dem Überwachungsbereich über die Mikrofone und
zur Ausgabe einer Positionsinformation. Dabei ist das Lokalisierungsmodul zur Lokalisierung
der Person der Audiosignalquelle des klassifizierten Audiosignals durch akustische
Kreuzortung der Audiosignalquelle, insbesondere über Laufzeitmessung des Audiosignals
von mindestens zwei und insbesondere mindesten drei Mikrofone ausgebildet. Die Klassifikationsinformation
und die Positionsinformation bilden einen Teil eines Objektdatensatzes, wobei der
Objektdatensatz als Überwachungsergebnis ausgebbar und/oder weiter verarbeitbar ist.
Hierzu umfasst das Überwachungssystem ein Auswertemodul zur Auswertung des Objektdatensatzes
und zur Generierung eines Alarmsignals, wobei es auch vorgesehen ist, dass das Auswertemodul
mindestens zwei Objektdatensätze mit unterschiedlichen Klassifikationsinformationen
zur Auswertung verwendet. Bei einer Weiterbildung weist das Auswertemodul eine Verfolgungseinheit
auf, wobei diese ausgebildet ist, aus mehreren Objektdatensätzen einen Metadatensatz
für das Objekt zu erstellen. In diesem Metadatensatz werden beispielsweise zwei, drei,
vier oder mehr mögliche Objektdatensätze des Objekts aufgenommen und das Auswertemodul
umfasst eine Filtereinheit zur Filterung des Metadatensatzes, wobei Objektdatensätze,
die einem Bewegungsmodell des Objekts widersprechen, ausgefiltert werden. Schließlich
umfasst das Überwachungssystem eine Überwachungszentrale, welche eine Audiospeichereinrichtung
aufweist oder mit dieser verbunden ist, wobei auf der Audiospeichereinrichtung eine
Audioaufnahme des Audiosignals, insbesondere des Original-Audiosignals des klassifizierten
Audiosignals abgespeichert ist. In einer möglichen Ausgestaltung umfasst die Überwachungszentrale
eine Bedieneinheit, wobei bei Betätigung der Bedieneinheit, z.B. durch Anwahl eines
Objektdatensatzes, das gespeicherte Audiosignal abgespielt und akustisch von dem Überwachungspersonal
überprüft werden kann. Auf diese Weise kann nach einer automatisierten Klassifizierung
des Audiosignals eine manuelle oder menschliche Überprüfung der Klassifizierung durchgeführt
werden. Die Überwachungszentrale dient zur Ausgabe der Objektdatensätze und optional
ergänzend der Alarmsignale und/oder der Bewegungslinien an ein Überwachungspersonal.
Dem Überwachungspersonal werden beispielsweise die Objektdatensätze als Textnachrichten,
die Alarmsignale optisch oder akustisch dargestellt und/oder die Bewegungslinie optisch
auf einem Plan des Überwachungsbereichs dargestellt. Auf diese Weise ist das Überwachungspersonal
in der Überwachungszentrale in der Lage, die Ergebnisse des Überwachungssystems auf
Basis akustischer Ortung (siehe Lokalisierungsmodul, Klassifikationsinformation und
die Positionsinformation bilden einen Teil eines Objektdatensatzes, das Auswertemodul
weist eine Verfolgungseinheit auf, wobei diese ausgebildet ist, aus mehreren Objektdatensätzen
einen Metadatensatz für das Objekt zu erstellen) zu verwerten und die Mikrofone sind
lediglich Sensoren, welche keine Vorverarbeitung durchführen können.
[0003] Weiterhin ist aus der
DE 196 21 152 A1 ein Verfahren zum Überwachen und zum Auslösen eines Alarmes für einen zu sichernden
Bereich und ein Überwachungssystem bekannt. Das dort beschriebene System ist universell
einsetzbar: von der Schalterhalle in der Post oder Bank bis hin zur Überwachung von
Straßen, Freiflächen und in Zügen), wobei Audiosignale oder akustische Ereignisse
ausgewertet werden, insbesondere Schlüsselworte, bestimmter Lautstärkepegel oder Schuss,
und wobei durch manuelle Steuerung der Kameras des Sicherheitspersonals ein flüchtender
Täter verfolgt und sein Fluchtweg aufgezeichnet werden kann. Die Signalerkennung,
insbesondere Worterkennung kann dabei sowohl als Softwarelösung in einem Computer
implementiert sein als auch in DSP-basierten Hard- und Softwarekombinationen innerhalb
eines Computers residieren. Es können sowohl Stand-Alone-Geräte als auch rechnerbasierende
Gesamtsysteme aufgebaut werden. Die Systeme können einen oder mehrere voneinander
unabhängige Kanäle mit Spracherkennung und Alarmauslösung enthalten.
[0004] Weiterhin ist aus der
WO 2009/104968 A1 eine Einbruchmeldeanlage bekannt, bei der nicht das hörbare Signal, sondern die unhörbare
Signale ausgewertet werden, um die Ursache des Geräusches zu ermitteln. Hierzu wird
mit Filtern eine Trennung in Niederfrequenzsignal (Frequenzbereich von etwa 1 - 5
Hz) und Hochfrequenzsignal (Frequenzbereich von etwa 5 - 20 Hz) vorgenommen und ein
Komparator vergleicht die Signale in den beiden Kanälen miteinander. Ferner sind ein
Modul zur Modellbildung, eine Auswertungsapplikation und ein Statusmodul vorgesehen,
welches die Priorität der "Wörter" untereinander zur Alarmmeldung festlegt. Im Einzelnen
weist die Einbruchmeldeanlage gemäß der
WO 2009/104968 A1 einen Einbruchmelder und einen damit verbundenen Prozessor auf, wobei der Einbruchmelder
einen Umformer zum Aufnehmen mechanischer Schwingungsenergie in einem bestimmten Frequenzbereich
und Umwandeln dieser in elektrische Schwingungsenergie in demselben Frequenzbereich
enthält und wobei ein A/D-Wandler in dem System vorhanden ist, um Digitalsignale bereitzustellen,
die die elektrische Schwingungsenergie darstellen. Der Prozessor ist mit Mitteln zur
digitalen Signalverarbeitung der an seine Eingänge bereitgestellten Signale versehen,
wobei der Melder darüber hinaus einen Niederfrequenzkanal zum Aussortieren und Zuführen
eines Niederfrequenzsignalteils des Frequenzbereichs zu einem erster Eingang des Prozessors
und einen Hochfrequenzkanal zum Aussortieren und Zuführen des Restsignalteils des
Frequenzbereichs zu einem zweiten Eingang des Prozessors umfasst. Weiterhin umfasst
der Prozessor eine Signalerkennungseinheit, in der die verarbeiteten Digitalsignale
mit erlernten und gespeicherten Signalmustern verglichen werden, und die von einem
Vergleicher zum Vergleichen bestimmter Digitalsignalcharakteristika in dem Restsignalteil
und zum Bereitstellen einer Menge von Vergleichsergebnissignalen an weitere Prozessoruntereinheiten
zur weiteren Verarbeitung zugeführt werden. Schließlich sind eine Assoziationsuntereinheit
zum Herstellen einer Assoziation zwischen einem Vergleichsergebnissignal und einem
aus einer gespeicherten Worttabelle auszuwählenden Wort und eine Statusuntereinheit
zum Festlegen eines Status auf Basis ausgewählter Wörter vorgesehen. Der Niederfrequenzkanal
verarbeitet Signale in einem Frequenzteilbereich von etwa 1 - 5 Hz, während der Hochfrequenzkanal
ein Kanal ist, der Signale in einem Frequenzteilbereich von etwa 5 - 20 Hz verarbeitet.
Der Vergleicher ist zum Vergleichen von Sequenzen eingehender Energieschübe in dem
Niederfrequenzsignalteil mit Sequenzen in dem Restsignalteil oder zum Vergleichen
von Dauern eingehender Energieschübe in dem Niederfrequenzsignalteil mit Dauern in
dem Restsignalteil oder zum Vergleichen von Zeiträumen zwischen Energieschüben in
dem Niederfrequenzsignalteil mit Zeiträumen in dem Restsignalteil oder zum Vergleichen
von bestimmten Charakteristika der Signalereignisse, wie absolute maximale Amplituden,
in Energieschüben in dem Niederfrequenzsignalteil mit Ereignissen in dem Restsignalteil
u.a. eingerichtet.
[0005] Weiterhin ist aus der
US 2012/0262294 A1 ein System und ein Verfahren zur Überwachung einer begrenzten und vorgegebenen Zone
mit einem akustischen Sensor für die Detektion unhörbarer seismischer Wellen bekannt.
Im Einzelnen weist eine Überwachungseinrichtung für eine begrenzte und vorbestimmte
Überwachungszone mindestens einen akustischen Sensor auf, der in der Überwachungszone
angeordnet ist, und der dazu ausgelegt ist, eine erfasste akustische Welle, die durch
das Auftreten einer Aktivität in der Überwachungszone resultiert, in ein Informationssignal
zu konvertieren. Weiterhin sind eine Verarbeitungsvorrichtung, die dazu ausgelegt
ist, das Informationssignal zu empfangen, ein Übertragungssystem des Informationssignals
zur Verarbeitungsvorrichtung, ein System, um mindestens einen Alarm zu senden, und
eine Datenbank vorgesehen. Die Datenbank beinhaltet Referenzcharakteristiken, die
sich auf diese vorbestimmte Bezugsaktivität beziehen. Die Verarbeitungsvorrichtung
umfasst ein Analyse-System, welches das Informationssignals, ausgehend von den Referenzcharakteristiken
von mindestens einer vorbestimmten Bezugsaktivität der Datenbank analysiert, und zur
Sendung von mindestens einem Alarm auf der Grundlage der Analyse des Informationssignals
das System aktiviert. Insbesondere ist mindestens ein akustischer Sensor für seismische
Wellen, die sich in einem festen Milieu ausbreiten, vorgesehen und das System zur
Sendung von mindestens einem Alarm umfasst zur Erzeugung eines Alarms der ersten Stufe
eine Vorrichtung, die in der Überwachungszone angeordnet ist, und zur Erzeugung eines
Alarms der zweiten Stufe eine Vorrichtung außerhalb der Überwachungszone. Das Analyse-System
ist dazu ausgelegt, ein Bestätigungssignal zu empfangen und falls infolge der Erzeugung
des Alarms der ersten Stufe in einem vorbestimmten Zeitrahmen kein Bestätigungssignal
empfangen wird, die Vorrichtung zur Erzeugung des Alarms der zweiten Stufe zu aktivieren.
Falls infolge der Erzeugung des Alarms der ersten Stufe in einem vorbestimmten Zeitrahmen
ein Bestätigungssignal empfangen wird, werden die Referenzcharakteristiken einer vorbestimmten
Bezugsaktivität der Datenbank aktualisiert. Hierzu ist eine Bestätigungsvorrichtung
vorgesehen, die in der Überwachungszone angeordnet ist und die durch einen Nutzer
zur Erzeugung des Bestätigungssignals aktivierbar ist. Das Analyse-System weist im
Einzelnen folgende Bearbeitungsschritte auf:
- ausgehend von den Referenzcharakteristiken der Datenbank auswählen einer vorbestimmten
Bezugsaktivität der Datenbank, die einer Aktivität entspricht aus der das Informationssignal
resultiert,
- speichern eines zum Zeitpunkt des Auftretens der erkannten Aktivität Wertes und zuordnen
dieses Werts zur ausgewählten Bezugsaktivität, und
- entscheiden, in Abhängigkeit von mindestens diesem Wert und von der zugeordneten Bezugsaktivität,
ob das System zur Sendung von mindestens einem Alarm aktiviert wird oder nicht.
[0006] Aus der
DE 10 2014 012 184 B4 der Anmelderin ist eine Vorrichtung zur automatischen Erkennung und Klassifizierung
von hörbaren akustischen Signalen mit mindestens einem im Überwachungsbereich angeordneten
Signalempfänger und einem Modul zur Klassifizierung des akustischen Signals und Ausgabe
einer Klassifikationsinformation, bekannt. Zur Vorverarbeitung der akustischen Signale
ist ein einen Mikrocomputer aufweisendes akustisches Sensorsystem vorgesehen, welches
mit dem Signalempfänger in Verbindung steht, dessen Ausgangssignale parallel einem
im akustischen Sensorsystem angeordneten Modul für deren Aufzeichnung und einem Modul
zur Klassifizierung zugeführt sind. Mit dem Aufzeichnungs-Modul ist eine Aufzeichnungsdatenbank
des akustischen Sensorsystems verbunden, in welcher das Signal im Format einer Audiodatei
gespeichert ist. Zum Datenaustausch und zur Steuerung mit dem eine Schnittstelle aufweisenden
akustischen Sensorsystem steht ein Modul zur Modellbildung in Verbindung, welches
über die Schnittstelle die Aufzeichnungen importiert, aus ihnen entsprechende Modelle
erzeugt und welches über die Schnittstelle mit einer Modellbibliothek des entsprechenden
Sensorsystems in Verbindung steht. In der Modellbibliothek ist das von einem Anwender
in einer Trainingsphase ausgewählte Modell abgespeichert. Das Klassifizierungs-Modul
ist mit der Modellbibliothek verbunden, steht über eine weitere Schnittstelle mit
einer Auswertungs-Applikation in Verbindung und sendet für den Fall der Erkennung
eines Signals, das Klassifizierungsergebnis an die Auswertungs-Applikation. Das akustische
Sensorsystem dient gleichermaßen als Aufzeichnungssystem für beliebige akustische
Signale während einer Trainingsphase, als auch als Klassifikator bekannter Signalmuster
während einer Klassifizierungsphase. Die dafür notwendigen Erkennungsmodelle werden
aus den von dem Sensorsystem vorher aufgezeichneten Signalen erzeugt und diese Modelle
danach auch nur von diesem Sensorsystem zur Klassifizierung eingesetzt. Ein wesentlicher
Vorteil der der
DE 10 2014 012 184 B4 der Anmelderin im Vergleich zu dem vorstehend beschriebenen Stand der Technik ist,
dass jedes Gerät/ akustischen Sensor /akustisches Sensorsystem seine eigenen Aufzeichnungen
zur Modellbildung nutzt und dieses Modell danach auch nur von diesem Gerät zur Klassifizierung
eingesetzt wird. Dadurch wird erreicht, dass alle signalbeeinflussenden Faktoren mit
in das jeweilige Erkennungsmodell einfließen und dem Anwender auf überraschend einfache
Art und Weise die Konfiguration in der Trainingsphase ermöglicht wird. Während der
Klassifizierungsphase werden durch die aktuellen akustischen Eingangssignale, die
Modellparameter des zugrundeliegenden Erkennungsmodells adaptiert. Dies führt dazu,
dass die Erkennungsmodelle im Laufe des Betriebes ständig optimiert werden. Der akustische
Sensor lernt also, durch diese Optimierung der Modellparameter, ständig dazu und verbessert
dadurch die Qualität der Klassifizierung.
[0007] Ein zur akustischen Überwachung von Umgebungen benachbartes technisches Gebiet ist
das technische Gebiet der "Akustischen Materialprüfung", welches als zerstörungsfreies
Prüfverfahren sehr vielschichtig ist und von der Werkstoffprüfung, Rissprüfung, Gefügeprüfung,
Verwechslungsprüfung, Resonanzanalyse, Klanganalyse, Klangauswertung, Klangprobe,
Klangprüfung bis hin zur automatisierten Aufzeichnung von Schallsignalen im industriellen
Umfeld und Getriebe- und Maschinenüberwachung mit Eigenfrequenzanalyse, Eigenfrequenzmessung,
Eigenfrequenzprüfung für magnetische und nichtmagnetische Metalle, Stahl, Keramik,
Sinterprodukte, Glas reicht. Es ist bekannt, zum Prüfen eines Gegenstands auf mechanische
Beschädigungen, wie zum Beispiel Haarrisse, diesen in Schwingungen zu versetzen und
den dabei von ihm abgegebenen Schall (meist Luftschall) zu erfassen und einer Analyse
zu unterziehen. Mechanische Schwingungen in einem Körper (Körperschall) bewirken,
dass die umgebende Luft in Schwingungen versetzt wird (Luftschall). Mit entsprechenden
Sensoren lassen sich diese Schwingungen messen; in der Luft mit einem Mikrofon, auf
einem Körper mit einem Beschleunigungssensor oder einem Laservibrometer. Im Körper
breiten sich zum selben Zeitpunkt viele Schwingungsmodi aus, die durch die Elastizität,
die Form, den Werkstoff und die Struktur geprägt sind. Sie repräsentieren die mechanischen
Eigenschaften des Körpers. Einflüsse wie z. B. ein Riss, eine andere Geometrie oder
eine Werkstoffänderung beeinflussen die Resonanzfrequenzen, welche bei einer Analyse
ausgewertet werden.
[0008] Beispielsweise ist aus der
US 2008/0 144 927 A1 eine nicht zerstörende Inspektionsvorrichtung bekannt, umfassend: einen Schwingungserzeuger,
eine Sensoreinheit zum Erfassen von Schwingungen, die von dem Schwingungserzeuger
durch ein Testobjekt übertragen werden, eine Signal-Eingabeeinheit zum Extrahieren
eines Zielsignals von einem elektrischen Signal, das von der Sensoreinheit ausgegeben
wurde, eine Eigenschaftsmenge-Extrahiereinheit zum Extrahieren von mehreren Frequenz-Bestandteilen
von dem Zielsignal als eine Eigenschaftsmenge und eine Entscheidungs-Einheit mit einem
kompetitiven lernenden neuronalen Netzwerk zum Bestimmen, ob die Eigenschaftsmenge
zu einer Kategorie gehört. Im Einzelnen ist das kompetitive lernende neuronale Netzwerk
unter Verwendung von Trainingsbeispielen trainiert worden, die zu der Kategorie gehören,
die einen inneren Zustand des Testobjekts repräsentieren, wobei Verteilungen von Zugehörigkeitsgraden
der Trainingsbeispiele in der Entscheidungseinheit festgelegt sind und wobei die Verteilungen
bezüglich Neuronen festgelegt werden, die durch die Trainingsbeispiele basierend auf
den Trainingsbeispielen und Gewichtungsvektoren der angeregten Neuronen angeregt sind.
Die Entscheidungseinheit bestimmt, dass die Eigenschaftsmenge zu der Kategorie gehört,
wenn eines der angeregten Neuronen über die Eigenschaftsmenge und die Entfernung zwischen
der Eigenschaftsmenge und einem Gewichtungsfaktor von jedem (einen oder mehreren)
der angeregten Neuronen angeregt ist und zu einem Zugehörigkeitsgrad gleich oder höher
als ein über die Verteilungen bestimmter Schwellenwert korrespondiert. Die Verteilungen
der Zugehörigkeitsgrade sind Gaußsche Verteilungen, von denen jede über einen Mittelwert
und eine Varianz definiert ist. Die Varianzen der Gaußschen Verteilungen sind über
Entfernungen zwischen den Trainingsbeispielen und Gewichtungsvektoren der angeregten
Neuronen festgelegt und die Mittelwerte der Gaußschen Verteilungen sind Gewichtungsvektoren
der angeregten Neuronen. Der Schwingungserzeuger umfasst einen Hammer, wobei die Oberfläche
des Hammers mit einem elastischen Material bedeckt ist, um ein Kratzen am Testobjekt
zu vermeiden, und eine Antriebseinheit, um den Hammer vor und zurück zu bewegen. Ferner
umfasst der Schwingungserzeuger vorzugsweise Schenkel, um das Schlagen ausgehend von
einem konstanten Abstand zwischen dem Testobjekt und dem Hammer sicherzustellen. Die
Antriebseinheit ist so konfiguriert, dass sie einen Schlag, der beispielsweise durch
einen Elektromagnet zum linearen Antreiben eines Kolbens erzeugt wird, auf den Hammer
überträgt. Um eine konstanten Positionsbeziehung zwischen dem Schwingungserzeuger
und der Sensoreinheit sicherzustellen, sind der Schwingungserzeuger und die Sensoreinheit
durch einen Arm miteinander mechanisch gekoppelt. Bei einer alternativen Ausführungsform
des Schwingungserzeugers kann ein Schallwellengenerator zum Übertragen von Vibrationen
auf das Testobjekt durch eine Schallwelle verwendet werden. Die akustische Welle liegt
dabei nicht innerhalb eines hörbaren Frequenzbandes sondern kann höher oder niedriger
als das hörbare Frequenzband sein. Wenn die niedrigere Frequenz verwendet wird, wirkt
der im Schwingungserzeuger verwendete Akustikwellengenerator virtuell, wobei die Wellenform,
die Frequenz und die Dauer der vom Schwingungserzeuger emittierten akustischen Welle
geeignet ausgewählt werden kann. Die Wellenform kann beispielsweise eine Sinuswelle,
eine Rechteckwelle, eine Dreieckwelle oder eine Sägezahnwelle sein, und die Frequenz
kann konstant sein oder kann beispielsweise schrittweise geändert werden. Die Auswahl
der Wellenform, der Frequenz und der Dauer kann durch Einstellen an einer im Schwingungserzeuger
vorgesehenen Auswahleinheit getroffen werden und das neuronale Netzwerk hat bei beiden
Ausgestaltungen des Schwingungserzeugers zwei Betriebsmodi, nämlich einen Trainingsmodus
und einen Prüfmodus.
[0009] Weiterhin ist, ausgehend von einem trainierbaren System mit selbstlernendem Effekt
auf Basis der
DE 10 2014 012 184 B4 der Anmelderin, in der nicht vorveröffentlichten
DE 10 2017 012 007.2 der Anmelderin eine Vorrichtung und ein Verfahren zur akustischen Prüfung von Objekten
beschrieben. Die Vorrichtung ist als ein mobiles Gerät mit einem Gerätegehäuse ausgestaltet,
welches außerhalb des Gerätegehäuses eine an diesem gelagerte Erregungsvorrichtung
und einen benachbart hierzu angeordneten akustischen Sensor aufweist. Innerhalb des
Gerätegehäuses ist mittels eines handbetätigten, am Gerätegehäuse angeordneten Betriebsarten-Umschalters
der Ausgang des akustischen Sensors entweder mit einem Analysemodul oder einem Trainingsmodul
verbunden. Der Ausgang des Trainingsmoduls ist mit einer innerhalb des Gerätegehäuses
angeordneten Modellbibliothek verbunden ist, welche mit dem Analysemodul in Verbindung
steht. Mit dem Analysemodul steht ein Anzeigemodul in Verbindung, wobei das Gerät
im Analysemodus gegen das Objekt geschlagen oder ein Schall induziert werden kann
und das Ergebnis der Prüfung kann automatisch am Anzeigemodul des Geräts angezeigt
werden. Im Einzelnen leitet das Anzeigemodul das Ergebnis der Prüfung drahtlos an
ein Auswertungsgerät in Form einer App eines PCs oder eines Smartphones weiter. Das
in der nicht vorveröffentlichten
DE 10 2017 012 007.2 der Anmelderin beschriebene Verfahren beruht auf einer Vorrichtung, welche als ein
mobiles Gerät mit einem Gerätegehäuse ausgestaltet ist, welche außerhalb des Gerätegehäuses
eine an diesem gelagerte Erregungsvorrichtung und welche einen benachbart hierzu angeordneten
akustischen Sensor aufweist. In einem ersten Verfahrensschritt wird mittels der Erregungsvorrichtung
ein Objekt zur Abstrahlung von induzierten Schallsignalen angeregt, welche dann vom
akustischen Sensor aufgenommen und in elektrische, digitale Signale umgewandelt werden.
In einem zweiten Verfahrensschritt werden diese Signale entweder einem im Gerät angeordneten
Analysemodul oder einem Trainingsmodul zugeführt. In einem dritten Verfahrensschritt
wird eines der beiden Module für die Signale ausgewählt, was von der mittels eines
Betriebsarten-Umschalter am Gerät eingestellten Betriebsart abhängig ist. In der Betriebsart
"Training" werden die Signale klassifiziert und einem statistischen Modell hinzugefügt.
Das statistische Modell wird bei jedem neuen Geräusch weiter verbessert und nach Beendigung
der Trainingsphase in einer Modellbibliothek abgelegt. In einem vierten Verfahrensschritt
werden während der Betriebsart "Analyse" die akustischen Signale statistisch mit bekannten
Modellen aus der Modellbibliothek verglichen und daraus, bei jedem Geräusch ein Ergebnis
gebildet werden. Schließlich wird durch ein Anzeigemodul des Geräts dem Anwender in
einem fünften Verfahrensschritt das Ergebnis angezeigt. Damit wird in der nicht vorveröffentlichten
DE 10 2017 012 007.2 der Anmelderin ein universell einsetzbares, flexibel anpassbares, mobiles und robustes
Prüfgerät beschrieben, dass von einem Laien bedienbar ist und das Ergebnis der Prüfung
automatisch an diesem anzeigt wird.
[0010] Schließlich ist aus einer wissenschaftlichen Veröffentlichung von
KWON, Soonil; NARAYANAN, Shrikanth: Unsupervised Speaker indexing using generic models.
In: IEEE transactions on speech and audio processing. Vol. 13, 2005, No. 5, S. 1004-1013.-ISSN
1063-6676 eine sequentielle Sprecherwechselerkennung bekannt, wobei die Sprechermodellierung
im Licht der Tatsache, dass die Anzahl/Identität der Sprecher unbekannt ist, erfolgen
soll. Um dieses Problem zu lösen, wird ein neues Verfahren, nämlich ein vorbestimmter
generischer sprecherunabhängiger Modellsatz vorgeschlagen, der dort als Sample-Sprecher-Modelle
(SSM) bezeichnet wird. Dieser Satz kann für eine genauere Sprechermodellierung und
Clusterung nützlich sein, ohne Trainingsmodelle auf Zielsprecherdaten zu erfordern.
Sobald ein sprecherunabhängiges Modell aus den generischen Mustermodellen ausgewählt
wird, wird es progressiv in ein spezifisches sprecherabhängiges Modell angepasst.
Hinsichtlich seiner Leistungsfähigkeit wurde dieses neue SSM-Verfahren (sample speaker
model), insbesondere hinsichtlich der robusten Sprecherwechselerkennung als eine kritische
Voraussetzung für ein Sprecherclustering, mit dem Stand der Technik, nämlich universal
background model (UBM) und universal gender models (UGM), experimentell verglichen.
Wie im Abschnitt III Sprecherwechselerkennung unter Verwendung von lokalisiertem Suchalgorithmus
(LSA) erläutert ist, gibt es im Allgemeinen zwei Kategorien von Sprecherwechsel-Erkennungsverfahren:
metrikbasierte und modellbasierte. Das metrikbasierte Verfahren verwendet den Maximalpunkt
einer entsprechend definierten " Metrik " zwischen benachbarten Segmenten zur Signaldetektion.
Das modellbasierte Verfahren beruht dagegen auf Modellen für Sprecher, Hintergrundrauschen,
Sprache und Musik, die vorab abgespeichert (aufgebaut) sind. Der eingehende Audiostrom
wird dann beispielsweise durch eine Maximum-Likelihood-Auswahl über ein Schiebeanalysefenster
klassifiziert. Die modellbasierte Detektion erfordert sowohl Trainingsdaten als auch
einige Informationen über die Testdaten, wie die Anzahl der Sprecher. Im Gegensatz
zu den modellbasierten Verfahren können metrikbasierte Verfahren ohne solche Datenanforderungen
ausgeführt werden. Erstere bietet jedoch Potential für progressive Anpassung und Regression.
Die Grenzen des dort beschriebenen SSM-Verfahren (sample speaker model) liegen darin,
dass zum einen nicht bekannt ist was der Benutzer als Nutzsignal oder als Störsignal
betrachten wird und dass vor allem unterschiedliche Sprachen mit unterschiedlichen
Sprechgeschwindigkeiten und Tonlagen in unterschiedlich halligen Räumen, fluktuierende
Störgeräusche oder "Musik" (Instrumente und Gesang) Probleme (Erkennungsrate) bereitet.
[0011] Wie die vorstehende Würdigung des Standes der Technik aufzeigt, sind auf verschiedenen
technischen Gebieten unterschiedlich ausgestaltete Verfahren und Vorrichtungen zur
automatischen Erkennung und Klassifizierung von akustischen Signalen in einem Überwachungsbereich
bekannt. In der Regel werden die Signale zur Aufzeichnung und zum Vergleich mit einem
in einer Bibliothek vorher eingespeicherten Referenzmuster einer zentralen Stelle
zugeführt, was zu einem erheblichen Aufwand bei der Aufzeichnung und Klassifikation
(feste modellbasierte Referenz-Klassifikation oder gelernte Referenz-Klassifikation
aus den vorangegangenen Klassifikationen) führt. Deshalb fehlen in der Praxis kostengünstige
Verfahren und Vorrichtungen in Hinblick auf das Einfließen aller signalbeeinflussenden
Faktoren in das jeweilige Erkennungsmodell, insbesondere unter Berücksichtigung der
aktuellen Situation und einfachen Konfiguration bzw. Adaption in einer Trainingsphase
durch den Anwender/Benutzer.
[0012] Der Erfindung liegt die Aufgabe zugrunde, ausgehend von bekannten Verfahren und Vorrichtungen
zur automatischen Erkennung und Klassifizierung von hörbaren akustischen Signalen
in einem Überwachungsbereich, die Anordnung und das Verfahren derart auszugestalten,
dass bei der Konfiguration durch den Anwender diese von einem Laien bedienbar ist
und alle signalbeeinflussenden Faktoren mit in das jeweilige Erkennungsmodell einfließen.
Weiterhin soll dieses anpassbar und universell einsetzbar sein, wobei automatisch
ein Alarm für einen zu sichernden Bereich ausgelöst wird.
[0013] Diese Aufgabe wird ausgehend von einer Anordnung nach dem Oberbegriff des Patentanspruchs
1, dadurch gelöst, dass der akustische Sensor drahtlos oder drahtgebunden über eine
Schnittstelle mit einer im Gerät angeordneten Signalvorverarbeitung und Musterextraktion
verbunden ist, dass der Ausgang der Signalvorverarbeitung und Musterextraktion über
einen Betriebsartenschalter mit dem Analysemodul oder dem Trainingsmodul verbunden
ist, dass der Steuereingang des Betriebsartenschalters mit einer Steuerungseinheit
verbunden ist, welche derart ausgestaltet ist, dass benutzergesteuert zwischen mehreren
Betriebsarten umgeschaltet oder die Verarbeitung des vom akustischen Sensor erfassten
Schalls gestoppt werden kann und dass ein im Gerät angeordnetes Modell oder Geräuschmodell
mit dem Analysemodul oder dem Trainingsmodul und einem im Gerät angeordneten Optimierungsmodul
zur Nachbesserung und zur Optimierung eines bestehenden Modells verbunden ist.
[0014] Schließlich wird diese Aufgabe durch ein Verfahren nach dem Oberbegriff gemäß Patentanspruch
6 dadurch gelöst, wobei das Verfahren umfasst:
- Zuführung vom akustischen Sensor - drahtlos oder drahtgebunden über eine Schnittstelle
- des erfassten Schalls zu einer im Gerät angeordneten Signalvorverarbeitung und Musterextraktion,
- Nutzung der vom Sensor in periodischer Abfolge gelieferten Musterdaten wahlweise zum
Training eines im Gerät angeordneten Modells oder Geräuschmodells durch ein Trainingsmodul
oder
- Zuführung zur Analyse der Merkmale zu einem Analysemodul
- Nutzung eines im Gerät angeordneten Optimierungsmoduls zur Nachbesserung und zur Optimierung
eines bestehenden Modells und
- benutzergesteuerte Umschaltung mittels eines Betriebsartenschalters und einer Steuerungseinheit
zwischen den Betriebsarten "Analyse" und "Training" oder "Stopp" der Verarbeitung
des vom akustischen Sensor erfassten Schalls.
[0015] Die erfindungsgemäße Anordnung und das Verfahren weisen den Vorteil auf, dass alle
signalbeeinflussenden Faktoren mit in das jeweilige Modell einfließen und dem Benutzer
auf überraschend einfache Art und Weise die Konfiguration, Anpassung und Optimierung
ermöglicht wird.
[0016] Weitere Vorteile und Einzelheiten lassen sich der nachfolgenden Beschreibung von
bevorzugten Ausführungsformen der Erfindung unter Bezugnahme auf die Zeichnungen entnehmen.
In der Zeichnung zeigt:
- Fig. 1
- ein Blockschaltbild des Aufbaus eines Geräts mit allen Komponenten gemäß der Erfindung,
- Fig. 2
- einen Screenshot in der Betriebsart "Lernen" und
- Fig.3
- einen Screenshot in der Betriebsart "Lauschen" des erfindungsgemäßen Geräts und
- Fig. 4
- ein abgesetztes Panel mit einem Bedienfeld, insbesondere mit drei Bedienelementen
für Lernen, Lauschen und Stopp.
[0017] Gegenstand der Erfindung ist ein System S zur akustischen Überwachung von Objekten
und Umgebungen mit einem Gerät G, welches eine Schnittstelle zu einem Bedienfeld /Panel
P oder einem Gerät G und davon abgesetzten Bediengerät P oder einem Panel mit drei
Steuertasten 10 (siehe Fig. 4) aufweist. Das System kann einfach und automatisch eine
komplexe, akustische Umgebung lernen, indem es in dieser Umgebung positioniert wird
und dort für eine begrenzte Zeit (benutzergesteuert oder automatisch) alle auftretenden
akustischen Ereignisse untersucht, klassifiziert und in einem Model festhält.
[0018] Wie nachfolgend beschrieben und erläutert wird, kann dieses Modell zur Überwachung
der gleichen Umgebung genutzt werden. Dabei werden dann Unterschiede zu den gelernten
Situationen identifiziert und diese als Ergebnis signalisiert.
[0019] Das akustische Überwachungssystem S besteht aus mehreren Komponenten. Diese Komponenten
werden nachfolgend beschrieben. Mit einem akustischen Sensor 1 werden akustische Umgebungsgeräusche
in elektrische Signale umgewandelt und drahtlos oder drahtgebunden über eine Schnittstelle
einer im Gerät G angeordneten Signalvorverarbeitung und Musterextraktion 2 zugeführt.
Dabei kann sich der Sensor 1 unmittelbar am Gerät G befinden oder aber auch abgesetzt
davon angeordnet sein. Die vom Sensor 1 in periodischer Abfolge gelieferten Musterdaten
können wahlweise zum Training eines im Gerät G angeordneten Modells/Geräuschmodells/Modellbibliothek
6 durch ein Trainingsmodul 4 genutzt werden oder zur Analyse der Merkmale durch ein
Analysemodul 3 diesem zugeführt werden. Hierzu ist zwischen Signalvorverarbeitung
und Musterextraktion 2 und Analysemodul 3 sowie Trainingsmodul 4 ein Betriebsartenschalter
B angeordnet, welcher benutzergesteuert mittels einer Steuerungseinheit 7 zwischen
diesen Betriebsarten umschaltet oder benutzergesteuert die Verarbeitung der vom akustischen
Sensor 1 gelieferten Eingangsdaten komplett stoppt (siehe Fig. 4, Panel 10 mit drei
Steuertasten: Analyse auch Lauschen genannt, Training auch Lernen genannt, Stop).
Alternativ kann diese Funktion durch ein mit der Steuerungseinheit 7 verbundenes Zeitsteuerungsmodul
9 (siehe Fig. 1, Fig. 4) auch automatisch, nach vorher festgelegten Zeitplänen, realisiert
werden.
[0020] Die Basis des Analyseprozesses bildet das Geräuschmodell 6. Dieses beinhaltet alle
durch das Trainingsmodul 4 aufbereiteten und ihm zugeführten Geräuschmuster. In der
einfachsten Form der Markov-Modelle können sogenannten Markov-Ketten-Modelle zur statistischen
Beschreibung von Symbol- oder Zustandsfolgen verwendet werden. Das jeweilige Markov-Ketten-Modelle
gibt dann an, wie wahrscheinlich das Auftreten eines Geräusches in einem bestimmten
Umfeld/in einer bestimmten Umgebung ist. Dabei wird davon ausgegangen, dass bei einem
periodisch auftretenden Geräusch Pausen auftreten und anhand dieser Pausen eine Segmentierung
und die anschließende Klassifikation erfolgen kann. Weiterhin können im Rahmen der
Erfindung sogenannte Hidden-Markov-Modellen benutzt werden, wodurch das Konzept einer
statistisch modellierten Zustandsfolge um zustandsspezifische Ausgaben des Modells
erweitert wird. Man geht davon aus, dass nur diese sogenannten Emissionen beobachtbar
sind, die zugrundeliegende Zustandsfolge jedoch versteckt (engl. hidden) ist. Im Wesentlichen
lässt sich ein Hidden-Markov-Modell als statistisch angereicherter, generierender
endlicher Automat ansehen. Sowohl die Übergänge zwischen Zuständen als auch die Erzeugung
von Ausgaben erfolgt in Abhängigkeit von bestimmten Wahrscheinlichkeitsverteilungen.
Man nimmt dabei zuerst an, dass die zu untersuchenden Daten von einem natürlichen
Prozess erzeugt wurden, der vergleichbaren statistischen Gesetzmäßigkeiten gehorcht.
Dann versucht man diesen mit den Möglichkeiten von Hidden-Markov-Modellen möglichst
genau nachzubilden und diejenige Zustandsfolge zu bestimmen, die am wahrscheinlichsten
eine bestimmte Folge von Emissionen erzeugt. Ordnet man ganzen Modellen die Bedeutung
zu, Klassen von Mustern zu repräsentieren, so lässt sich der Formalismus zur Klassifikation
einsetzen. Durch die Aufdeckung der Zustandsfolge ist dann eine Segmentierung der
Daten mit gleichzeitiger Klassifikation möglich. In der praktischen Anwendung der
Markov-Modell-Technologie für Mustererkennungsaufgaben kann die Wahl des Startpunkts
die Leistungsfähigkeit des fertigen Markov-Modells entscheidend beeinflussen. Hierzu
zählen vor allem die erfolgreiche Konfiguration der Modelle, die Behandlung effizienter
Algorithmen, Methoden zur Anpassung der Modellparameter an veränderte Einsatzgebiete
sowie die Kombination von Markov-Ketten- und Hidden-Markov-Modellen in integrierten
Suchprozessen. Dabei werden Methoden zur Vektorquantisierung und Schätzung von Mischverteilungsmodellen
zur Modellierung hochdimensionaler Daten eingesetzt. Bei einem endlichen Zustandsraum
lassen sich Markov-Ketten mittels der Übergangsmatrix und von Wahrscheinlichkeitsvektoren
beschreiben. Wählt man einen stochastischen Startvektor vo (als Zeilenvektor) als
Startverteilung so ergibt sich die Verteilung zum Zeitpunkt t1 durch v1
=vo·
M.
[0021] Die Möglichkeit, auch große Markov-Ketten zu simulieren, macht man sich beim MCMC-Verfahren
(Markov-Chain-Monte-Carlo-Verfahren) zunutze, um Verteilungen zu simulieren, die nicht
durch klassische Verfahren simuliert werden können. Dabei wird eine Klasse von Algorithmen
benutzt, die Stichproben aus Wahrscheinlichkeitsverteilungen ziehen. Dies geschieht
auf der Basis der Konstruktion einer Markov-Kette, welche die erwünschte Verteilung
als ihre stationäre Verteilung aufweist. Der Zustand der Kette nach einer großen Zahl
von Schritten wird dann als Stichprobe der erwünschten Verteilung benutzt. Die Qualität
der Stichprobe steigt mit zunehmender Zahl der Schritte. MCMC-Verfahren erzeugen Systeme
im kanonischen Zustand. Eine hinreichende, aber nicht notwendige, Bedingung, dass
ein MCMC-Verfahren den kanonischen Zustand als stationäre Verteilung aufweist, ist
die Detailed-Balance-Eigenschaft (detailliertes Gleichgewicht bezeichnet eine Eigenschaft
von homogenen Markov-Ketten, nämlich einem speziellen stochastischen Prozess. Anschaulich
ist ein Prozess im detaillierten Gleichgewicht, wenn nicht erkennbar ist, ob er sich
zeitlich vorwärts oder rückwärts bewegt).
[0022] Vorzugsweise erfolgt die Modellierung mittels eines deterministischen Verfahrens
was den Vorteil aufweist, dass nicht (wie bei Markov-Ketten) jedes Mal von der Startposition
zu beginnen ist und dass auch keine Segmentierung erfolgen muss. Bei dieser erfindungsgemäßen
Art der Modellierung steht die Annahme im Vordergrund, dass bei Geräuschen, anders
als bei Sprache, die genaue zeitliche Struktur des Signals vernachlässigt werden kann.
Es ist völlig ausreichend, bei jedem Bearbeitungsschritt t die Verteilung der Merkmale
auf Cluster C(t) ohne die Übergänge auf andere Cluster im nächsten Zeitschritt t+T1
zu realisieren. Betrachtet man dann die Trefferquote über einen längeren Zeitraum,
zum Beispiel T3, kann ein Geräuschmuster durch die Häufigkeit der Menge der aufgetretenen
Cluster
C mit hoher Wahrscheinlichkeit zugeordnet werden. Zusätzlich kann bei Bedarf die zeitliche
Abfolge der Cluster C(t) als weiterer Parameter berücksichtigt werden. Durch das Optimierungsmodul
5 ist es möglich, ein bestehendes Modell
M im hochkomplexen Lösungsraum nachzubessern und zu optimieren. Um die Toleranz des
Modells
M zu erhöhen, wird auch bei diesem Verfahren mit Clustern gearbeitet, deren Ausdehnung
im Merkmalsraum die Toleranz bzw. Sensibilität bestimmt. Dabei kann man pro Cluster
berücksichtigen wie viele Merkmale zu bestimmen sind und insbesondere, wenn das Merkmal
außerhalb des vorgegebenen Zeitraums liegt, diese Geräusche bei der Modellbildung
zu löschen oder nicht zu berücksichtigen.
[0023] Nachfolgend wird die Funktion des Systems S anhand des Ausführungsbeispiels gemäß
der Abbildung Fig. 1 beschrieben und erläutert. Die Funktionen des Systems S sind
unterteilt in zwei Hauptfunktionen, nämlich:
1.) Lernen/Training einer akustischen Umgebung.
2) Überwachen/Lauschen der gelernten Umgebung.
[0024] Die gesamte akustische Umgebung besteht in der Regel aus einer großen Menge unterschiedlicher
komplexer Geräusche. Im ersten Schritt werden diese in kleine (gleichlange oder kürzere
und längere) Zeitabschnitte T1 aufgeteilt. Für jedes dieser Zeitfenster T1 wird ein
Merkmal P(t) erzeugt, welches die zu diesem Zeitpunkt bestehende akustische Situation
in einen Merkmalsraum
R abbildet und einem Cluster Ci zuordnet. In einem zweiten Schritt wird der N-dimensionale
Merkmalsraum
R wird in eine endliche Anzahl von Cluster Ci unterteilt. Jedes dieser Cluster repräsentiert
einen speziellen Teil eines Geräuschmusters. Cluster werden während der Lernphase
des Systems automatisch erzeugt und angepasst. Die Menge aller zu einer speziellen
akustischen Umgebung gehörenden Cluster Ci {0<i<Z} werden als Datensätze in einem
Model
M verwaltet. Zusätzlich werden in einem dritten Schritt zu den Clusterdaten im Model
M dort der Zeitpunkt der Erzeugung und die Anzahl der zugeordneten Merkmale festgehalten.
[0025] Eine Lernphase/Training kann entweder mit einem bereits vorhandenen Model
M iterativ durchgeführt oder mit einem leeren Modell neu gestartet werden. Wie bereits
beschrieben, werden dabei die in einem periodischen Strom der im Zeitfenster T1 empfangenen
Merkmale P(t) ihren entsprechenden Cluster Ci zugeordnet und das Modell
M dementsprechend erweitert bzw. angepasst. Der Erfolg des Lernens (Betriebsart "Training")
kann zu einem Zeitpunkt T ermittelt werden, in dem gemessen wird, wieviele neue Cluster
in einem Zeitintervall T3 erzeugt wurden. Sinkt diese Rate unterhalb eine (vom Benutzer
vorgebbare) Schwelle, kann davon ausgegangen werden, dass die Umgebung hinreichend
genau gelernt wurde und eine relativ statische Geräuschumgebung vorliegt.
[0026] Fig. 2 zeigt einen Screenshot in der Betriebsart "Lernen" (Training) mit einer typischen
sogenannten Lernkurve L. Es ist zu sehen, dass im Verlauf der Zeit t (siehe X-Achse)
die Anzahl der neu gebildeten Cluster, hier als Ereignisse (siehe Y-Achse) je Zeiteinheit
T3 zu sehen, abnimmt. Dies ist ein typisches Verhalten für eine relativ statische
Geräuschumgebung, wie experimentelle Untersuchungen aufgezeigt haben. Das Bezugszeichen
T kennzeichnet den aktuellen Zeitpunkt des Screen-shots.
[0027] Bei der Optimierung im Optimierungsmodul 5 handelt es sich im Wesentlichen um das
Entfernen von Cluster, welche keine große Relevanz für die gesamte Modellierung des
akustischen Umfeldes haben. Erfindungsgemäß können Cluster dann entfernt werden, wenn
ihnen nur wenige Merkmale zugeordnet wurden oder diese zu Zeiten erzeugt wurden, die
später bei der Überwachung keine Berücksichtigung finden sollen.
[0028] Insbesondere kann eine weitere Form der Optimierung eines Modells
M während der Analysephase durchgeführt werden, indem Merkmale P(t), die sich im Randbereich
eines Cluster Ci befinden, eine Aktualisierung bzw. Korrektur des betroffenen Clusters
anstoßen. Damit können langsame Veränderungen der akustischen Umgebung adaptiert werden.
[0029] Auch in der Betriebsart "Lauschen" (Überwachen) werden im Zeitraster T1 Merkmale
verarbeitet. Anders als bei der Betriebsart "Training" (Analyse), führen diese jedoch
nicht dazu, dass das Modell
M verändert wird, sondern es wird lediglich bei jedem Schritt geprüft, ob sich das
Merkmal in einem im Modell
M vorhandenem Cluster Ci befindet. Ist dies nicht der Fall, handelt es sich um einen
Teil eines akustischen Ereignisses, welches nicht trainiert wurde und es wird ein
(in der Zeichnung nicht dargestellter und im Gerät G angeordneter) interner Ereigniszähler
inkrementiert. Überschreitet der Zählerstand dieses Zählers in einem Zeitintervall
T2 einen Schwellwert, so wird ein entsprechendes Signal an einem Anzeigemodul 8 präsentiert
und der Zähler zurückgesetzt.
[0030] Fig. 3 zeigt einen Screenshot in der Betriebsart "Lauschen". Eine sogenannte Lauschkurve
LA stellt den zeitlichen Verlauf mit dem Auftreten eines Signalisierungs-Ereignisses
dar, was dadurch charakterisiert ist, dass es im Zeitverlauf eine sogenannte Signalisierungsschwelle
SIS übersteigt. Auch hier werden die Ereignisse in dem Zeitintervall T3 betrachtet.
Die Dimensionierung des Zeitintervall T3 erfolgt derart, dass 30 bis 70 Ereignisse
pro Zeitfenster, vorzugsweise 50 Ereignisse pro Zeitfenster erfasst werden. Das Zeitraster
T2 und das Zeitraster T3 zur Erfassung der Ereignisse können gleichlang gewählt werden
und sind wesentlich länger (vorzugsweise um den Faktor 50) als das Zeitintervall T1.
Das Bezugszeichen T kennzeichnet den aktuellen Zeitpunkt des Screen-shots.
[0031] Zur Bedienung und zur Interaktion mit dem Benutzer kann insbesondere ein abgesetztes
Panel 10 (Smartphone- oder PC-App) mit einem Bedienfeld P realisiert werden. Die Fig.
4 zeigt einen möglichen Aufbau des Bedienfelds P, insbesondere mit drei Bedienelementen/Steuertasten
für Lernen, Lauschen und Stopp. Vorzugsweise ist auch ein am Gerät G angeordnetes
Bedienfeld P mit der Steuerungseinheit 7 verbunden. Ein Übertragungskanal 11 überträgt
die Eingabeaktionen des Benutzers zur Steuerungseinheit 7 des Überwachungssystems
S (Fig. 1 Gerät G, Fig. 4 Gerät G und Panel 10). Der Übertragungskanal 11 kann durch
verschiedene Implementationen realisiert werden (direkt oder abgesetzt durch z.B.:
WLAN, LAN, Bluetooth). Dieses erfindungsgemäße System S ermöglicht es dem Anwender/Benutzer
auf überraschend einfache Art und Weise das Einfließen aller signalbeeinflussenden
Faktoren in das jeweilige Erkennungsmodell, insbesondere unter Berücksichtigung der
aktuellen Situation und einfachen Konfiguration bzw. Adaption in einer Trainingsphase
durch den Anwender/Benutzer und ist von einem Laien bedienbar.
[0032] Für die akustische Überwachung mit dem hier beschriebenen erfindungsgemäßen System
S, gibt es dadurch viele verschiedene Anwendungsgebiete ohne dass vorher der jeweilige
Anwendungsfall vorprogrammiert werden muss. Allgemein kann festgestellt werden, dass
alle Überwachungsaufgaben, welche auf Schallereignisse basieren, damit realisiert
werden können. Voraussetzung ist aber, dass die Dynamik der Umgebung nicht zu groß
ist. Dies bedeutet, dass sich die Vielfalt möglicher akustischer Ereignisse und Signale
in einer endlichen Zeit erfassen und damit lernen lassen. Insbesondere ist erfindungsgemäß
ein Anzeigemodul 8 vorgesehen, welches mit dem Analysemodul 3 verbunden und außen
am Gerät G sichtbar ist (Fig. 1) oder mit diesem in Verbindung steht (Fig. 4 abgesetztes
Panel 10 und Bedienfeld P/Bediengerät P) und welches ein akustisches Ereignis, das
nicht trainiert wurde, anzeigt.
[0033] Ein typisches Anwendungsgebiet ist die Überwachung von speziellen Räumen. Zum Beispiel:
- Serverräume (Rechenzentren)
- Supermärkte (Baumärkte) außerhalb der Öffnungszeiten
- Produktions- bzw. Werkstätten außerhalb der Arbeitszeit
- Wohnungen bei Abwesenheit der Bewohner
[0034] Die zu überwachenden Umgebungen können durchaus mit kontinuierlichen Hintergrundgeräuschen
belastet sein. Diese werden beim Lernprozess berücksichtigt und ins jeweilige Modell
aufgenommen. Änderungen an diesen Geräuschkulissen z.B. durch Ausfall einer der dazu
beitragenden Komponente, führen zur Signalisierung dieses Ereignisses zum Beispiel
als Fehlerzustand.
[0035] Weiterhin können mit dem erfindungsgemäßen System S auch Anlagen oder Teile der Anlagen
fernüberwacht/überwacht werden. Zum Beispiel:
- Maschinen (z.B. Windkraftanlagen, Produktion, Roboter)
- Antriebe (z.B. Aufzüge)
[0036] Die Erfindung ist nicht auf die dargestellten und beschriebenen Ausführungsbeispiele
beschränkt, sondern umfasst auch alle im Sinne der Erfindung gleichwirkenden Ausführungen.
Ferner ist die Erfindung bislang auch noch nicht auf die in den Patentansprüchen 1
und 6 definierten Merkmalskombinationen beschränkt, sondern kann auch durch jede beliebige
andere Kombination von bestimmten Merkmalen aller insgesamt offenbarten Einzelmerkmale
definiert sein. Dies bedeutet, dass grundsätzlich praktisch jedes Einzelmerkmal der
Patentansprüche 1 und 6 weggelassen bzw. durch mindestens ein an anderer Stelle der
Anmeldung offenbartes Einzelmerkmal ersetzt werden kann.
Bezugszeichenliste:
[0037]
- (1)
- Akustischer Sensor
- (2)
- Signalvorverarbeitung und Musterextraktion
- (3)
- Analysemodul
- (4)
- Trainingsmodul
- (5)
- Optimierungsmodul
- (6)
- Modell / Modellbibliothek
- (7)
- Steuerungseinheit
- (8)
- Anzeigemodul
- (9)
- Zeitsteuerung
- (10)
- Panel mit den drei Steuertasten
- (11)
- Übertragungskanal zum Gerät/System
- B
- Betriebsartenschalter
- G
- Gerät
- L
- Lernkurve (Ereignisse/Zeitfenster)
- LA
- Lauschkurve (Ereignisse/Zeitfenster)
- P
- Bedienfeld (Panel)/Bediengerät
- S
- System (Gerät G, Bediengerät P)
- SIS
- Signalisierungsschwelle
- T
- Aktueller Zeitpunkt (Cursor)
- X
- X-Achse (Zeit)
- Y
- Y-Achse (Anzahl der Ereignisse)
1. Anordnung zur akustischen Überwachung von Umgebungen mit einem akustischen Sensor
(1) zur Erfassung des Schalls und mit einer in einem Gerät (G) angeordneten und mit
dem akustischen Sensor (1) in Verbindung stehenden Analyseeinrichtung (3) zur Analyse
des Schalls vom Körperschall bis in den Ultraschallbereich hinein sowie einem Trainingsmodul
(4), dadurch gekennzeichnet, dass der akustische Sensor (1) drahtlos oder drahtgebunden über eine Schnittstelle mit
einer im Gerät (G) angeordneten Signalvorverarbeitung und Musterextraktion (2) verbunden
ist, dass der Ausgang der Signalvorverarbeitung und Musterextraktion (2) über einen
Betriebsartenschalter (B) mit dem Analysemodul (3) oder dem Trainingsmodul (4) verbunden
ist, dass der Steuereingang des Betriebsartenschalters (B) mit einer Steuerungseinheit
(7) verbunden ist, welche derart ausgestaltet ist, dass benutzergesteuert zwischen
mehreren Betriebsarten umgeschaltet oder die Verarbeitung des vom akustischen Sensor
(1) erfassten Schalls gestoppt werden kann und dass ein im Gerät (G) angeordnetes
Modell oder Geräuschmodell (6) mit dem Analysemodul (3) oder dem Trainingsmodul (4)
und einem im Gerät (G) angeordneten Optimierungsmodul (5) zur Nachbesserung und zur
Optimierung eines bestehenden Modells (6) verbunden ist.
2. Anordnung nach Anspruch 1, wobei mit der Steuerungseinheit (7) ein Zeitsteuerungsmodul
(9) verbunden ist, wodurch automatisch, nach vorher festgelegten Zeitplänen, eine
Umschaltung zwischen drei Betriebsarten "Analyse", "Training" und "Stopp" erfolgen
kann.
3. Anordnung nach einem oder mehreren der Ansprüche 1 bis 2, wobei mit dem Analysemodul
(3) ein Anzeigemodul (8) verbunden ist, welches ein akustisches Ereignis, das nicht
trainiert wurde, anzeigen kann.
4. Anordnung nach einem oder mehreren der Ansprüche 1 bis 3, wobei ein abgesetztes Panel
(10) mit einem Bedienfeld (P) drahtlos oder drahtgebunden (11) oder ein am Gerät (G)
angeordnetes Bedienfeld (P) mit der Steuerungseinheit (7) verbunden ist.
5. Anordnung nach Anspruch 4, wobei das Bedienfeld (P) drei Steuertasten aufweist.
6. Verfahren zur akustischen Überwachung von Umgebungen mit einem akustischen Sensor
(1) zur Erfassung des Schalls und mit einer in einem Gerät (G) angeordneten und mit
dem akustischen Sensor (1) in Verbindung stehenden Analyseeinrichtung (3) zur Analyse
des Schalls vom Körperschall bis in den Ultraschallbereich hinein sowie einem Trainingsmodul
(4), wobei das Verfahren umfasst:
- Zuführung vom akustischen Sensor (1) - drahtlos oder drahtgebunden über eine Schnittstelle
- des erfassten Schalls zu einer im Gerät (G) angeordneten Signalvorverarbeitung und
Musterextraktion (2),
- Nutzung der vom Sensor (1) in periodischer Abfolge gelieferten Musterdaten wahlweise
zum Training eines im Gerät (G) angeordneten Modells oder Geräuschmodells (6) durch
ein Trainingsmodul (4) oder
- Zuführung zur Analyse der Merkmale zu einem Analysemodul (3),
- Nutzung eines im Gerät (G) angeordneten Optimierungsmoduls (5) zur Nachbesserung
und zur Optimierung eines bestehenden Modells (6) und
- benutzergesteuerte Umschaltung mittels eines Betriebsartenschalters (B) und einer
Steuerungseinheit (7) zwischen den Betriebsarten "Analyse" und "Training" oder "Stopp"
der Verarbeitung des vom akustischen Sensor (1) erfassten Schalls.
7. Verfahren nach Anspruch 6, wobei diese Betriebsarten "Analyse", "Training" und "Stopp"
durch ein mit der Steuerungseinheit (7) verbundenes Zeitsteuerungsmodul (9) auch automatisch,
nach vorher festgelegten Zeitplänen, erfolgen kann.
8. Verfahren nach einem oder mehreren der Ansprüche 6 bis 7, wobei ein akustisches Ereignis,
das nicht trainiert wurde, mit einem Anzeigemodul (8) angezeigt wird.
9. Verfahren nach einem oder mehreren der Ansprüche 6 bis 8, wobei im ersten Schritt
der Betriebsart "Training" mit einem bereits vorhandenen Model M iterativ oder mit einem leeren Modell neu gestartet die gesamte akustische Umgebung,
bestehend in der Regel aus einer großen Menge unterschiedlicher komplexer Geräusche,
diese in kleine Zeitabschnitte T1 aufgeteilt und für jedes dieser Zeitfenster T1 ein
Merkmal P(t) erzeugt wird, welches die zu diesem Zeitpunkt bestehende akustische Situation
in einen Merkmalsraum R abbildet und einem Cluster Ci zuordnet, dass im zweiten Schritt der N-dimensionale
Merkmalsraum R in eine endliche Anzahl von Cluster Ci unterteilt wird und jedes dieser Cluster einen
speziellen Teil eines Geräuschmusters repräsentiert, wobei Cluster während der Lernphase
des Systems (S) automatisch erzeugt und angepasst werden, indem die Menge aller zu
einer speziellen akustischen Umgebung gehörenden Cluster Ci {0<i<Z} als Datensätze
in einem Model M verwaltet werden und dass im dritten Schritt zusätzlich zu den Clusterdaten
im Model M der Zeitpunkt der Erzeugung und die Anzahl der zugeordneten Merkmale festgehalten
werden.
10. Verfahren nach einem oder mehreren der Ansprüche 6 bis 9, wobei der Erfolg in der
Betriebsart "Training" zu einem Zeitpunkt T ermittelt werden kann, indem gemessen
wird, wieviele neue Cluster in einem Zeitintervall T3 erzeugt wurden und dass wenn
diese Rate unterhalb einer Schwelle sinkt, davon ausgegangen werden kann, dass die
Umgebungsgeräusche hinreichend genau gelernt wurde und eine relativ statische Geräuschumgebung
vorliegt.
11. Verfahren nach einem oder mehreren der Ansprüche 6 bis 10, wobei bei der Optimierung
Cluster entfernt werden, welche keine große Relevanz für die gesamte Modellierung
des akustischen Umfeldes haben, indem ihnen nur wenige Merkmale zugeordnet wurden
oder diese zu Zeiten erzeugt wurden, die später bei der Überwachung keine Berücksichtigung
finden sollen.
12. Verfahren nach einem oder mehreren der Ansprüche 6 bis 11, wobei zur Optimierung eines
Modells während der Analysephase, Merkmale P(t), die sich im Randbereich eines Cluster
Ci befinden, eine Aktualisierung bzw. Korrektur des betroffenen Clusters anstoßen
wird, wodurch langsame Veränderungen der akustischen Umgebung adaptiert werden können.
13. Verfahren nach einem oder mehreren der Ansprüche 6 bis 12, wobei in der Betriebsart
"Lauschen" (Überwachen) die Merkmale im Zeitraster T1 verarbeitet werden, wobei das
Modell M nicht verändert wird, sondern es wird lediglich bei jedem Schritt geprüft,
ob sich das Merkmal in einem in M vorhandenem Cluster Ci befindet, dass falls dies
nicht der Fall es sich um einen Teil eines akustischen Ereignisses handelt, welches
nicht trainiert wurde und ein interner Ereigniszähler inkrementiert wird, und dass
wenn dieser Zähler in einem Zeitintervall T2 einen Schwellwert überschreitet, ein
entsprechendes Signal am Anzeigemodul (8) präsentiert und der Zähler zurückgesetzt
wird.
14. Verfahren nach einem oder mehreren der Ansprüche 6 bis 13, wobei in der einfachsten
Form ein Markov-Modell auf der Basis von Markov-Ketten-Modellen oder von Hidden-Markov-Modellen
oder ein deterministisches Verfahren zur statistischen Beschreibung von Symbol- oder
Zustandsfolgen verwendet werden.
15. Verfahren nach einem oder mehreren der Ansprüche 6 bis 14, wobei ein MCMC-Verfahren
(Markov-Chain-Monte-Carlo-Verfahren) mit einer Detailed-Balance-Eigenschaft benutzt
wird, um bei der Optimierung mittels des Optimierungsmoduls (5) Verteilungen zu simulieren.