[0001] Die Anmeldung betrifft Geräuschmaskierung, insbesondere Sprachmaskierung, und, im
Speziellen, eine Vorrichtung und ein Verfahren zur adaptiven, harmonischen Sprachmaskierschallerzeugung.
[0002] Insbesondere Sprachschalle sowie unvorhersehbare Geräusche, die sich in ihren Pegelspitzen
stark von dem Hintergrundniveau abheben, ziehen unsere kognitive Leistungsfähigkeit
in Mitleidenschaft (siehe Bodin Danielsson & Bodin, 2009). Diese negativen Effekte
auf das visuelle sowie auditive Kurzzeitgedächtnis von Störschallen, wie zum Beispiel
Sprache, werden irrelevanter Geräuscheffekt (Irrelevant Sound Effect, ISE) genannt.
[0003] Anforderungen an eine akustische Arbeitsplatzumgebung variieren sowohl über den zeitlichen
Verlauf des Arbeitstages als auch bei verschiedenen Aufgaben, die Mitarbeitende zu
erledigen haben. So haben Personen, die in einem vollbesetzten Büro arbeiten, ein
hohes Bedürfnis nach akustischer Privatsphäre, während Personen, die in einem kaum
besetzten Büro einer Arbeit nachgehen möglicherweise das Bedürfnis nach einem erweiterten
Hörhorizont haben, zum Beispiel um nicht von dem plötzlichen Erscheinen anderer Personen
überrascht zu werden (Zuydervliet et al., 2008).
[0004] Um einer Beeinträchtigung durch den ISE entgegenzuwirken, wird in einigen Großraumbüros
der Ansatz von globalen Maskierungssystemen über Lautsprecher verfolgt. Dabei wird
ein breitbandiges statisches Rauschen über zentrale Lautsprecher in den Büroräumen
wiedergegeben, mit dem Ziel Störschalle zu maskieren. Durch die daraus entstehende
Reduktion des Signal-Rausch-Abstandes von zum Beispiel störenden Sprachsignalen zu
dem nun angehobenen Hintergrundrauschen, wird die Sprachverständlichkeit minimiert
(Zuydervliet et al., 2008). Ein solches Rauschen kann von Nutzern allerdings als unangenehm
wahrgenommen und daher abgelehnt werden (siehe Keus Van De Poll, Marijke et al., 2015).
[0005] Manche Ansätze basieren auf einer dynamischen Anpassung der Lautstärke von Maskierschallen
an sich ändernde Hintergrundschallbedingungen. So existieren Ansätze von globalen
Systemen, bei denen sich der Maskierschall in festgelegten Zeitintervallen oder auf
Grundlage von Mikrofonmessungen im gesamten Büro ändert. Diese bieten eine eher unflexible
und daher unzulängliche Lösung. Außerdem ist eine Steigerung der Mitarbeiterzufriedenheit
zu beobachten, wenn Angestellte die Möglichkeit haben ihren Arbeitsplatz zu personalisieren
(siehe Huang, Robertson & Chang, 2004; Lee & Brand, 2010).
[0006] Damit ein Schall über eine ausreichende Maskierwirkung verfügt, muss er in allen
Frequenzanteilen, in denen das Störsignal vorkommt, über ein ausreichend breitbandiges
Rauschsignal verfügen. Rosa Rauschen beispielsweise, welches einen Abfall der Lautstärke
von etwa 3 dB pro Oktave hat, wurde als ein effektives Maskiersignal identifiziert.
Allerdings wird es von Probanden subjektiv oft als störend wahrgenommen und daher
eher abgelehnt (Schlittmeier & Hellbrück, 2009). In diversen anderen Studien werden
Maskiersignale mit anderen Spektren vorgeschlagen und untersucht. Dabei wurden Signale,
wie in dem Frequenzgang angepasstes Rosa Rauschen, sprachähnliches Gemurmel von mehreren
Sprechern oder auch natürliche Signale, wie Quellwasserrauschen betrachtet (Hongistob
et al., 2017; Veitch et al., 2002; Wang, Drotleff & Li, 2012). Natürliche Geräuschquellen
scheinen dabei die Nutzerakzeptanz deutlich zu verbessern (Haapakangas et al., 2011).
Auch Musik wurde als Geräuschquelle von Aufgaben irrelevanten Schallen in Studien
untersucht, was sich allerdings als weniger effektiv herausstellte (Haapakangas et
al., 2011; Schlittmeier & Hellbrück, 2009).
[0007] Um die eben beschriebenen subjektiven Urteile neben der alleinigen psychoakustischen
Wirksamkeit mit einzubeziehen, stellte Chanaud (2007) zwei Systeme der adaptiven Schallmaskierung
vor. Zum einen ein zeitbasiertes System, bei dem der Schalldruckpegel des Maskier
Schalles in statischen Zeitintervallen über den Tag variiert. Dafür müssen für verschiedene
Tageszeiten verschiedene Bedürfnisse an Akustischer Privatsphäre, sowie das voraussichtliche
Maß an Störintensität des Schalls vorhergesagt werden. So ist es über Nacht und am
frühen Morgen für Angestellte wichtig, die Präsenz anderer Menschen hören zu können.
Dementsprechend würde kein oder nur ein sehr leiser Maskierschall zu dieser Zeit ausreichen.
Zu Stoßzeiten, in denen die meisten Angestellten an Ihrem Arbeitsplatzankommen oder
diesen wieder verlassen, herrscht viel soziale Interaktion, wodurch ein hohes Maß
an akustischer Ablenkung entstehen kann, welche durch höhere Lautstärken des Maskierschalls
kompensiert werden sollen. Während der Mittagspause ist der Bedarf nach Maskierung
wieder gering. Das 10. Perzentil L10, des gemessenen Schallpegels beschreibt den Schallpegel,
welcher mindestens in 10% der betrachteten Teilzeit erreicht wurde. Das 90. Perzentil
L90, beschreibt den Schallpegel, welcher mindestens in 90% der betrachteten Teilzeit
erreicht wurde.
[0008] Zuydervliet et al. (2008) schlägt ebenfalls vor, dass bei einer adaptiven Maskierschallsteuerung
der 10. und der 90. Perzentilwert ermittelt werden sollen. Dabei steht das 90. Perzentil
L
AF,90% stellvertretend für das Hintergrundrauschen des Umgebungsschalls und das 10. Perzentil
L
AF,10% beschreibt die Aktivitätstransienten von Störschallen in der Hintergrundschallbedingung.
Die Differenz dieser L
AF,10%-90%-Werte beschreibt also eine SNR von Störanteilen und Hintergrundrauschen (Zuydervliet
et al., 2008). Ist der SNR hoch, verfügt der Hintergrundschall über einen großen Changing-State-Charakter
und verursacht demnach einen ISE. Der ermittelte L
AF,10%-90%-Wert sollte laut Zuydervliet et al. (2008) mit einem Zielwert L
AF,10%-90%,Ziel, also mit einer optimale Perzentilwertdifferenz, verglichen werden. Wenn der Unterschied
des ermittelten L
AF,10%-90% größer ist als der Zielwert, soll sich das Maskierschalllevel langsam erhöhen und
somit den Signal-Rausch-Abstand (SNR) des Gesamtschalls verkleinern. Wenn der Unterschied
geringer ist, ist der SNR des Summensignals schon kleiner als mindestens notwendig
um keinen ISE zu verursachen, und der Maskierschall kann langsam leiser werden. Weitere
Parameter wie ein Gewichtungsfaktor W, eine maximale Lautstärkeänderung pro Minute,
sowie ein Parameter zur Anpassung der Sensitivität können somit eine optimale Lautstärke
des Maskierschalls beeinflussen (Zuydervliet et al., 2008). Dabei soll der Zielwert
(L
AF,10%-90%,Ziel) zwischen 3 und 10 dB liegen, während der Gewichtungsfaktor zwischen 0.5 und 4 liegen
sollte. Die Zeitperiode über welche die Analyse der Perzentilwerte verläuft bestimmt
die Senitivität des Systems, wobei hierfür ein Betrachtungszeitraum von 15 s vorgeschlagen
wird. Wird ein längerer Zeitraum gewählt, fallen Pegelschwankungen weniger stark ins
Gewicht und die Steuerung reagiert langsamer auf sich ändernde Schallbedingungen.
Als maximale Änderungsrate wird ein Wert von 0,05 dB pro Sekunde genannt (L'Esperance
et al., 2017).
[0009] Laut Chanaud (2007) sollten die Pegelanhebung generell schneller erfolgen als die
Pegelabsenkung des Maskierschalles. Des Weiteren wird vorgeschlagen, bei adaptiven
Maskierschall Systemen das obere sowie das untere Limit zu beschränken. Dabei sollte
gewährleistet werden, dass zu jeder Zeit eine ausreichende Maskierung gesichert ist,
zugleich aber ein maximal zumutbarer Pegel nicht überschritten wird. Zuydervliet et
al. (2008) schlägt für einen Dynamikbereich der Maskierschalllautstärke 5dB vor, in
der Arbeit von L'Espérance (2017) dagegen wird 3dB vorgeschlagen.
[0010] Während ein Großteil der bisherigen Lösungsansätze sich auf globale Maskiersysteme
fokussiert, bei welchen die Maskierschalle über zentrale Lautsprecher in z.B. einem
Großraumbüro wiedergeben werden, empfehlen Schlittmeier und Hellbrück (2009) lokale
Maskierungssysteme für einzelne Arbeitskräfte. Da sich allerdings wiederum benachbarte
Mitarbeitende durch Übersprechen von individuellen, über Lautsprecher wiedergegebenen
Maskierschallen pro Arbeitsplatz gestört fühlen können, ist die Wiedergabe dieser
Maskierschalle über Kopfhörer in Kombination mit einer adaptiven Pegelsteuerung ein
vielversprechender Ansatz. Die Akzeptanz von einem solchen kopfhörerbasiertem Maskiersystem
sollte auch durch die Personalisierbarkeit von Nutzern im Vergleich zu Lautsprechermaskierungssystemen
verbessert werden. Denn verschiedene Studien zeigen, dass eine erhöhte Zufriedenheit
in Bezug auf das Arbeitsumfeld herrscht, wenn dieses durch die Mitarbeitenden kontrollierbar
ist (Huang et al., 2004; Lee & Brand, 2010).
[0011] Doch nicht nur die Zufriedenheit von Angestellten, sondern auch deren physische Gesundheit
und Performance sollen durch mehr Kontrolle über das Arbeitsumfeld gesteigert werden
(siehe Cohen, 1980; Quick, 1990). Auch Renz (2019) orientiert sich an Perzentilwertdifferenzen
L
AF,10%- L
AF,90% und hat dabei eine neue Methode zur Vorhersage eines voraussichtlichen Leistungsabfalls
DP (engl.: decrease of performance; deutsch: Rückgang der Performanz), erarbeitet.
Renz (2019) schlägt 2 bis 3 dB als geeigneten Zielwert (L
AF,10%-90%,Ziel) für eine adaptive Pegelsteuerung von Maskierschallen vor.
[0012] Die von Renz (2019), "Personalised sound masking in open offices. A trade-off between
annoyance and restoration of working memory performance?" Stuttgart: Fraunhofer Verl,
Stuttgart, evaluierten und geplotteten DP Werte in Abhängigkeit von dem Vorhersageparameter
L
AF,10%-90% sind in Renz, 2019 auf Seite 204 gezeigt. Renz, 2019, zeigt dabei auf Seite 204 einen
Plot des kognitiven Performance Vorhersage Modells des resultierenden DP bei dem Vorhersageparameter
LAF 10-90.
[0013] US 2003/103632 A1 zeigt ein adaptives Geräuschmaskierungssystem und Geräuschmaskierungsverfahren, das
unerwünschte Geräusche in Zeitblöcke unterteilt und das Frequenzspektrum und den Leistungspegel
schätzt und dabei kontinuierlich weißes Rauschen mit einem passenden Spektrum und
Leistungspegel erzeugt, um das unerwünschte Geräusch zu maskieren.
[0014] CN 110362789 A zeigt ein Geräuschmaskierungsverfahren und ein adaptives Geräuschmaskierungssystem
mit einer Geräuschmaskierungsdatenbank, einem Geräuschzufriedenheitsagentenmodell
und einem selbstanpassenden Geräuschmaskierungs-Suchsystem.
[0015] US 2015/194144 A1 zeigt ein Multi-Mikrofon-Teilsystem um Geräusche zu erfassen, einen Spektrumanalysator,
um ein Leistungsmerkmal des erfassten Geräusches zu bestimmen, und einen räumlichen
Analysator um ein Richtungsmerkmal des Geräusches zu erfassen.
[0016] Eine Vorrichtung nach Anspruch 1, ein Verfahren nach Anspruch 14 und ein Computerprogramm
nach Anspruch 15 werden bereitgestellt.
[0017] Eine Vorrichtung zur Sprachmaskierschallerzeugung gemäß einer Ausführungsform wird
bereitgestellt. Die Vorrichtung umfasst einen Analysator zur Analyse von jedem frequenzbandbegrenzten
Signalanteil einer Mehrzahl von frequenzbandbegrenzten Signalanteilen eines Mikrofonsignals
während eines analysierten Zeitraums, um Information über den frequenzbandbegrenzten
Signalanteil zu erhalten. Des Weiteren umfasst die Vorrichtung einen Maskiersignalerzeuger
zur Erzeugung eines Maskiersignals abhängig von der Information über den frequenzbandbegrenzten
Signalanteil jedes der Mehrzahl von frequenzbandbegrenzten Signalanteilen. Die Information
über den frequenzbandbegrenzten Signalanteil hängt von einem ersten Schallpegel ab,
der mindestens während einer ersten Zeitdauer während des analysierten Zeitraums erreicht
wurde. Ferner hängt die Information über den frequenzbandbegrenzten Signalanteil von
einem zweiten Schallpegel ab, der mindestens während einer zweiten Zeitdauer während
des analysierten Zeitraums erreicht wurde, wobei die zweite Zeitdauer von der ersten
Zeitdauer unterschiedlich ist.
[0018] Des Weiteren wird ein Verfahren zur Sprachmaskierschallerzeugung gemäß einer Ausführungsform
bereitgestellt. Das Verfahren umfasst:
- Analysieren von jedem frequenzbandbegrenzten Signalanteil einer Mehrzahl von frequenzbandbegrenzten
Signalanteilen eines Mikrofonsignals während eines analysierten Zeitraums, um Information
über den frequenzbandbegrenzten Signalanteil zu erhalten. Und:
- Erzeugen eines Maskiersignals abhängig von der Information über den frequenzbandbegrenzten
Signalanteil jedes der Mehrzahl von frequenzbandbegrenzten Signalanteilen.
[0019] Ferner wird ein Computerprogramm mit einem Programmcode zur Durchführung des oben
beschriebenen Verfahrens gemäß einer Ausführungsform bereitgestellt.
[0020] Die Information über den frequenzbandbegrenzten Signalanteil hängt von einem ersten
Schallpegel ab, der mindestens während einer ersten Zeitdauer während des analysierten
Zeitraums erreicht wurde. Ferner hängt die Information über den frequenzbandbegrenzten
Signalanteil von einem zweiten Schallpegel ab, der mindestens während einer zweiten
Zeitdauer während des analysierten Zeitraums erreicht wurde, wobei die zweite Zeitdauer
von der ersten Zeitdauer unterschiedlich ist.
[0021] Ausführungsformen stellen einen Regelungsalgorithmus bereit, welcher ein Sprachmaskiersignal
zur Darbietung über Kopfhörer gleichsam angenehm als auch gesichert, psychoakustisch
validiert einstellen kann.
[0022] Die oben beschriebenen, von Renz (2019) evaluierten und geplotteten DP Werte in Abhängigkeit
von dem Vorhersageparameter L
AF,10%-90%, die in Renz, 2019 auf Seite 204 abzulesen sind, bilden eine wissenschaftliche Grundlage
von Überlegungen, auf denen Ausführungsformen basieren.
[0023] Manche Ausführungsformen stellen einen Maskierschall bereit, welcher beispielsweise
individuell über Kopfhörer einstellbar ist und immer nur in einem Maße zum Einsatz
kommt, in dem er gerade benötigt wird. Hierdurch wird eine effektive Möglichkeit geschaffen,
um sowohl die kognitive Leistungsfähigkeit, als auch die Zufriedenheit der Mitarbeitenden
am Arbeitsplatz zu verbessern.
[0024] Nachfolgend werden bevorzugte Ausführungsformen der Erfindung unter Bezugnahme auf
die Zeichnungen beschrieben.
[0025] In den Zeichnungen ist dargestellt:
- Fig. 1
- zeigt eine Vorrichtung zur Sprachmaskierschallerzeugung gemäß einer Ausführungsform.
- Fig. 2
- zeigt ein Signalflussdiagramm mit einer Frequenzaufteilung in neun Oktavbänder gemäß
einer Ausführungsform.
- Fig. 3
- zeigt ein Signalflussdiagramm zur adaptiven Geräuschmaskierung gemäß einer Ausführungsform.
- Fig. 4
- ein Signalflussdiagramm eines Regelwert-Prüfers gemäß einer Ausführungsform.
- Fig. 5
- zeigt eine Regelschleife gemäß einer Ausführungsform.
[0026] Fig. 1 zeigt eine Vorrichtung zur Sprachmaskierschallerzeugung gemäß einer Ausführungsform.
[0027] Die Vorrichtung umfasst einen Analysator 110 zur Analyse von jedem frequenzbandbegrenzten
Signalanteil einer Mehrzahl von frequenzbandbegrenzten Signalanteilen eines Mikrofonsignals
während eines analysierten Zeitraums, um Information über den frequenzbandbegrenzten
Signalanteil zu erhalten.
[0028] Des Weiteren umfasst die Vorrichtung einen Maskiersignalerzeuger 120 zur Erzeugung
eines Maskiersignals abhängig von der Information über den frequenzbandbegrenzten
Signalanteil jedes der Mehrzahl von frequenzbandbegrenzten Signalanteilen.
[0029] Die Information über den frequenzbandbegrenzten Signalanteil hängt von einem ersten
Schallpegel ab, der mindestens während einer ersten Zeitdauer während des analysierten
Zeitraums erreicht wurde. Ferner hängt die Information über den frequenzbandbegrenzten
Signalanteil von einem zweiten Schallpegel ab, der mindestens während einer zweiten
Zeitdauer während des analysierten Zeitraums erreicht wurde, wobei die zweite Zeitdauer
von der ersten Zeitdauer unterschiedlich ist.
[0030] Gemäß einer Ausführungsform kann der Analysator 110 z.B. ausgebildet sein, eine Mikrofonsignal-Schallpegeldifferenz
zwischen dem ersten Schallpegel und dem zweiten Schallpegel für jeden Signalanteil
der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Mikrofonsignals zu bestimmen.
Dabei kann der Maskiersignalerzeuger 120 z.B. ausgebildet sein, das Maskiersignal
abhängig von der Mikrofonsignal-Schallpegeldifferenz jedes frequenzbandbegrenzten
Signalanteils der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Mikrofonsignals
zu bestimmen.
[0031] In einer Ausführungsform kann der Maskiersignalerzeuger 120 z.B. ausgebildet sein,
das Maskiersignal zu bestimmen, indem für jeden Signalanteil der Mehrzahl von frequenzbandbegrenzten
Signalanteilen, abhängig von der Mikrofonsignal-Schallpegeldifferenz dieses Signalanteils,
einen Pegelwert für eine frequenzbandbegrenzte Komponente des Maskiersignals, die
einem Frequenzbereich dieses Signalanteils entspricht, zu bestimmen, und eine Pegelanpassung
dieser frequenzbandbegrenzten Komponente des Maskiersignals mittels dieses Pegelwerts
vorzunehmen.
[0032] Gemäß einer Ausführungsform kann der Analysator 110 z.B. ausgebildet sein, ein Gesamtsignal
zu bestimmen, das von dem Mikrofonsignal abhängt, aber von dem Mikrofonsignal unterschiedlich
ist. Dabei kann der Analysator 110 z.B. ausgebildet sein, für jeden frequenzbandbegrenzten
Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals
einen Fehlerwert zu bestimmen, der eine Differenz zwischen einem Zielwert für eine
Gesamtsignal-Schallpegeldifferenz und einer aktuellen Gesamtsignal-Schallpegeldifferenz
des Gesamtsignals angibt. Der Maskiersignalerzeuger 120 kann dabei z.B. ausgebildet
sein, das Maskiersignal abhängig von dem Fehlerwert für jeden frequenzbandbegrenzten
Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals
zu bestimmen. Der Analysator 110 kann dabei z.B. ausgebildet sein, die aktuelle Gesamtsignal-Schallpegeldifferenz
zwischen einem dritten Schallpegel und einem vierten Schallpegel für jeden frequenzbandbegrenzten
Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals
zu bestimmen, wobei der dritte Schallpegel ein Schallpegel ist, der mindestens während
einer dritten Zeitdauer während eines analysierten Zeitraums in dem frequenzbandbegrenzten
Signalanteil des Gesamtsignals erreicht wurde, und wobei der vierte Schallpegel ein
Schallpegel ist, der mindestens während einer vierten Zeitdauer während des analysierten
Zeitraums in dem frequenzbandbegrenzten Signalanteil des Gesamtsignals erreicht wurde
erreicht wurde.
[0033] In einer Ausführungsform kann der Analysator 110 z.B. ausgebildet sein, jeden frequenzbandbegrenzten
Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals
abhängig von einem rückgekoppelten zeitlichen Abschnitt des Maskiersignals zu diesem
frequenzbandbegrenzten Signalanteil zu bestimmen.
[0034] Gemäß einer Ausführungsform kann der Analysator 110 z.B. ausgebildet sein, jeden
der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals abhängig
von einem Dämpfungsfaktor für diesen frequenzbandbegrenzten Signalanteil des Gesamtsignals
zu bestimmen, wobei der Analysator 110 ausgebildet ist, den Dämpfungsfaktor für diesen
frequenzbandbegrenzten Signalanteil auf dem entsprechenden frequenzbandbegrenzten
Signalanteil des Mikrofons anzuwenden, um ein gedämpftes Mikrofonsignal zu diesem
frequenzbandbegrenzten Signalanteil zu erhalten.
[0035] In einer Ausführungsform kann der Analysator 110 z.B. ausgebildet sein, jeden frequenzbandbegrenzten
Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals
als Summe des rückgekoppelten zeitlichen Abschnitt des Maskiersignals zu diesem frequenzbandbegrenzten
Signalanteil und des gedämpftes Mikrofonsignals zu diesem frequenzbandbegrenzten Signalanteil
zu bestimmen.
[0036] Gemäß einer Ausführungsform kann der Maskiersignalerzeuger 120 z.B. ausgebildet sein,
das Maskiersignal abhängig von einem Korrekturwert für jeden frequenzbandbegrenzten
Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals
zu bestimmen, wobei der Maskiersignalerzeuger 120 ausgebildet ist, den Korrekturwert
für diesen frequenzbandbegrenzten Signalanteil abhängig vom dem Fehlerwert für diesen
frequenzbandbegrenzten Signalanteil zu bestimmen.
[0037] In einer Ausführungsform kann der Maskiersignalerzeuger 120 des Weiteren z.B. ausgebildet
sein, den Korrekturwert für diesen frequenzbandbegrenzten Signalanteil abhängig von
einem zeitlichen Vorgängerwert dieses Korrekturwerts zu bestimmen.
[0038] Gemäß einer Ausführungsform kann der Maskiersignalerzeuger 120 z.B. ausgebildet sein,
den Korrekturwert abhängig von

zu bestimmen, wobei
zn der Korrekturwert zu einem Zeitpunkt n ist, wobei
zn-1 der zeitliche Vorgängerwert dieses Korrekturwerts zu einem Zeitpunkt n-1 ist, wobei
e der Fehlerwert ist, wobei
sgn eine Signumfunktion bezeichnet, und wobei
g(e) eine von dem Fehlerwert e abhängige Funktion bezeichnet.
[0039] In einer Ausführungsform kann der Maskiersignalerzeuger 120 z.B. ausgebildet sein,
das Maskiersignal abhängig von einem Stellwert für jeden frequenzbandbegrenzten Signalanteil
der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Mikrofonsignals zu bestimmen,
wobei der Maskiersignalerzeuger 120 ausgebildet ist, den Stellwert für diesen frequenzbandbegrenzten
Signalanteil abhängig von der Mikrofonsignal-Schallpegeldifferenz dieses frequenzbandbegrenzten
Signalanteils und abhängig von dem Fehlerwert und von dem Korrekturwert dieses frequenzbandbegrenzten
Signalanteils des Gesamtsignals zu bestimmen.
[0040] Gemäß einer Ausführungsform kann der Maskiersignalerzeuger 120 z.B. ausgebildet sein,
den Stellwert für diesen frequenzbandbegrenzten Signalanteil durch Bildung einer Summe
der Mikrofonsignal-Schallpegeldifferenz dieses frequenzbandbegrenzten Signalanteils
und des Fehlerwerts und des Korrekturwerts dieses frequenzbandbegrenzten Signalanteils
des Gesamtsignals zu bestimmen.
[0041] In einer Ausführungsform kann der Maskiersignalerzeuger 120 z.B. ausgebildet sein,
den Pegelwert für eine frequenzbandbegrenzte Komponente des Maskiersignals, abhängig
von dem Stellwert für diesen frequenzbandbegrenzten Signalanteil und abhängig von
einem vorangegangenen Pegelwert für diese frequenzbandbegrenzte Komponente des Maskiersignals
zu bestimmen.
[0042] Ausführungsformen stellen einen Regelungsalgorithmus bereit, der es ermöglicht, einen
Maskierschall in der Lautstärke und in seinem Frequenzspektrum dynamisch an eine Hintergrundschallbedingung
anzupassen.
[0043] Der Algorithmus kann dabei z.B. selbstständig erkennen, in welchem Maße die Hintergrundschallbedingung
einen störenden Einfluss auf die Kognitive Leistungsfähigkeit haben kann. Für diese
Beurteilung der Schallbedingung wird ein Mikrofonsignal verwendet.
[0044] Der Algorithmus funktioniert auf verschiedenen Endgeräten mit der jeweils zu Verfügung
stehenden Technik. Da nicht davon auszugehen ist, dass in allen Endgeräten geeichte,
normgerechte Mikrofone verbaut sind welche die Anforderungen an Schallpegelmesser
gemäß DIN EN 61672-1 erfüllen, kommt der Algorithmus ohne Kenntnisse über den absoluten
Schalldruckpegel aus. Der Algorithmus bestimmt dafür die 90% und 10% Perzentilwerte
als Regelparameter.
[0045] Es wird ein Maskierschall erzeugt und abgespielt, welcher kontinuierlich über eine
ausreichende Maskierwirkung verfügt, um einen möglichen, ISE bedingten kognitiven
Leistungsabfall, der durch die Hintergrundschallbedingung entstehen kann, zu verhindern.
Dabei verfügt der Algorithmus über eine geeignete Sensitivität gegenüber der Hintergrundschallbedingung,
damit spontan auftretende Störgeräusche, welche nicht repräsentativ für die Hintergrundschallbedingung
sind, nicht zur Regelung verwendet werden.
[0046] Der durch den Algorithmus erzeugte Maskierschall ist zu jeder Zeit nur so laut, wie
nötig. Nicht nur die objektive Leistungssteigerung, sondern die akustische Zufriedenheit
der Nutzer ist das zu erreichende Ziel. Maskierschalle im Allgemeinen werden eher
als unangenehm wahrgenommen im Vergleich zu Stille. Damit also eine größtmögliche
Nutzerakzeptanz geschaffen wird, erkennt der Algorithmus zu jeder Zeit, welches Mindestmaß
an Maskierschall-Pegel gerade notwendig ist, und verwendet dieses kontinuierlich als
Zielwert der Pegelsteuerung. Als Zielwert wird das Verhältnis des L
AF,10% Perzentilswerts zum L
AF,90% Perzentilwert verwendet. Der Maskierschall passt sich an das Frequenzspektrum des
Hintergrundschalls an. Die Regelungszeiten, mit welchen der Maskierschall in der Lautstärke
gesteuert wird werden vom Algorithmus so gewählt, dass die Lautstärkeschwankungen
kaum merkbar sind. Dies ist sinnvoll, damit der Maskierschall selbst nicht selbst
zu einer Ablenkung der Nutzenden führt. Gleichsam passieren Lautstärkeänderungen jedoch
schnell genug, um auf veränderte akustische Verhältnisse in der Hintergrundschallbedingung
reagieren zu können.
[0047] Zur weiteren Verbesserung der Akzeptanz mischt der Algorithmus dem Maskierschall
einen harmonischen Anteil hinzu, welcher einen angenehmen Klang des Maskierschalls
gewährleistet.
[0048] Nachfolgend wird der Algorithmus gemäß einer Ausführungsform im Detail beschrieben.
[0049] So zeigt Fig. 2 ein Signalflussdiagramm gemäß einer Ausführungsform mit einer Frequenzaufteilung
in neun Oktavbänder, die im Beispiel der Fig. 2 Mittenfrequenzen bei 63 Hz, 125 Hz,
250 Hz, 500 Hz, 1000 Hz, 2000 Hz, 4000 Hz, 800 Hz, 1600 Hz aufweisen.
[0050] Dabei veranschaulicht Fig. 2 den Teil des Algorithmus, in welchem die Frequenzaufteilung
des Mikrofon-Eingangssignals in Bänder, beispielsweise in Oktavbänder, stattfindet.
Außerdem ist in Fig. 2 zu sehen, wie die verschiedenen bandgefilterten Maskierschallanteile
zusammengemischt und mit einem Kalibrierungsfaktor W verrechnet werden, bevor das
Maskiersignal an die Kopfhörer ausgegeben wird. Die hellblau umrahmten Elemente mit
der Aufschrift "Adaptive Pegelregelung" aus Fig. 2 stehen dabei stellvertretend für
den Teil des Algorithmus, welcher in Fig. 3 im Detail veranschaulicht wird.
[0051] Dabei zeigt Fig. 3 zeigt ein Signalflussdiagramm zur adaptiven Geräuschmaskierung
gemäß einer Ausführungsform.
[0052] In diesem Teil des Algorithmus findet die Pegelwertmessung, die Perzentilwertdifferenzbestimmung
und die kontinuierliche Errechnung des Stellwertes u statt. Des Weiteren werden hier
durch eingestellte Regelzeiten die Stellwerte u geglättet, um somit den Pegelwert
p zu erhalten, welcher wiederum den jeweiligen bandgefilterten Maskierschallanteil
in seiner Lautstärke steuert. Der Teil des Algorithmus, in dem der aktuelle L
A,F,10%-90%,Ges Wert errechnet wird, ist in Fig. 3 ebenfalls entsprechend (blau) umrandet und wird
in Fig. 4 anschaulich dargestellt.
[0053] So zeigt Fig. 4 ein Signalflussdiagramm eines Regelwert-Prüfers gemäß einer Ausführungsform.
Insbesondere ist in Fig. 4 dargestellt, wie die Perzentilwerte der Pegelwerte des
gesamten Signals (Mikrofonsignal * Dämpfungsfaktor + (rückgeführter) Maskierschallanteil)
errechnet werden. Dieser Resultierende errechnete Pegelunterschied (L
AF,10%-90%,Ges) wird mit dem Zielwert verglichen um somit einen Fehlerwert (e) zu erhalten.
[0054] Fig. 5 zeigt eine Regelschleife gemäß einer Ausführungsform. Insbesondere ist in
Fig. 5 zu sehen, wie aus dem Fehlerwert e ein Korrekturwert errechnet wird.
[0055] Die Eingabe des Algorithmus ist, wie in Fig. 2 dargestellt, das digitale Audiosignal
eines Mikrofons, welches kontinuierlich den Umgebungsschall aufnimmt. Dieses Signal
wird zunächst durch Oktavfilter nach DIN EN 61260-1 in Bänder, z.B. in neun Oktavbänder
(z.B. mit Mittenfrequenzen im Bereich 63 Hz - 16 000 Hz) aufgeteilt, wobei die bandbegrenzten
Signale in den jeweiligen Signalpfaden analysiert und verarbeitet werden. Da die adaptive
Pegelregelung pro Band erfolgen soll, wird das Maskiersignal ebenfalls in einzelne
Bänder aufgeteilt. Diese bandgefilterten Maskierschalle werden einzeln in den Signalpfaden
(entsprechend dem jeweiligen Oktavband), in der Lautstärke geregelt und daraufhin
wieder zu einem Gesamt-Maskierschall zusammengemischt. Dadurch kann pro Oktavband
der aktuelle Störeinfluss berechnet werden, über welchen auf eine Regelung der Lautstärke
geschlossen wird, welche der jeweilige Frequenzbereich des Maskierschalls haben soll,
um die auftretenden Störschalle über das gesamte Frequenzspektrum hinweg ausreichend
zu verdecken.
[0056] Das geregelte Maskiersignal wird mit einem zusätzlichen harmonischen Anteil ergänzt.
Beim harmonischen Anteil handelt es sich um eine Art Musik, die die Akzeptanz und
subjektive Wahrnehmung des Maskierschalls verbessert. Der harmonische Anteil geht
in die nachfolgend beschriebe Berechnung der zu erwartenden Störwirkung der akustischen
Umgebung mit ein. Außerdem wird der harmonische Anteil, gemischt mit dem geregelten
Maskieranteil, über die Kopfhörer wiedergegeben. Der harmonische Anteil ist psychoakustisch
abgesichert, also in Hörversuchen auf seine Eignung untersucht worden (kein Zustandsänderungsverhalten,
englisch: Changing-State-Verhalten, da keine Auslösung des ISE). Der harmonische Anteil
kann z.B. eine unkomprimierte Stereo-Datei (englisch: StereoFile) sein, welches vom
Algorithmus abgespielt & geregelt wird.
[0057] Die Eingabe der adaptiven Geräuschmaskierung (Adaptive Sound Masking), siehe Fig.
3, ist das bandgefilterte, und A-bewertete Audiosignal des Mikrofons. Für Hörfrequenzen
ist die A-Bewertung eine üblicherweise eingesetzte Frequenzbewertung, die die Reaktion
des Ohrs auf Schalldruck bzw. Lautstärke darstellt. Hinsichtlich der zeitlichen Bewertung
geben die Bewertungen F (schnell; englisch: fast), S slow (langsam; englisch: slow)
und I (Impuls; englisch: impulse) an, wie schnell eine Reaktion auf eine Änderung
des Schallpegels erfolgt. LAF bezeichnet dabei einen Schallpegel mit A-Frequenzbewertung
und F-Zeitbewertung. Die Perzentilpegel L
AF,10% bzw. L
AF,90% geben an, welche Pegel in 10 % bzw. 90 % der Messzeit erreicht wurden.
[0058] Von den besagten Audiosignal wird nun der äquivalente Dauerschallpegel, gemäß DIN
EN 61672-1 ermittelt. Dazu wird zunächst ein quadratischer Mittelwert (Root Mean Square,
RMS) pro Sample ermittelt. Anschließend werden die Pegelwerte über 125 Millisekunden
integriert. Um eventuell auftretende Fehler in der weiteren Signalverarbeitung bei
unrealistisch kleinen Amplitudenwerten zu vermeiden, sind die Werte durch einen Minimalamplitudenwert
beschränkt. Die gemessenen Pegelwerte werden in einer fortlaufenden Liste gespeichert,
wobei die Listenlänge den Betrachtungszeitraum, über welchen die Perzentilwerte analysiert
werden, definiert. Durch die vorangegangene Pegelmessung wird die Liste alle 125 Millisekunden
um einen neuen Pegelwert ergänzt und ein alter Wert wird gelöscht. Es findet eine
Perzentilwertberechnung (L
AF,90%, sowie L
AF,10%) in der Liste statt. Anschließend wird der Wert des 90. Perzentils L
AF,90%, von dem des 10. Perzentils L
AF,10% subtrahiert, um den Perzentilwertunterschied der Hintergrundbedingung L
AF,10%-90%,
HSB zu bestimmen (HSB = Hintergrundschallbedingung). Da die Liste mit den LAF Werten
sich alle 125 Millisekunden aktualisiert, errechnet sich auch alle 125 Millisekunden
ein neuer L
AF,10%-90%, HSB Wert.
[0059] Aus der Differenz dieser kontinuierlich ermittelten Perzentilwerte errechnen sich
also laufend Pegelunterschiede, welche mit dem Abfall eines Leistungsverlustes in
Zusammenhang gebracht werden können, wie die zuvor beschriebene Studie von Renz et
al. (2018) zeigt. Je höher das relative Level der Aktivitäts-Transienten L
AF,10%, desto größer ist die Ablenkung (Zuydervliet et al., 2008). Um diesem ISE bedingten
Leistungsabfall entgegenzuwirken, soll das Hintergrund-Schallpegelniveau L
AF,90%, durch das Hinzufügen eines Maskierrauschens soweit angehoben werden, dass der Pegelunterschied
zu dem Aktivitäts-Schallpegelniveau L
AF,10% ausreichend reduziert wird. Die nachfolgend beschriebene Regelung stellt sicher,
dass der Unterschied dieser beiden Werte möglichst gering ist (z.B. unter 3 oder z.B.
zwischen 2 und 3. Es können auch andere Zielwerte gewählt werden). Um eine Regelung
zu implementieren, welche gewährleisten soll, dass ein L
AF,10%-90% Zielwert erreicht wird, wird das Gesamtsignal aus Maskierschall und Hintergrundschall
auf seinen L
AF,10%-90% Wert untersucht.
[0060] Fig. 3 veranschaulicht den Teil des Algorithmus, welcher im Folgenden in seiner Funktionsweise
beschrieben wird. Der Maskierschall wird über Kopfhörer wiedergegeben, was bedeutet,
dass eine Analyse der real auftretenden Perzentilwerte an der Position des Ohres des
Nutzers erfolgen sollte. Eine exakte Analyse dieser Schallbedingung wäre allerdings
nur mittels eines Mikrofons, welches sich in der Kopfhörerkapsel befindet, realisierbar.
Bei ANC Kopfhörern ist meist ein solches Mikrofon in den Kapseln verbaut, allerdings
ist das Signal des Mikrofons nicht ohne Kenntnisse über die integrierte Signalverarbeitung
der jeweiligen Kopfhörer verwendbar, falls es überhaupt gelingt, dieses Signal abzugreifen.
[0061] In manchen Ausführungsformen soll der Algorithmus universal auch mit Kopfhörern ohne
ANC verwendbar sein. Deshalb wird das Signal, welches am Ohr des Nutzers ankommt,
in derartigen Ausführungsformen geschätzt. Sofern der Zugriff auf das Mikrofon möglich
ist, kann der Wert auch direkt bestimmt werden. Die nachfolgende Regelung erfolgt
dann mit dem gemessenen Wert, statt mit dem geschätzten, ist aber abgesehen davon
identisch.
[0062] Zur Schätzung sollte bekannt sein, in welchem Maße der Hintergrundschall durch die
verwendeten Kopfhörer in seinem Pegel reduziert wird. Die ermittelten äquivalenten
Dauerschallpegel der Hintergrundschallbedingung werden in diesem Teil des Algorithmus
mit dem Dämpfungsfaktor verrechnet, um somit einen geschätzten relativen Schallpegel
der Hintergrundschallbedingung an der Position des Ohrs des Nutzers zu erlangen. Von
dem Signal des Maskierschalls (und dem harmonischen Anteil) welches nach dessen Pegelanpassung
abgegriffen wurde (siehe Fig. 4), wird nun ebenfalls eine Pegelmessung durchgeführt.
Die dadurch ermittelten Werte werden auf den mit dem Dämpfungsfaktor multiplizierten
Hintergrundschall addiert, wodurch der geschätzte relative Gesamtschallpegel L
AF,10%-90%, Ges bestimmt werden kann.
[0063] Beispielsweise kann vorgesehen sein, dass eine Person, die eine Implementierung des
adaptiven Maskiersignalerzeuger-Algorithmus in Hard- oder Software nutzt, zu Beginn
der Nutzung den Maskierungsschallerzeuger in seiner Wiedergabelautstärke für die aktuelle
Schallbedingung selbst einstellen kann. Das geschieht z.B. über einen Fader (Schieberegler)
in der grafischen Benutzeroberfläche, oder einem Potentiometer am Kopfhörer, welcher
den Kalibrierungsfaktor W steuert. Der Kalibrierungsfaktor wird unabhängig von der
Pegelregelung am Ende des Signalpfades aufgeschlagen.
[0064] Zur Berechnung der sich selbst korrigierende Stellgröße u analysiert der Algorithmus
das Eingangssignal des Mikrofons und es werden Pegelunterschiede von L
AF,10% und L
AF,90% errechnet (siehe Fig. 3). Diese Pegelunterschiede L
AF,10%-90%,HSB sollen den Maskierschall in seiner Lautstärke pro Oktavband regeln.
[0065] Allerdings ist das Verhältnis des Vorhersageparameter L
AF,10%-90% nicht linear zu einem voraussichtlichen DP-Wert (Renz, 2019). Das bedeutet, dass
durch eine einfache Lautstärkeanhebung des Maskierschalls um den ermittelten L
AF,10%-90%,HSB Wert die störenden Schallanteile der HSB nicht zwangsläufig ausreichend maskiert
sind. Um zu überprüfen, ob das Signal, welches am Ohr der Nutzer ankommt (gedämpfter
Umgebungsschall + Maskiersignal), wirklich als eine störungsfreie Schallbedingung
bewertet werden kann, wird dieses wie zuvor beschrieben analysiert, um den gesamten
Wert der Perzentilunterschiede L
AF,10%-90%,Ges zu ermitteln.
[0066] L
AF,10%-90%,Ges soll im nächsten Schritt mit einem Zielwert L
AF,10%-90%,Ziel verglichen werden. Ein geeigneter Zielwert, bei welchem ein Leistungsabfall gerade
so noch nicht signifikant eintritt liegt zwischen 2 dB und 3 dB. Für den Algorithmus
wird beispielsweise ein Zielwert L
AF,10%-90%,Ziel von 2,5 dB verwendet. Dies führt zu einem Zielwertebereich zwischen 2 dB und 3 dB,
innerhalb dessen sich L
AF,10%-90%,Ges bewegt. Der Zielwert kann jedoch auch anders gewählt werden. Bei einem Vergleich
der Perzentilwertdifferenzen beschreibt der Fehlerwert e die Differenz von L
AF,10%-90%,Ziel und L
AF,10%-90%,Ges. Die Stellgröße u, welche die Lautstärke des Maskierschalls regelt, ist definiert
als die Summe aus L
AF,10%-90%,HSB und einem Korrekturwert z (siehe Gleichung 1).

[0067] Bei konstanten L
AF,10%-90%,HSB Werten und einem positiven Fehlerwert muss der Korrekturwert z solange größer werden,
bis ein Fehlerwert von 0 erreicht ist. Sobald der Fehlerwert unter 0 sinkt, muss der
Korrekturwert wieder kontinuierlich kleiner werden. Der Korrekturwert wird dabei so
lange ansteigen und wieder absinken, bis er sich einen Wert erreicht, bei welchem
der Fehlerwert konstant 0 bleibt. Der Korrekturwert z, sollte sich jedoch umso langsamer
erhöhen beziehungsweise absenken, je näher der Fehlerwert sich 0 annähert. Da um L
AF,10%-90%,Ziel ein Toleranzbereich von +/- 0,5 dB besteht, kann z konstant steigen oder fallen,
so lange, bis die Toleranzgrenze erreicht ist. Ab einem Fehlerwert von 0,5 soll sich
z mit umso kleineren Schritten verändern, je näher sich e 0 annähert. Dadurch soll
verhindert werden, dass der Fehlerwert durch eine zu starke Korrektur über den Nullpunkt
hinaus korrigiert wird. Im Extremfall könnte das dazu führen, dass die Regelung den
Korrekturwert zwischen zwei Extremen im positiven und negativen Wertebereich endlos
hin und her pendelt. Aus diesem Grund ergibt sich der aktuelle Korrekturwert
zn aus dem letzten Korrekturwert
zn-1, addiert beziehungsweise subtrahiert mit einer Korrekturpauschale g(e). Diese Korrekturpauschale
hängt von der Größe des Fehlerwertes e ab, und ist dabei für verschiedene Bedingungen
klar definiert (siehe Gleichung 3). Dieser Teil des Algorithmus wird in Fig. 5 gezeigt.

[0068] Maskierschalle sollten generell einen maximalen Schalldruckpegel zwischen 45 dB(A)
und 48 dB(A) aufweisen. Dieses Maximum wird darin begründet, dass höhere Schallpegel
über einen längeren Zeitraum hinweg meist als äußerst störend wahrgenommen werden
(Haapakangas et al., 2011). Daher begrenzt der Algorithmus das obere sowie das untere
Limit von u. Allerdings kann das in dieser Erfindungsmeldung beschriebe Maskierungssystem
keine absoluten Schallpegel erfassen, weshalb die maximal möglichen Schallpegelwerte
über die Kalibrierung des Nutzers selbst gesteuert werden. Der Dynamikbereich des
adaptiven Maskiersignals wird auf 26 dB festgelegt, kann jedoch je nach Implementierung
geändert werden. Damit kann auch bei einer gering störenden HSB der L
AF,10%-90%,Ziel-Wert erreicht werden, wobei der Maskierschall so leise wie möglich ist.
[0069] Eine wesentliche Anforderung an den Algorithmus ist, dass die HSB zu jeder Zeit ausreichend
maskiert wird. Allerdings darf eine Lautstärkeänderung nicht dazu führen, dass der
Maskierschall selbst zu einem Störfaktor wird. Denn ein Changing-State-Charakter tritt
unter anderem dann ein, wenn eine starke Variabilität im Amplitudengang festzustellen
ist (Liebl, 2006). Und Schalle mit Changing-State-Charakter haben einen negativen
Effekt auf die kognitive Leistungsfähigkeit. Aus diesem Grund regelt die Stellgröße
u den Pegel des Maskierschalls nicht direkt. Durch das Zwischenschalten einer Zeitrampe
kann eine Glättung im Verlauf der Pegelwerte erzielt werden. Eine Zeitrampe gewährleistet
eine kontinuierliche Annäherung zwischen einem alten Stellwert
un-1 und einem neuen
un. Dabei ist die Attack-Zeit
tAttack, in welcher der Pegel von einem alten zu einem neuen Wert ansteigen soll, sowie die
Release-Zeit
tRelease, mit welcher der Pegel wieder abfällt, separat einstellbar. Die Gleichung 4 beschreibt
den aktuellen Pegelwert
pn, welcher durch den aktuellen Eingangswert
un (Stellwert) den letzten ausgegebenen Pegelwert
pn-1 und
tAttack sowie
tRelease, definiert. Die Zeitparameter
tAttack, beziehungsweise
tRelease, ergeben sich aus der Inputsamplerate und den angestrebten Attackbeziehungsweise Release-Zeiten.

[0070] Dabei muss abgewogen werden, ob es wichtiger ist, dass der Maskierschall so schnell
wie möglich eine ausreichende Lautstärke erreicht, oder ob eine möglichst unmerkliche
Lautstärkeänderung Priorität hat. Als Kompromisslösung werden 5 Sekunden vorgeschlagen.
[0071] In dem Moment, in welchem der Pegel der HSB in den Betrachtungszeitraum fällt, würde
jedoch ein hoher L
AF,10%-90%,HSB Wert entstehen, was wiederum zu einem starken Pegelanstieg des Maskiersignals führen
würde. Dieser Pegelanstieg kann durch seinen Changing-State-Charakter seinerseits
wieder eine Ablenkung darstellen, ohne dabei einen Störschall zu maskieren. Um einen
Pegelanstieg in einer solchen Situation zu verhindern, werden die ermittelten L
AF,90% Werte kontinuierlich auf starke Schwankungen untersucht. Fällt dabei ein neu eintreffender
L
AF,90% Wert im Vergleich zum letzten L
AF,90% Wert um mehr als 2 dB, wird die Attack-Zeit
tAttack der Zeitrampe für die Dauer eines Betrachtungszeitraumes (5 Sekunden) auf 90 Sekunden
gestellt. Eine Attack-Zeit in dieser Größenordnung bewirkt, dass kein merklicher Pegelanstieg
möglich ist. Nach Ablauf der fünf Sekunden wird die Attack-Zeit wieder auf ihren regulären
Wert zurückgestellt, und der Pegel kann wieder regulär geregelt werden.
[0072] Nach der Pegelanpassung wird das gesamte adaptive, harmonische Sprachmaskiersignal
(bestehend aus der maskierenden sowie harmonischen Anteil) über den Audioausgang des
Endgeräts (digital oder analog) über Kopfhörer wiedergegeben.
[0073] In Ausführungsformen wird ein Maskiersignal bereitgestellt, welches gleichsam angenehm
und wirksam ist, sowie gesichert innerhalb eines festzulegenden Zeitintervalls psychoakustisch
determinierte Zielwerte erreicht, deren Korrelation mit der kognitiven Leistungsfähigkeit
z.B. bekannt ist.
[0074] Ausführungsformen basieren darauf, dass die Regelung mittels Schätzung abhängig von
der zu erwarteten Störwirkung den Maskierer einstellt.
[0075] Beispielsweise können Ausführungsformen bei Büroflächen, insbesondere bei Büros für
mehrere Personen, zum Einsatz kommen und können insbesondere für den Einsatz mit Kopfhörern
angepasst sein. Weitere Anwendungsfelder können beispielsweise im medizinischen Einsatz
oder in der Therapie liegen, oder aber auch im Tourismus.
[0076] Obwohl manche Aspekte im Zusammenhang mit einer Vorrichtung beschrieben wurden, versteht
es sich, dass diese Aspekte auch eine Beschreibung des entsprechenden Verfahrens darstellen,
sodass ein Block oder ein Bauelement einer Vorrichtung auch als ein entsprechender
Verfahrensschritt oder als ein Merkmal eines Verfahrensschrittes zu verstehen ist.
Analog dazu stellen Aspekte, die im Zusammenhang mit einem oder als ein Verfahrensschritt
beschrieben wurden, auch eine Beschreibung eines entsprechenden Blocks oder Details
oder Merkmals einer entsprechenden Vorrichtung dar. Einige oder alle der Verfahrensschritte
können durch einen Hardware-Apparat (oder unter Verwendung eines Hardware-Apparats),
wie zum Beispiel einen Mikroprozessor, einen programmierbaren Computer oder einer
elektronischen Schaltung durchgeführt werden. Bei einigen Ausführungsbeispielen können
einige oder mehrere der wichtigsten Verfahrensschritte durch einen solchen Apparat
ausgeführt werden.
[0077] Je nach bestimmten Implementierungsanforderungen können Ausführungsbeispiele der
Erfindung in Hardware oder in Software oder zumindest teilweise in Hardware oder zumindest
teilweise in Software implementiert sein. Die Implementierung kann unter Verwendung
eines digitalen Speichermediums, beispielsweise einer Floppy-Disk, einer DVD, einer
BluRay Disc, einer CD, eines ROM, eines PROM, eines EPROM, eines EEPROM oder eines
FLASH-Speichers, einer Festplatte oder eines anderen magnetischen oder optischen Speichers
durchgeführt werden, auf dem elektronisch lesbare Steuersignale gespeichert sind,
die mit einem programmierbaren Computersystem derart zusammenwirken können oder zusammenwirken,
dass das jeweilige Verfahren durchgeführt wird. Deshalb kann das digitale Speichermedium
computerlesbar sein.
[0078] Manche Ausführungsbeispiele gemäß der Erfindung umfassen also einen Datenträger,
der elektronisch lesbare Steuersignale aufweist, die in der Lage sind, mit einem programmierbaren
Computersystem derart zusammenzuwirken, dass eines der hierin beschriebenen Verfahren
durchgeführt wird.
[0079] Allgemein können Ausführungsbeispiele der vorliegenden Erfindung als Computerprogrammprodukt
mit einem Programmcode implementiert sein, wobei der Programmcode dahin gehend wirksam
ist, eines der Verfahren durchzuführen, wenn das Computerprogrammprodukt auf einem
Computer abläuft.
[0080] Der Programmcode kann beispielsweise auch auf einem maschinenlesbaren Träger gespeichert
sein.
[0081] Andere Ausführungsbeispiele umfassen das Computerprogramm zum Durchführen eines der
hierin beschriebenen Verfahren, wobei das Computerprogramm auf einem maschinen-lesbaren
Träger gespeichert ist. Mit anderen Worten ist ein Ausführungsbeispiel des erfindungsgemäßen
Verfahrens somit ein Computerprogramm, das einen Programmcode zum Durchführen eines
der hierin beschriebenen Verfahren aufweist, wenn das Computerprogramm auf einem Computer
abläuft.
[0082] Ein weiteres Ausführungsbeispiel der erfindungsgemäßen Verfahren ist somit ein Datenträger
(oder ein digitales Speichermedium oder ein computerlesbares Medium), auf dem das
Computerprogramm zum Durchführen eines der hierin beschriebenen Verfahren aufgezeichnet
ist. Der Datenträger oder das digitale Speichermedium oder das computerlesbare Medium
sind typischerweise greifbar und/oder nicht flüchtig.
[0083] Ein weiteres Ausführungsbeispiel des erfindungsgemäßen Verfahrens ist somit ein Datenstrom
oder eine Sequenz von Signalen, der bzw. die das Computerprogramm zum Durchführen
eines der hierin beschriebenen Verfahren darstellt bzw. darstellen. Der Datenstrom
oder die Sequenz von Signalen kann bzw. können beispielsweise dahin gehend konfiguriert
sein, über eine Datenkommunikationsverbindung, beispielsweise über das Internet, transferiert
zu werden.
[0084] Ein weiteres Ausführungsbeispiel umfasst eine Verarbeitungseinrichtung, beispielsweise
einen Computer oder ein programmierbares Logikbauelement, die dahin gehend konfiguriert
oder angepasst ist, eines der hierin beschriebenen Verfahren durchzuführen.
[0085] Ein weiteres Ausführungsbeispiel umfasst einen Computer, auf dem das Computerprogramm
zum Durchführen eines der hierin beschriebenen Verfahren installiert ist.
[0086] Ein weiteres Ausführungsbeispiel gemäß der Erfindung umfasst eine Vorrichtung oder
ein System, die bzw. das ausgelegt ist, um ein Computerprogramm zur Durchführung zumindest
eines der hierin beschriebenen Verfahren zu einem Empfänger zu übertragen. Die
[0087] Übertragung kann beispielsweise elektronisch oder optisch erfolgen. Der Empfänger
kann beispielsweise ein Computer, ein Mobilgerät, ein Speichergerät oder eine ähnliche
Vorrichtung sein. Die Vorrichtung oder das System kann beispielsweise einen Datei-Server
zur Übertragung des Computerprogramms zu dem Empfänger umfassen.
[0088] Bei manchen Ausführungsbeispielen kann ein programmierbares Logikbauelement (beispielsweise
ein feldprogrammierbares Gatterarray, ein FPGA) dazu verwendet werden, manche oder
alle Funktionalitäten der hierin beschriebenen Verfahren durchzuführen. Bei manchen
Ausführungsbeispielen kann ein feldprogrammierbares Gatterarray mit einem Mikroprozessor
zusammenwirken, um eines der hierin beschriebenen Verfahren durchzuführen. Allgemein
werden die Verfahren bei einigen Ausführungsbeispielen seitens einer beliebigen Hardwarevorrichtung
durchgeführt. Diese kann eine universell einsetzbare Hardware wie ein Computerprozessor
(CPU) sein oder für das Verfahren spezifische Hardware, wie beispielsweise ein ASIC.
[0089] Die oben beschriebenen Ausführungsbeispiele stellen lediglich eine Veranschaulichung
der Prinzipien der vorliegenden Erfindung dar. Es versteht sich, dass Modifikationen
und Variationen der hierin beschriebenen Anordnungen und Einzelheiten anderen Fachleuten
einleuchten werden. Deshalb ist beabsichtigt, dass die Erfindung lediglich durch den
Schutzumfang der nachstehenden Patentansprüche und nicht durch die spezifischen Einzelheiten,
die anhand der Beschreibung und der Erläuterung der Ausführungsbeispiele hierin präsentiert
wurden, beschränkt sei.
Literatur
[0090]
Bodin Danielsson, C. & Bodin, L. (2009). Difference in satisfaction with office environment
among employees in different office types. Journal of Architectural and Planning Research,
26 (3), 241-257.
Zuydervliet, R., Chanaud, R. & L'Esperance, A. (2008). Adaptive sound masking. The
Journal of the Acoustical Society of America, 123 (5), 3195. https://doi.org/10.1121/1.2933335
Keus Van De Poll, Marijke, Carlsson, J., Marsh, J. E., Ljung, R., Odelius, J., Schlittmeier,
S. J. et al. (2015). Unmasking the effects of masking on performance. The potential
of multiple-voice masking in the office environment. The Journal of the Acoustical
Society of America, 138 (2), 807-816. https://doi.org/10.1121/1.4926904
Huang, Y.-H., Robertson, M. M. & Chang, K.-I. (2004). The Role of Environmental Control
on Environmental Satisfaction, Communication, and Psychological Stress. Effects of
Office Ergonomics Training. ENVIRON BEHAV (Environment and behavior), 36 (5), 617-637.
https://doi.org/10.1177/0013916503262543
Lee, S. Y. & Brand, J. L. (2010). Can personal control over the physical environment
ease distractions in Office workplaces? Ergonomics, 53 (3), 324-335. https://doi.org/10.1080/00140130903389019
Schlittmeier, S. J. & Hellbrück, J. (2009). Background music as noise abatement in
open-plan offices. A laboratory study on performance effects and subjective preferences.
APPL COGNITIVE PSYCH (Applied cognitive psychology), 23 (5), 684-697. https://doi.org/10.1002/acp.1498
Hongistob, V., Varjo, J., Oliva, D., Haapakangas, A. & Benway, E. (2017). Perception
of water-based masking sounds-long-term experiment in an open-plan office. FRONT PSYCHOL
(Frontiers in psychology), 8. https://doi.org/10.3389/fpsyg.2017.01177
Veitch, J., Bradley, J., Legault, L., Norcross, S. & Svec, J. (2002). Masking speech
in open-plan offices with simulation Ventilation noise. Noise level and spectral composition
effects on acoustic satisfaction. Institute for Research in Construction.
Wang, Y., Drotleff, H. A. & Li, P. (2012). Multiple maskers for speech masking in
open-plan offices. The Journal of the Acoustical Society of America, 131 (4), 3481.
https://doi.org/10.1121/1.4709135
Haapakangas, A., Kankkunen, E., Hongisto, V., Virjonen, P., Oliva, D. & Keskinen,
E. (2011). Effects of five speech masking sounds on performance and acoustic satisfaction.
implications for open-plan offices. ACTA ACUST UNITED AC (Acta acustica united with
Acustica), 97 (4), 641-655. https://doi.org/10.3813/AAA.918444
Chanaud, R. C. (2007). Progress in Sound Masking. Acoustics today, 3 (4), 21-26. https://doi.org/10.1121/1.2961158
L'Esperance, A., Boudreau, A., Gariepy, F., Boudreault, L.-A. & Mackenzie, R. (2017).
Adaptive Volume Control for Sound Masking Systems. How It Works and Analysis of Performance.
INTER-NOISE and NOISE-CON Congress and Conference Proceedings, 254 (2), 678-686. Verfügbar
unter: https://www.ingentaconnect.eom/content/ince/incecp/2017/00000254/00000002/art00083
Cohen, S. (1980). Aftereffects of stress on human performance and social behavior.
A review of research and theory. Psychological bulletin, 88 (1), 82-108. https://doi.org/10.1037/0033-2909.88.1.82
Quick, T. L. (1990). Healthy Work. Stress, Productivity, and the Reconstruction of
Working Life. National Productivity Review, 9, 475+. Verfügbar unter: https://link.gale.com/apps/doc/A8933314/AONE?u=anon~d59bbb41&sid=googleScholar&
xid=389d3050
Renz, T. (2019). Personalised sound masking in open offices. A trade-off between annoyance
and restoration of working memory performance? Stuttgart: Fraunhofer Verl, Stuttgart.
Renz, T., Leistner, P. & Liebl, A. (Hrsg.). (2018). A simple model to predict the
cognitive performance in distracting background speech.
US 2003/103632 A1, Adaptive sound masking system and method, veröffentlicht 2003.
CN 110362789 A, veröffentlicht 2019.
US 2015/194144 A1 Directional Sound Masking, veröffentlicht 2015.
1. Vorrichtung zur Sprachmaskierschallerzeugung, wobei die Vorrichtung umfasst:
ein Analysator (110) zur Analyse von jedem frequenzbandbegrenzten Signalanteil einer
Mehrzahl von frequenzbandbegrenzten Signalanteilen eines Mikrofonsignals während eines
analysierten Zeitraums, um Information über den frequenzbandbegrenzten Signalanteil
zu erhalten, und
ein Maskiersignalerzeuger (120) zur Erzeugung eines Maskiersignals abhängig von der
Information über den frequenzbandbegrenzten Signalanteil jedes der Mehrzahl von frequenzbandbegrenzten
Signalanteilen,
wobei die Information über den frequenzbandbegrenzten Signalanteil von einem ersten
Schallpegel abhängt, der mindestens während einer ersten Zeitdauer während des analysierten
Zeitraums erreicht wurde, und wobei die Information über den frequenzbandbegrenzten
Signalanteil von einem zweiten Schallpegel abhängt, der mindestens während einer zweiten
Zeitdauer während des analysierten Zeitraums erreicht wurde, wobei die zweite Zeitdauer
von der ersten Zeitdauer unterschiedlich ist.
2. Vorrichtung nach Anspruch 1,
wobei der Analysator (110) ausgebildet ist, eine Mikrofonsignal-Schallpegeldifferenz
zwischen dem ersten Schallpegel und dem zweiten Schallpegel für jeden Signalanteil
der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Mikrofonsignals zu bestimmen,
und
wobei der Maskiersignalerzeuger (120) ausgebildet ist, das Maskiersignal abhängig
von der Mikrofonsignal-Schallpegeldifferenz jedes frequenzbandbegrenzten Signalanteils
der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Mikrofonsignals zu bestimmen.
3. Vorrichtung nach Anspruch 2,
wobei der Maskiersignalerzeuger (120) ausgebildet ist, das Maskiersignal zu bestimmen,
indem für jeden Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen,
abhängig von der Mikrofonsignal-Schallpegeldifferenz dieses Signalanteils, einen Pegelwert
für eine frequenzbandbegrenzte Komponente des Maskiersignals, die einem Frequenzbereich
dieses Signalanteils entspricht, zu bestimmen, und eine Pegelanpassung dieser frequenzbandbegrenzten
Komponente des Maskiersignals mittels dieses Pegelwerts vorzunehmen.
4. Vorrichtung nach Anspruch 2 oder 3,
wobei der Analysator (110) ausgebildet ist, ein Gesamtsignal zu bestimmen, das von
dem Mikrofonsignal abhängt, aber von dem Mikrofonsignal unterschiedlich ist,
wobei der Analysator (110) ausgebildet ist, für jeden frequenzbandbegrenzten Signalanteil
der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals einen Fehlerwert
zu bestimmen, der eine Differenz zwischen einem Zielwert für eine Gesamtsignal-Schallpegeldifferenz
und einer aktuellen Gesamtsignal-Schallpegeldifferenz des Gesamtsignals angibt,
wobei der Maskiersignalerzeuger (120) ausgebildet ist, das Maskiersignal abhängig
von dem Fehlerwert für jeden frequenzbandbegrenzten Signalanteil der Mehrzahl von
frequenzbandbegrenzten Signalanteilen des Gesamtsignals zu bestimmen,
wobei der Analysator (110) ausgebildet ist, die aktuelle Gesamtsignal-Schallpegeldifferenz
zwischen einem dritten Schallpegel und einem vierten Schallpegel für jeden frequenzbandbegrenzten
Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals
zu bestimmen, wobei der dritte Schallpegel ein Schallpegel ist, der mindestens während
einer dritten Zeitdauer während eines analysierten Zeitraums in dem frequenzbandbegrenzten
Signalanteil des Gesamtsignals erreicht wurde, und wobei der vierte Schallpegel ein
Schallpegel ist, der mindestens während einer vierten Zeitdauer während des analysierten
Zeitraums in dem frequenzbandbegrenzten Signalanteil des Gesamtsignals erreicht wurde
erreicht wurde.
5. Vorrichtung nach Anspruch 4,
wobei der Analysator (110) ausgebildet ist, jeden frequenzbandbegrenzten Signalanteil
der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals abhängig
von einem rückgekoppelten zeitlichen Abschnitt des Maskiersignals zu diesem frequenzbandbegrenzten
Signalanteil zu bestimmen.
6. Vorrichtung nach Anspruch 4 oder 5,
wobei der Analysator (110) ausgebildet ist, jeden der Mehrzahl von frequenzbandbegrenzten
Signalanteilen des Gesamtsignals abhängig von einem Dämpfungsfaktor für diesen frequenzbandbegrenzten
Signalanteil des Gesamtsignals zu bestimmen, wobei der Analysator (110) ausgebildet
ist, den Dämpfungsfaktor für diesen frequenzbandbegrenzten Signalanteil auf dem entsprechenden
frequenzbandbegrenzten Signalanteil des Mikrofons anzuwenden, um ein gedämpftes Mikrofonsignal
zu diesem frequenzbandbegrenzten Signalanteil zu erhalten.
7. Vorrichtung nach Anspruch 5 und Anspruch 6,
wobei der Analysator (110) ausgebildet ist, jeden frequenzbandbegrenzten Signalanteil
der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals als Summe
des rückgekoppelten zeitlichen Abschnitt des Maskiersignals zu diesem frequenzbandbegrenzten
Signalanteil und des gedämpftes Mikrofonsignals zu diesem frequenzbandbegrenzten Signalanteil
zu bestimmen.
8. Vorrichtung nach einem der Ansprüche 4 bis 7,
wobei der Maskiersignalerzeuger (120) ausgebildet ist, das Maskiersignal abhängig
von einem Korrekturwert für jeden frequenzbandbegrenzten Signalanteil der Mehrzahl
von frequenzbandbegrenzten Signalanteilen des Gesamtsignals zu bestimmen, wobei der
Maskiersignalerzeuger (120) ausgebildet ist, den Korrekturwert für diesen frequenzbandbegrenzten
Signalanteil abhängig vom dem Fehlerwert für diesen frequenzbandbegrenzten Signalanteil
zu bestimmen.
9. Vorrichtung nach Anspruch 8,
wobei der Maskiersignalerzeuger (120) des Weiteren ausgebildet ist, den Korrekturwert
für diesen frequenzbandbegrenzten Signalanteil abhängig von einem zeitlichen Vorgängerwert
dieses Korrekturwerts zu bestimmen.
10. Vorrichtung nach Anspruch 9,
wobei der Maskiersignalerzeuger (120) ausgebildet ist, den Korrekturwert abhängig
von

zu bestimmen,
wobei zn der Korrekturwert zu einem Zeitpunkt n ist,
wobei zn-1 der zeitliche Vorgängerwert dieses Korrekturwerts zu einem Zeitpunkt n-1 ist,
wobei e der Fehlerwert ist,
wobei sgn eine Signumfunktion bezeichnet, und
wobei g(e) eine von dem Fehlerwert e abhängige Funktion bezeichnet.
11. Vorrichtung nach einem der vorherigen Ansprüche, wobei die Vorrichtung eine Vorrichtung
nach Anspruch 2 und nach Anspruch 4 und nach Anspruch 9 ist,
wobei der Maskiersignalerzeuger (120) ausgebildet ist, das Maskiersignal abhängig
von einem Stellwert für jeden frequenzbandbegrenzten Signalanteil der Mehrzahl von
frequenzbandbegrenzten Signalanteilen des Mikrofonsignals zu bestimmen, wobei der
Maskiersignalerzeuger (120) ausgebildet ist, den Stellwert für diesen frequenzbandbegrenzten
Signalanteil abhängig von der Mikrofonsignal-Schallpegeldifferenz dieses frequenzbandbegrenzten
Signalanteils und abhängig von dem Fehlerwert und von dem Korrekturwert dieses frequenzbandbegrenzten
Signalanteils des Gesamtsignals zu bestimmen.
12. Vorrichtung nach Anspruch 11,
wobei der Maskiersignalerzeuger (120) ausgebildet ist, den Stellwert für diesen frequenzbandbegrenzten
Signalanteil durch Bildung einer Summe der Mikrofonsignal-Schallpegeldifferenz dieses
frequenzbandbegrenzten Signalanteils und des Fehlerwerts und des Korrekturwerts dieses
frequenzbandbegrenzten Signalanteils des Gesamtsignals zu bestimmen.
13. Vorrichtung nach Anspruch 11 oder 12, wobei die Vorrichtung eine Vorrichtung nach
Anspruch 3 ist,
wobei der Maskiersignalerzeuger (120) ausgebildet ist, den Pegelwert für eine frequenzbandbegrenzte
Komponente des Maskiersignals, abhängig von dem Stellwert für diesen frequenzbandbegrenzten
Signalanteil und abhängig von einem vorangegangenen Pegelwert für diese frequenzbandbegrenzte
Komponente des Maskiersignals zu bestimmen.
14. Verfahren zur Sprachmaskierschallerzeugung, wobei das Verfahren umfasst:
Analysieren von jedem frequenzbandbegrenzten Signalanteil einer Mehrzahl von frequenzbandbegrenzten
Signalanteilen eines Mikrofonsignals während eines analysierten Zeitraums, um Information
über den frequenzbandbegrenzten Signalanteil zu erhalten, und
Erzeugen eines Maskiersignals abhängig von der Information über den frequenzbandbegrenzten
Signalanteil jedes der Mehrzahl von frequenzbandbegrenzten Signalanteilen,
wobei die Information über den frequenzbandbegrenzten Signalanteil von einem ersten
Schallpegel abhängt, der mindestens während einer ersten Zeitdauer während des analysierten
Zeitraums erreicht wurde, und wobei die Information über den frequenzbandbegrenzten
Signalanteil von einem zweiten Schallpegel abhängt, der mindestens während einer zweiten
Zeitdauer während des analysierten Zeitraums erreicht wurde, wobei die zweite Zeitdauer
von der ersten Zeitdauer unterschiedlich ist.
15. Computerprogramm mit einem Programmcode zur Durchführung des Verfahrens nach Anspruch
14.