[0001] Die vorliegende Erfindung bezieht sich auf moderne Audiotechnologien und insbesondere
auf die Erzeugung und Bearbeitung von räumlichen Toneindrücken für Tonwiedergabesysteme.
[0002] In modernen Tonwiedergabesystemen kann durch den Einsatz von mehreren Lautsprechern
erreicht werden, dass einzelne Tonquellen im Raum präzise geortet werden können und
dass innerhalb der Wiedergabeumgebung der Eindruck erzeugt wird, man befände sich
innerhalb eines simulierten Raumes, wie z. B. einem Stadium oder einer Kathedrale.
Dabei kann man prinzipiell zwei unterschiedliche Wiedergabekonzepte unterscheiden.
Bei der herkömmlichen auch im Homeentertainmentbereich üblichen Surroundwiedergabe
wird die Ortungs- und Rauminformation bereits während des Tonmischvorgangs in einzelne,
diskret zu übertragende Kanäle gemischt, wobei ein Wiedergabesystem aus mehreren Lautsprechern
dazu verwendet wird, die einzelnen Kanäle wiederzugeben. Dabei sollten sich die wiedergebenden
Lautsprecher an einer vorgegebenen Position relativ zur Wiedergabeumgebung befinden,
um einen bestmöglichen Raumeindruck zu erzielen.
[0003] Fortgeschrittenere Systeme, wie die auf Wellenfeldsynthese basierenden Raumsimulationen,
erzeugen die Ansteuersignale für die einzelnen Lautsprecher erst während der Wiedergabe,
basierend auf einer Positionsinformation einer Tonquelle bezüglich des Wiedergaberaums
und der Rauminformation einer zu simulierenden Wiedergabeumgebung. Dadurch lassen
sich bezüglich der Ortung und des räumlichen Eindrucks wesentlich authentischere Ergebnisse
erzielen, da hier während der Wiedergabe das individuelle Lautsprechersetup berücksichtigt
werden kann, um in der Wiedergabeumgebung eine Wellenfront zu erzeugen, die den zu
simulierenden Raumeindruck bestmöglich repräsentiert.
[0004] Nachfolgend wird zum besseren Verständnis der vorliegenden Erfindung auf die Wellenfeldsynthese-Technik
näher eingegangen.
[0006] Infolge der enormen Anforderungen dieser Methode an Rechnerleistung und Übertragungsraten
wurde die Wellenfeldsynthese bis jetzt nur selten in der Praxis angewendet. Erst die
Fortschritte in den Bereichen der Mikroprozessortechnik und der Audiocodierung gestatten
heute den Einsatz dieser Technologie in konkreten Anwendungen.
[0007] Die Grundidee von WFS basiert auf der Anwendung des Huygens' schen Prinzips der Wellentheorie:
[0008] Jeder Punkt, der von einer Welle erfasst wird, ist Ausgangspunkt einer Elementarwelle,
die sich kugelförmig bzw. kreisförmig ausbreitet.
[0009] Angewandt auf die Akustik kann durch eine große Anzahl von Lautsprechern, die nebeneinander
angeordnet sind (einem so genannten Lautsprecherarray), jede beliebige Form einer
einlaufenden Wellenfront nachgebildet werden. Im einfachsten Fall, einer einzelnen
wiederzugebenden Punktquelle und einer linearen Anordnung der Lautsprecher, müssen
die Audiosignale eines jeden Lautsprechers mit einer Zeitverzögerung und Amplitudenskalierung
so gespeist werden, dass sich die abgestrahlten Klangfelder der einzelnen Lautsprecher
richtig überlagern. Bei mehreren Schallquellen wird für jede Quelle der Beitrag zu
jedem Lautsprecher getrennt berechnet und die resultierenden Signale addiert. Befinden
sich die wiederzugebenden Quellen in einem virtuellen Raum mit reflektierenden Wänden,
dann müssen auch Reflexionen als zusätzliche Quellen über das Lautsprecherarray wiedergegeben
werden. Der Aufwand bei der Berechnung hängt daher stark von der Anzahl der Schallquellen,
den Reflexionseigenschaften des Raums und der Anzahl der Lautsprecher ab.
[0010] Der Vorteil dieser Technik liegt im Besonderen darin, dass ein natürlicher räumlicher
Klangeindruck über einen großen Bereich des Wiedergaberaums möglich ist. Im Gegensatz
zu den bekannten Techniken werden Richtung und Entfernung von Schallquellen sehr exakt
wiedergegeben. In beschränktem Maße können virtuelle Schallquellen sogar zwischen
dem realen Lautsprecherarray und dem Hörer positioniert werden.
[0011] Die Wellenfeldsynthese ermöglicht somit eine korrekte Abbildung von virtuellen Schallquellen
über einen großen Wiedergabebereich. Gleichzeitig bietet sie dem Tonmeister und Toningenieur
neues technisches und kreatives Potential bei der Erstellung auch komplexer Klanglandschaften.
Die Wellenfeldsynthese (WFS oder auch Schallfeldsynthese), wie sie Ende der 80-er
Jahre an der TU Delft entwickelt wurde, stellt einen holographischen Ansatz der Schallwiedergabe
dar. Als Grundlage hierfür dient das Kirchhoff-Helmholtz-Integral. Dieses besagt,
dass beliebige Schallfelder innerhalb eines geschlossenen Volumens mittels einer Verteilung
von Monopol- und Dipolschallquellen (Lautsprecherarrays) auf der Oberfläche dieses
Volumens erzeugt werden können. Details hierzu finden sich in
M.M. Boone, E.N.G. Verheijen, P.F. v. Tol, "Spatial Sound-Field Reproduction by Wave-Field
Synthesis", Delft University of Technology Laboratory of Seismics and Acoustics, Journal
of J. Audio Eng. Soc., Bd. 43, Nr. 12, Dezember 1995 und
Diemer de Vries, "Sound Reinforcement by Wavefield Synthesis: Adaption of the Synthesis
Operator to the Loudspeaker Directivity Characteristics", Delft University of Technology
Laboratory of Seismics and Acoustics, Journal of J. Audio Eng. Soc., Bd. 44, Nr. 12,
Dezember 1996.
[0012] Bei der Wellenfeldsynthese wird aus einem Audiosignal, das eine virtuelle Quelle
an einer virtuellen Position aussendet, eine Synthesesignal für jeden Lautsprecher
des Lautsprecherarrays berechnet, wobei die Synthesesignale derart hinsichtlich Amplitude
und Phase gestaltet sind, dass eine Welle, die sich aus der Überlagerung der einzelnen
durch die im Lautsprecherarray vorhandenen Lautsprecher ausgegebenen Schallwelle ergibt,
der Welle entspricht, die von der virtuellen Quelle an der virtuellen Position herrühren
würde, wenn diese virtuelle Quelle an der virtuellen Position eine reale Quelle mit
einer realen Position wäre.
[0013] Typischerweise sind mehrere virtuelle Quellen an verschiedenen virtuellen Positionen
vorhanden. Die Berechnung der Synthesesignale wird für jede virtuelle Quelle an jeder
virtuellen Position durchgeführt, so dass typischerweise eine virtuelle Quelle in
Synthesesignalen für mehrere Lautsprecher resultiert. Von einem Lautsprecher aus betrachtet
empfängt dieser Lautsprecher somit mehrere Synthesesignale, die auf verschiedene virtuelle
Quellen zurückgehen. Eine Überlagerung dieser Quellen, die aufgrund des linearen Superpositionsprinzips
möglich ist, ergibt dann das von dem Lautsprecher tatsächlich ausgesendete Wiedergabesignal.
[0014] Die Möglichkeiten der Wellenfeldsynthese können um so besser ausgeschöpft werden,
je geschlossener die Lautsprecherarrays sind, d. h. um so mehr einzelne Lautsprecher
möglichst nah beieinander angeordnet werden können. Damit steigt jedoch auch die Rechenleistung,
die eine Wellenfeldsyntheseeinheit vollbringen muss, da typischerweise auch Kanalinformationen
berücksichtigt werden müssen. Dies bedeutet im einzelnen, dass von jeder virtuellen
Quelle zu jedem Lautsprecher prinzipiell ein eigener Übertragungskanal vorhanden ist,
und dass prinzipiell der Fall vorhanden sein kann, dass jede virtuelle Quelle zu einem
Synthesesignal für jeden Lautsprecher führt, bzw. dass jeder Lautsprecher eine Anzahl
von Synthesesignalen erhält, die gleich der Anzahl von virtuellen Quellen ist.
[0015] Darüber hinaus sei an dieser Stelle angemerkt, dass die Qualität der Audiowiedergabe
mit der Anzahl der zur Verfügung gestellten Lautsprecher steigt. Dies bedeutet, dass
die Audiowiedergabequalität um so besser und realistischer wird, um so mehr Lautsprecher
in dem bzw. den Lautsprecherarrays vorhanden sind.
[0016] Räumliche Tonwiedergabesysteme wie die Wellenfeldsynthese ermöglichen es also, den
Ton in 360 Grad um den Zuhörerraum mit optimaler räumlicher Auflösung zu generieren.
Bisher wurden diese Systeme im Wesentlichen zum Positionieren von diskreten Schallquellen
und zur Direktschallwiedergabe verwendet. Auf die Signale der so generierten Schallquellen
lassen sich zusätzlich alle bekannten linearen Signalverarbeitungen anwenden, wie
z. B das Hinzufügen von Nachhall. In räumlichen Tonwiedergabesystemen wie der Wellenfeldsynthese
(WFS) ist es weiterhin möglich, räumliche Effekte basierend auf dem Direktschall zu
generieren. Dies geschieht beispielsweise bei der Raumsimulation, bei der aus Gründen
der Effizienz die Wiedergabe auf eine begrenzte Anzahl von Raumrichtungen (ebene Wellen)
vereinfacht werden kann.
[0017] In einem sehr einfachen Fall der Raumsimulation werden gleiche Parameter zur Beschreibung
des Raumes für alle Raumrichtungen verwendet (diffuser Nachhall) und richtungsabhängige
Raumanteile (frühe Reflexionen) automatisiert generiert. Ein Erzeugen räumlicher Effekte
ist nicht nur dann sinnvoll, wenn es um die Nachbildung natürlicher Raumeffekte geht,
da die prinzipiellen Möglichkeiten dieser Art der Signalverarbeitung auch anderweitig
kreativ genutzt werden können.
[0018] Bei der Wellenfeldsynthese wird ein zu beschallender Raum von möglichst vielen individuellen
Lautsprechern beschallt, um die Rekonstruktion von Wellenfronten mit bestmöglicher
Genauigkeit zu erlauben. Für die Ortbarkeit von Tonsignalen und die Erzeugung eines
Raumeindrucks werden üblicherweise eine Vielzahl von Parametern herangezogen, die
für jeden Lautsprecher während des Abmischens des Tonsignals individuell zu bestimmen
sind.
[0019] Wie im Vorhergehenden beschrieben wurde, zeichnen sich die mehrkanaligen Tonwiedergabesysteme
durch außerordentlich hohe Komplexität aus, so dass das zusätzliche Erzeugen einer
Rauminformation bzw. der Ortungsinformation während des Abmischens des Tons bedingt,
eine Vielzahl von Parametern zu erzeugen, die lautsprecherindividuell die Ortungsinformation
bzw. zusätzliche lineare Signalverarbeitungsschritte (zum Erzeugen von akustischen
Effekten) beschreiben. Diese Beschreibung anhand einer Vielzahl abstrakter mathematischer
Parameter ohne unmittelbar intuitiv erfassbare Bedeutung ist insbesondere bei Wellenfeldsynthesesystemen
schwer beherrschbar.
[0020] Beispielsweise bietet die Wellenfeldsynthese die Möglichkeit, Schallquellen auf einer
zweidimensionalen Hörebene frei zu positionieren. Dies geschieht durch die Synthetisierung
unterschiedlicher Wellenfronten abhängig von der Position der Schallquellen. Benutzeroberflächen,
wie sie derzeit verwendet werden, verwenden zur Positionierung der Schallquelle einen
Punkt in einer Aufsicht der zweidimensionalen Hörebene, wobei der Punkt die Position
der Schallquelle repräsentiert. Da bei diesem Ansatz die räumliche Position der Schallquelle
zwar hinreichend visualisiert wird, der klangliche Tiefeneindruck (Raumeindruck) jedoch
prinzipiell in der Visualisierung nicht simultan darstellbar ist, kommt es zu Diskrepanzen
zwischen der realen Wahrnehmung und der Darstellung, so dass nur in wenigen Ausnahmefällen
ein visuelles Bild zur Verfügung gestellt wird, welches dem realen Klangeindruck entspricht
oder einen Rückschluss auf diesen zulässt.
[0021] Für das Audio-Authoring System Nuendo der Firma Steinberg existiert ein Plug-in,
bei dem zeitliche Echoverläufe für ein Signal graphisch dargestellt werden, wenn Echoparameter
des Echoverlaufs als Zahlenwerte eingegeben werden. Der E-choverlauf kann dabei teilweise
für drei unterschiedliche Frequenzbereiche individuell beeinflusst werden.
[0022] Die internationale Patentanmeldung
WO 2004/047485 A1 beschreibt ein Audiowiedergabesystem, das auf der Wellenfeldsynthese basiert und
befasst sich dabei insbesondere mit einer möglichen Modularisierung des Wellenfeldsynthesesystems,
um dieses sukzessive an sich verändernde Wiedergabeumgebungen anpassen zu können.
[0024] Die Aufgabe der vorliegenden Erfindung besteht darin, eine graphische Benutzerschnittstelle
zu schaffen, die es erlaubt, ein Tonwiedergabesystem zur Erzeugung eines räumlichen
Toneindrucks effizienter zu steuern.
[0025] Diese Aufgabe wird durch eine Vorrichtung gemäß Anspruch 1 oder 20 sowie durch ein
Verfahren gemäß Anspruch 25 oder 26 gelöst.
[0026] Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, dass ein Tonwiedergabesystem,
das in einer Wiedergabeumgebung einen räumlichen Toneindruck erzeugen kann, effizient
und intuitiv mittels einer graphischen Benutzerschnittstelle gesteuert werden kann,
wenn eine einer Raumrichtung bezüglich der Wiedergabeumgebung zugeordnete Impulsantwort
bzw. eine aus der Impulsantwort gewonnene graphische Repräsentation graphisch dargestellt
wird, und wenn die Möglichkeit geschaffen wird, dass ein Benutzer diese Darstellung
graphisch verändern kann, so dass basierend auf der Benutzeränderungseingabe die geänderte
Impulsantwort graphisch dargestellt sowie die geänderte graphische Darstellung erfasst
werden kann, um das Tonwiedergabesystem anzusteuern.Da es systemtheoretisch möglich
ist, alle bekannten linearen Signalverarbeitungen durch Impulsantworten zu beschreiben,
ist es mit der erfindungsgemäßen graphischen Benutzerschnittstelle möglich, einem
Tongestalter über eine graphische Repräsentierung einen intuitiven Zugriff auf richtungsabhängige
Klangeffekte zu geben, um somit die Effizienz und die Qualität bei der Steuerung des
Tonwiedergabesystems zu erhöhen.
[0027] Durch Faltung eines ursprünglichen Signals mit Impulsantworten lassen sich alle linearen
Signalverarbeitungsalgorithmen darstellen. Als Beispiel können so bei einer auf Wellenfeldsynthese
basierenden Raumsimulation die Signale für ebene Wellen durch Faltung mit entsprechenden
Raumimpulsantworten, die korrespondierenden Raumrichtungen zugeordnet sind, erzeugt
werden. Damit können auch Räume nachgebildet werden, wobei die verwendeten Impulsantworten
erfindungsgemäß neben einer Beschreibung durch die ihnen zugrundeliegenden Parameter
auch direkt visualisiert werden. Das erfindungsgemäße neue Werkzeug zur Tongestaltung
besteht aus eine simultanen Visualisierung aller richtungsabhängigen Impulsantworten
korrespondierend zu einer Quelle. Die Klanggestaltung findet durch direkte Interaktion
mit dieser Visualisierung statt. Die Bearbeitung der visuellen Darstellung wird in
eine parametrische Beschreibung umgerechnet und aus dieser werden die zugehörigen
Impulsantworten generiert.
[0028] Die Richtungsinformation bzw. eine Räumlichkeit wird einem Tonsignal also durch eine
mathematische Faltung mit einer Impulsantwort eingeprägt, was zum besseren Verständnis
des Erfindungsgedankens im Folgenden kurz erläutert wird.
[0029] Einem Tonsignal f(y) wird ein Raumeindruck oder Reflexionsmuster bzw. eine Ortungsinformation
durch Faltung mit einer Impulsantwort g(x) eingeprägt, so dass sich das kombinierte
Tonsignal F(x) gemäß folgendem Faltungsintegral ergibt:
[0030] Die Impulsantwort g(x) beschreibt allgemein die Antwort eines Systems auf einen Diracimpuls
δ(
x), also einen Impuls infinitesimaler Länge für den gilt:
[0031] Das heißt also, ein idealer Diracimpuls zeichnet sich durch eine infinitesimale Länge
aus und zusätzlich dadurch, dass sein Integral, wie oben beschrieben, endlich ist.
Im Falle eines Tonsignals bedeutet dies, dass ein Diracpuls beliebig klein ist, jedoch
feste akustische Energie trägt.
[0032] Testet man einen Raum mit einem Diracpuls, so erhält man als einfachste Impulsantwort
wiederum einen Diracpuls, der mit einer Laufzeitverzögerung t zum Aussenden des Testpulses
am Ort des Aussendens des Testpulses registriert wird. Dies ist genau dann der Fall,
wenn in der Richtung, in die der Testpuls emittiert wurde, ein idealer Reflektor befindlich
ist, der das akustische Testsignal ohne Dämpfung reflektiert, wobei die Laufzeit zwischen
dem Ort des Aussendens der Quelle und dem Reflektor dann genau t/2 beträgt.
[0033] Es sei hier bemerkt, dass es in der Realität unmöglich ist, einen idealen Diracpuls
zu erzeugen, stattdessen werden von jetzt an auch Pulse, deren Breite endlich ist
und deren Intensität A beträgt, als Diracpulse bezeichnet.
[0034] Anschaulich kann man sich solche realen Impulse beispielsweise aus gaussförmige Kurven
geringer Breite mit Flächeninhalt A vorstellen.
[0035] Würde der oben beschriebene Reflektor einen Teil der akustischen Energie absorbieren,
das Testsignal also dämpfen, so würde der nach Laufzeit t empfangene, reflektierte
Diracpuls eine geringere Fläche B unter der Kurve aufweisen als der ursprüngliche
Puls (B < A).
[0036] Neben den bislang beschriebenen, idealisierten einfachen Fällen einer Impulsantwort
ist es ferner möglich, beliebig komplexe Impulsantworten zu erhalten. Befinden sich
beispielsweise zwei Reflektoren in voneinander unterschiedlichen Entfernungen, die
den akustischen Laufzeiten t
1 und t
2 entsprechen, zum Ort des Aussendens des Testsignals, so wird die Impulsantwort aus
zwei zu den Zeitpunkten 2*t
1 und 2*t
2 empfangenen Diracpulsen bestehen. Normalerweise sind akustische Szenen sehr komplex,
so dass eine reale Impulsantwort eine mit der Zeit dichter werdende Pulsfolge sein
wird, die mit frühen Reflexionen beginnt, und deren zeitlich später eintreffenden
Komponenten beispielsweise einen Nachhall beschreiben.
[0037] Wie oben erläutert beschreibt eine Impulsantwort in Form eines Diracpulses ein Delay
bzw. ein Echo. Ebenso lässt sich beispielsweise ein Mehrfachecho durch eine Summe
von diracförmigen Pulsen darstellen. Zur realistischen Raumsimulation wird im Allgemeinen
die Impulsantwort, die mit dem Tonsignal gefaltet wird, kontinuierlich sein, z. B.
ein zum Zeitpunkt t
0 stark ansteigendes und dann sanft ausklingendes Signal, das eine Mehrfachreflexion
beschreibt, wobei die zu späteren Zeitpunkten reflektierten Signale stärker gedämpft
sind.
[0038] In realen Szenarien werden Tonsignale zusätzlich frequenzselektiv gedämpft, beispielsweise
werden hohe Tonsignale von Teppichen und Wandbehängen stärker gedämpft als tiefe Tonsignale.
Um diesem Sachverhalt gerecht zu werden, können beispielsweise für mehrere Frequenzbereiche
getrennt unterschiedliche Impulsantworten verwendet und visualisiert werden oder muss
die Visualisierung der Impulsantwort den Zeit- und Frequenzbereich umfassen.
[0039] In einem weiteren Ausführungsbeispiel der vorliegenden Erfindung wird die graphische
Benutzerschnittstelle dazu verwendet, die räumliche Position einer Tonquelle relativ
zum Tonwiedergabesystem darzustellen, und die daraus resultierenden Impulsantworten,
die für jeden Lautsprecher eines Wiedergabesystems individuell die räumliche Orientierung
des Tonsignals bezüglich des wiedergebenden Lautsprechers darstellen, zu visualisieren.
[0040] Dabei kann der Benutzer auf anschauliche Art und Weise die Position der Quelle bezüglich
der Wiedergabeumgebung graphisch verändern, wobei sich aus der dargestellten Wellenfront
der punktförmigen akustischen Signalquelle automatisch die lautsprecherindividuelle
Impulsantwort bzw. die Parameter zur Ansteuerung der Lautsprecher ergeben. Ein Toningenieur
hat somit die Möglichkeit, auf intuitive Art und Weise die komplexen Parameter, die
zur Steuerung des Tonwiedergabesystems von Nöten sind, zu erzeugen.
[0041] Dabei ist ein wesentlicher Aspekt, dass zusätzlich die Möglichkeit geschaffen wird,
durch graphische Interaktion mit der Benutzerschnittstelle die Impulsantworten direkt
zu verändern, wobei unmittelbar dargestellt wird, wie sich die aktuelle Änderung auf
die Wahrnehmung der Position der Tonquelle auswirkt. Mit der erfindungsgemäßen graphischen
Benutzerschnittstelle hat man also vorteilhafterweise die Wahl, ob man von der physikalischen
Realität ausgehend die Tonquelle direkt platzieren will oder ob man die Möglichkeiten
der Veränderung der Impulsantwort kreativ nutzen möchte. Im letzteren Fall erhält
man dabei zusätzlich eine Abschätzung, wie die manuelle Änderung der Impulsantworten
in der Wahrnehmung eines Zuhörers interpretiert wird. Ein Toningenieur kann also zwischen
zwei Möglichkeiten der visuellen Klangbearbeitung wählen und dabei den Ansatz verfolgen,
der für das gewünschte klangliche Ergebnis bzw. den räumlichen Toneindruck, den es
zu erzielen gilt, am vorteilhaftesten ist.
[0042] In einem weiteren Ausführungsbeispiel der vorliegenden Erfindung wird die erfindungsgemäße
graphische Benutzerschnittstelle genutzt, um Impulsantworten, die Informationen über
einen zu simulierenden Raum beinhalten, darzustellen. Dabei werden von der Anzeigeeinrichtung
die Impulsantworten bezüglich eines festen Punktes innerhalb der Wiedergabeumgebung
in den Raumrichtungen dargestellt, für die sie auch die Rauminformationen tragen.
[0043] Von der Anzeigeeinrichtung werden also simultan alle für den räumlichen Gesamteindruck
relevanten Daten (Impulsantworten) dargestellt, wobei sie als dreidimensionales Abbild
der Umgebung visualisiert werden. Ein Benutzer hat also den Vorteil, dass er sämtliche
Informationen, die den räumlichen Klangeindruck betreffen, zeitgleich dargestellt
bekommt bzw. dass er diese simultan verändern kann, wobei zu jedem Zeitpunkt der durch
eine Veränderung entstandene veränderte räumliche Klangeindruck dargestellt wird und
beurteilt werden kann.
[0044] Dadurch wird es ermöglicht, auf intuitive Art und Weise einen Klangeindruck mit Nachhall
bzw. gewünschten Dämpfungen und anderen Signalmanipulationen zu erzielen, ohne die
den Impulsantworten zugrundeliegenden Parameter manuell verändern zu müssen, was ein
erhebliches Maß an Abstraktion erfordert.
[0045] Die graphische Darstellung erlaubt es ferner, den Designprozess losgelöst von technischen
Rahmenbedingungen durchzuführen. So wird im Allgemeinen eine Impulsantwortfunktion
diskret abgespeichert sein, d. h. für diskrete Zeitabschnitte existiert ein zugeordneter
Amplitudenwert. Bei der intuitiven Bedienung der graphischen Benutzerschnittstelle
muss darauf keine Rücksicht genommen werden, da die relevanten Parameter basierend
auf einer graphischen Änderung der angezeigten Impulsantwort automatisch erzeugt werden.
[0046] Ein weiterer Vorteil besteht darin, dass die Komplexität eines Systems leicht erhöht
werden kann, ohne dass die Intuitivität der Bedienung unter der erhöhten Anzahl von
Parametern verringert wird.
[0047] In einem weiteren Ausführungsbeispiel der vorliegenden Erfindung wird es ermöglicht,
die Impulsantworten mehrere Raumrichtungen betreffend frequenzselektiv darzustellen
bzw. zu bearbeiten. Dadurch wird es möglich, die Natürlichkeit des Raumeindrucks weiter
zu erhöhen, indem man beispielsweise für unterschiedliche Raumrichtungen verschiedene
frequenzabhängige Dämpfungsprofile annimmt, was die Authentizität des erzielten Klangeindrucks
einerseits erhöht, andererseits jedoch die Komplexität der Erzeugung der Parameter
ebenfalls ansteigen lässt. In der visuellen Darstellung ist es dabei dennoch möglich,
das erzielbare Klangerlebnis vorherzusagen, und dieses darüber hinaus kreativ zu verändern,
indem beispielsweise bei einer bestimmten Frequenz für eine frei wählbare Raumrichtung
eine starke künstliche Dämpfung eingeführt wird. Diese Änderungen sind sofort sichtbar
und es ist möglich, im Kontext des Gesamtsystems den Einfluss auf das gesamte Klanggeschehen
zuverlässig vorauszusagen.
[0048] In einem einfachen Beispiel können gleiche Parameter zur Beschreibung des Raumes
für alle Raumrichtungen verwendet werden, was einem diffusen Nachhall entspricht.
Richtungsabhängige Raumanteile (frühe Reflexionen) werden erst im Anschluss daran
angebracht. Daraus entsteht für jede Raumrichtung eine spezifische Raumimpulsantwort,
eine ungewünschte Abweichung der Parameter für eine Raumrichtung kann sofort erkannt
und korrigiert werden.
[0049] Ein weiterer Vorteil der erfindungsgemäßen dreidimensionalen Darstellung ist, dass
die frequenzselektive Impulsantwortdarstellung für jede Richtung durch einfaches Abtasten
leicht in eine Matrixdarstellung überführt werden kann, deren weitere Verarbeitung
außerordentlich effizient möglich ist.
[0050] Bei einem weiteren Ausführungsbeispiel der vorliegenden Erfindung werden für eine
vorgegebene Anzahl von Raumrichtungen individuell Delayzeiten eingestellt, wobei die
Delayzeiten als diracförmige Impulsantworten dargestellt werden. Diese sind bezüglich
eines festen Punktes in der Wiedergabeumgebung in einer dreidimensionalen Ansicht
dargestellt sind. Dabei ist besonders vorteilhaft, dass die graphische Manipulation,
die das Verschieben der diracförmigen Impulsantworten bezüglich eines Referenzpunktes
erlaubt, unmittelbar den räumlichen Effekt visuell widerspiegelt. Die einem Delay
entsprechenden diracförmigen Impulsantworten beschreiben gerade eine Reflexion an
einem Gegenstand, wobei das Vergrößern des Abstands der Impulsantwort bezüglich des
Referenzpunktes in der graphischen Darstellung einem Vergrößern der Laufzeit des reflektierten
Signals entspricht. Durch die unmittelbare Entsprechung der graphischen Darstellung
zur simulierten Realität können somit auf effizienteste Art und Weise beispielsweise
Räume simuliert werden, innerhalb derer sich die Wiedergabeumgebung befindet.
[0051] Ein besonderer Vorteil dieser vereinfachten Art der Raumgestaltung ist die hohe Intuitivität
der Darstellung und die damit verbundene reduzierte Fehlerwahrscheinlichkeit bei der
Steuerung eines Tonwiedergabesystems.
[0052] Bei einem weiteren Ausführungsbeispiel der vorliegenden Erfindung wird die graphische
Benutzerschnittstelle für ein Tonwiedergabesystem mit einem Signalgenerator betrieben,
der Lautsprechersignale für eine Mehrzahl von an unterschiedlichen räumlichen Positionen
angebrachte Lautsprecher erzeugt. Die hohe Intuitivität und Benutzerfreundlichkeit
der graphischen Benutzerschnittstelle macht es dabei möglich, die Wiedergabe von Signalquellen
auch in Echtzeit so zu manipulieren, dass die akustische Ortbarkeit eines Tonsignals,
beispielsweise eines Sängers auf der Bühne, mit dem optischen Eindruck übereinstimmt.
In diesem Fall ist lediglich ein Nachführen der bewegten Tonquelle innerhalb der erfindungsgemäßen
graphischen Benutzeroberfläche notwendig, was mittels klassischer Parametereingabe
für ein zu steuerndes Lautsprechersystem nicht realisierbar wäre.
[0053] Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug
nehmend auf die beiliegenden Zeichnungen näher erläutert. Es zeigen:
- Fig. 1
- ein Blockschaltbild zur Erläuterung der Funkti- onsweise der graphischen Benutzerschnittstelle;
- Fig. 2
- Blockschaltbild zum Festlegen und Bearbeiten der Position von Schallquellen;
- Fig. 3a
- ein Beispiel für eine graphische Benutzerschnitt- stelle zum Bearbeiten von Impulsantworten
der Pa- rameter, die den Ort einer Schallquelle beschrei- ben;
- Fig. 3b
- ein weiteres Beispiel für eine graphische Benut- zerschnittstelle
- Fig. 4
- Hinzufügen eines räumlichen Klangeindrucks für zu einer Tonquelle;
- Fig. 5
- Hinzufügen eines räumlichen Klangeindrucks zu einzelnen Lautsprechersignalen;
- Fig. 6
- eine graphische Benutzerschnittstelle zum Anzei- gen und Ändern von Impulsantworten;
- Fig. 7
- eine graphische Benutzerschnittstelle zum Anzei- gen und Verändern von frequenzselektiven
Impuls- antworten;
- Fig. 8
- eine graphische Benutzerschnittstelle zum Anzei- gen und Ändern von Zeitverzögerungen
für ver- schiedene Raumrichtungen; und
- Fig. 9
- ein System zum Ansteuern eines Tonwiedergabesys- tems mit einer graphischen Benutzeroberfläche.
[0054] Fig. 1 zeigt in einem Blockschaltbild die Funktionsweise einer erfindungsgemäßen
graphischen Benutzerschnittstelle 10, die eine Anzeigeeinrichtung 12 zum graphischen
Anzeigen einer Impulsantwort, eine Einrichtung zum Ermöglichen einer Änderung der
graphischen Anzeige 14, eine Einrichtung zum Empfangen einer Benutzeränderungseingabe
16 und eine Einrichtung zum Erfassen der geänderten Impulsantwort 18 aufweist.
[0055] Die Anzeigeeinrichtung 12 stellt die Impulsantworten für den Benutzer graphisch aufbereitet
so dar, dass die Auswirkungen einer Veränderung der dargestellten Impulsantworten
intuitiv interpretiert und vorhergesagt werden können.
[0056] Die Einrichtung zum Ermöglichen der Änderung der graphischen Anzeige 14 hat dabei
Zugriff auf die Anzeigeeinrichtung 12 und die von ihr visualisierten Daten.
[0057] Um eine Änderung der Impulsantworten zu ermöglichen, ist eine Benutzereingabe erforderlich,
die von der Einrichtung zum Empfangen einer Benutzeränderungseingabe 16 empfangen
wird, wobei die Änderung beispielsweise mittels einer Computer-Maus, eines Touchpads
oder Interaktions- und Visualisierungstechniken aus Systemen für virtuelle Realität
geschehen kann.
[0058] Basierend auf der Benutzeränderungseingabe kann nun von der Anzeigeeinrichtung 12
eine geänderte Impulsantwort graphisch dargestellt.
[0059] Durch das Zusammenspiel der Anzeigeeinrichtung 12, der Einrichtung zum Ermöglichen
einer Änderung 14 und der Einrichtung zum Empfangen einer Benutzeränderungseingabe
16 wird ein iteratives Änderungsverfahren aus Benutzereingabe und darauf folgender
graphischer Aktualisierung möglich. Dies hat den großen Vorteil, dass die Auswirkung
einer Benutzeränderung unmittelbar graphisch oder akustisch kontrolliert werden kann.
Ein explizites Durchführen der Änderungen und eine anschließende Kontrolle durch Testhören
innerhalb eines Tonwiedergabesystems kann dadurch entfallen, was erheblich zur Kosten-
und Zeitersparnis beiträgt.
[0060] Von der Einrichtung zum Erfassen der geänderten Impulsantwort 18 wird die modifizierte
Impulsantwort erfasst und beispielsweise zur weiteren Verwendung gespeichert. Die
Möglichkeit, die Impulsantwort zu speichern, kann vorteilhafterweise dazu genutzt
werden, eine bereits einmal erzeugte Impulsantwort, die einen speziellen zu simulierenden
Raum beschreibt, für weitere Projekte wieder zu verwenden.
[0061] Es ist zu bemerken, dass verschiedene Möglichkeiten denkbar sind, Impulsantworten
zu visualisieren. Die einfachste Möglichkeit ist, die Impulsantworten entsprechend
ihrer Richtung um den Mittelpunkt eines Wiedergabesystems anzuordnen. In dem daraus
entstehenden, dargestellten "Gebirge" können frequenzunabhängige Bearbeitungen der
Amplitudenverläufe der Impulsantworten vorgenommen werden. Für Beispiele von Visualisierungsmethoden
wird auf die folgenden Figuren verwiesen, in denen die folgenden vier Varianten der
Visualisierung beschrieben werden:
- Wellenfeldsynthese Punktquelle
- Impulsantwort-Zeit Darstellung
- Impulsantwort-Zeit-Frequenz Darstellung
- Multitapdelay
[0062] Fig. 2 zeigt schematisch, wie es anhand der in Fig. 3a oder 3b gezeigten Visualisierung
der graphischen Benutzerschnittstelle möglich ist, die Position einer Tonquelle mittels
einer erfindungsgemäßen graphischen Benutzerschnittstelle festzulegen oder eine bestehende
Position so zu verändern, dass ein gewünschter Positionseindruck entsteht.
[0063] Im Positionierungsschritt 20 wird dabei zunächst die Position einer Tonquelle relativ
zur Wiedergabeumgebung graphisch festgelegt.
[0064] Die graphische Benutzerschnittstelle stellt im zweiten Schritt 22 die die Position
der Tonquelle repräsentierenden Impulsantworten graphisch dar, welche vom Benutzer
direkt verändert werden können.
[0065] Dabei ist zu bemerken, dass, wie es im Folgenden anhand von Fig. 3a oder 3b zu sehen
sein wird, sowohl die Position der Quelle variiert, als auch der Verlauf der errechneten
Impulsantworten direkt manipuliert werden kann. Dies ermöglicht es zusätzlich, kreative
Toneffekte zu implementieren, welche nicht unmittelbar mit einer "realen" Ortsinformation
verknüpft sein müssen.
[0066] Fig. 3a oder 3b zeigt eine Ausführungsform einer erfindungsgemäßen graphischen Benutzerschnittstelle
zum Festlegen der räumlichen Position einer Tonquelle bzw. zum Ändern der die Tonquelle
repräsentierenden Impulsantworten.
[0067] Dargestellt ist eine punktförmige Schallquelle 30 in Form einer Kugel, eine Wiedergabeumgebung
32 und eine zur Punktquelle korrespondierende Wellenfront 34.
[0068] Die Position der Kugel beschreibt die Position der Schallquelle 30 im Raum. Basierend
auf der Position der Punktquelle 30 wird die Wellenfront 34 dargestellt, die sich
aus der Schallabstrahlung der punktförmigen Signalquelle ergibt. Wird beispielsweise
die Punktquelle 30 zu einem Punkt im Raum bewegt, der weiter von der Wiedergabeumgebung
32 entfernt ist, so wird die Wellenfront 34 flacher. Wird die Punktquelle 30 näher
an das Lautsprechersystem heran bewegt, dann wird die entsprechende Wellenfront stärker
gekrümmt sein.
[0069] Erfindungsgemäß lässt sich die Krümmung der Wellenfront auch direkt mit Hilfe von
zwei Anfassern 36a und 36b verändern. Dies wirkt sich unmittelbar auf die wahrgenommene
Position der Punktquelle 30 aus, was von der erfindungsgemäßen graphischen Benutzerschnittstelle
automatisch dargestellt wird.
[0070] Die graphische Benutzerschnittstelle in Fig. 3a oder 3b zeigt ferner einen Verzögerungsradius
38, der dazu dient, akausale Zustände bei der Wiedergabe eines auf Wellenfeldsynthese
basierenden Systems zu vermeiden wobei die Position der Wellenfront 34 durch den Verzögerungsradius
bestimmt wird. Der Verzögerungsradius 38 entspricht dabei einer Grundverzögerung,
die ein Wellenfeldsynthesesystem benötigt, und die der Entfernung des am weitesten
vom Mittelpunkt des Systems entfernten Lautsprechers entspricht. Durch die Grundverzögerung
wird es möglich, Quellen beliebig innerhalb und außerhalb des Lautsprechersystems/Rekonstruktions-gebiets
bzw. der Wiedergabeumgebung 32 zu positionieren.
[0071] Wie es Fig. 3a oder 3b zeigt, wird die Position der Wellenfront durch den Schnittpunkt
der Verbindungslinie zwischen Systemmittelpunkt und Position der Schallquelle 30 mit
dem Verzögerungsradius definiert. Die so bestimmte Position der Wellenfront 34 ist
somit gleichbedeutend mit einer verschwindenden Verzögerung, da der Verzögerungsradius
38 ja gerade die minimal einzuhaltende Verzögerungszeit bestimmt. Mit der erfindungsgemäßen
graphischen Benutzerschnittstelle ist es möglich, eine Schallquelle beliebig zu positionieren
und deren Wellenfront bzw. die die Wellenfront repräsentierende Impulsantwort zu verändern.
[0072] Bezüglich der Laufzeitverzögerungen ist zu bemerken, dass es bei der eines realen
Schallfeldes abhängig von der Entfernung der Schallquelle zum Abhörraum zu einer realen
Signallaufzeit kommt. Diese bestimmt sich durch den Abstand zwischen der Schallquellenposition
und dem Mittelpunkt des Wiedergabesystems. Bei der Erstellung von imaginären auditiven
Szenen ist diese Laufzeit in der Regel nicht erwünscht, da sie die Positionierungsmöglichkeiten
der Quellen einschränkt, da dadurch beispielsweise zeitliche Zusammenhänge bei einer
Musikaufnahme verändert werden können. Diese Verzögerung kann daher in Wellenfeldsynthesesystemen
deaktiviert werden, was für einen authentischen Klangeindruck erforderlich sein kann.
Dieser wichtige zusätzliche Parameter wird in der erfindungsgemäßen graphischen Benutzerschnittstelle
als Kreis 40 dargestellt, wobei die Position des Kreises 40 auf der Verbindungslinie
zwischen dem Systemmittelpunkt und der Schallquelle 30 die eingestellte Verzögerungszeit
visualisiert.
[0073] Im in Fig. 3a oder 3b gezeigten Fall befindet sich der Kreis 40 direkt an der Grenze
des Verzögerungsradius 38, die dargestellte Laufzeit hat ihren minimal möglichen Wert,
welcher der Grundverzögerung des Wellenfeldsynthesesystems entspricht. Soll der Fall
einer realen Schalllaufzeit/Verzögerung nachgebildet werden, würde die Position des
Kreises 40 direkt unterhalb der die Schallquelle 30 repräsentierenden Kugel befindlich
sein, wobei selbstverständlich sämtliche Zwischenwerte zusätzlich dar- und einstellbar
sind. Mittels der erfindungsgemäßen graphischen Benutzeroberfläche lassen sich also
auch die wichtigen Delayzeitparameter intuitiv einstellen und verändern, was die gestalterische
Freiheit weiter erhöht und darüber hinaus die Effizienz des Designvorganges bei der
räumliche Tonwiedergabe steigert.
[0074] Die erfindungsgemäße graphische Benutzerschnittstelle hat zusätzlich den Vorteil
einer äußerst großen Flexibilität, so dass weitere Parameter leicht hinzugefügt werden
können, beispielsweise könnte die Fläche des Kreises 40 ein Verhältnis von Diffusschall
zu Direktschall beschreiben, was von einem Zuhörer als weiteres Merkmal für die Entfernung
einer Schallquelle zur Abhörposition aufgefasst wird, wobei das Ändern dieses Verhältnisses
beispielsweise durch ein Verschieben des Kreises 40 bzw. das Ändern seiner Fläche
implementiert werden könnte.
[0075] Entsprechend der Position einer virtuellen Schallquelle S gegenüber den einzelnen
Lautsprecherpositionen L
1..n berechnet der Wellenfeldsynthesealgorithmus die Impulsantwort IR
L1..Ln für jeden beteiligten Lautsprecher (Amplitude, Verzögerung). Betrachtet man zu einem
Zeitpunkt t diese Impulsantworten nebeneinander aufgereiht, so ergeben die Peaks eine
abgetastete Version der von der virtuellen Schallquelle ausgehenden Wellenfront. In
einem weiteren graphischen Verarbeitungsschritt (siehe Fig. 3a) kann daraus die Wellenfront
vereinfacht dargestellt und mit Interaktionselementen dargestellt werden. Interagiert
der Nutzer nun mit diesen Elementen, so verändert sich die graphische Darstellung
der Wellenfront. Diese Darstellungsänderung kann im nächsten Schritt auf die einzelnen
Impulsantworten IR
L1..Ln aufgeprägt werden
[0076] Allgemein gesagt wird durch das graphische Benutzerinterface die Manipulation von
Impulsantworten ermöglicht, die für jeden einzelnen Lautsprecher, der das Wiedergabevolumen
32 beschallt, vorzugsweise zu berechnen sind.
[0077] Bei dem in Fig. 3b gezeigten Ausführungsbeispiel wird durch das graphische Benutzerinterface
die Manipulation von Impulsantworten ermöglicht, die für jeden einzelnen Lautsprecher,
der das Wiedergabevolumen 32 beschallt, zu berechnen sind. Die Darstellung der Impulsantworten
ergibt sich dabei direkt aus der Darstellung der graphischen Benutzerschnittstelle,
wozu exemplarisch eine Verbindungslinie 42 zwischen der Tonquelle 30 und einem gedachten
Lautsprecher am Rand des Wiedergabevolumens 32 dargestellt ist. Die zu berechnende
Impulsantwort ist dabei unmittelbar durch die Form der Wellenfront an dem Ort gegeben,
an dem die Verbindungslinie 42 die Wellenfront 34 schneidet. Die räumliche Position
einer Tonquelle 30 wird, wie es in Fig. 3a oder 3b zu sehen ist, für jeden einzelnen
Lautsprecher in eine Zeitverzögerung und eine Amplitude übersetzt. Die Amplitude ergibt
sich dabei unmittelbar aus der Höhe der graphischen Repräsentierung der Wellenfront
34, wobei die Zeitverzögerung ebenfalls durch den Schnittpunkt der Geraden 42 mit
der Wellenfront 34 bestimmt ist, wobei für die Bestimmung der Zeitverzögerung die
Länge der geschnittenen Teilstücke der Geraden 42 maßgeblich ist.
[0078] Alternativ zu den bereits beschriebenen Manipulationsformen, die in der graphischen
Benutzerschnittstelle implementiert sind, ist eine Reihe weiterer alternativer Szenarien
leicht implementierbar.
[0079] So wird z. B. die Wellenfrontdarstellung 34 in der Abbildung durch zwei Kugeln bzw.
Anfasser 36a und 36b begrenzt. Die Manipulation der Wellenfront an diesen Punkten
wirkt sich letztendlich auf die Delays bzw. die Zeitverzögerungen der an der Synthese
beteiligten Lautsprecher des Wellenfeldsynthesesystems aus. Weitere Anfasser auf der
dargestellten Wellenfront 34 könnten beispielsweise zur Veränderung der Lautsprecheramplituden
benutzt werden. Damit wird die einfache Justierung einer Fensterung zur Vermeidung
von Randeffekten genauso möglich wie die Definition eines Punktes mit maximaler Amplitude.
Dieser Punkt kann dann der Schallquelle, zumindest bezogen auf die Intensität, eine
frequenzunabhängige Richtcharakteristik geben.
[0080] Für die Darstellung der Lautstärke einer Schallquelle kann beispielsweise die Größe
der die Tonquelle beschreibenden Kugel 30 benutzt werden. Die oben erwähnte Manipulation
des Direktschall/Diffusschall-Verhältnisses kann auch hier noch einmal angezeigt werden.
Wenn die Lautstärke des Direktschalls der Größe der Kugel 30 entspricht, ist z. B.
eine entfernte Schallquelle eher leiser und entspricht somit einer kleinen Kugel.
Eine Verknüpfung mit der entfernungsabhängigen Berechnung der Lautstärke einer Schallquelle
ist durch diese Darstellung somit einfachst realisierbar.
[0081] Mit der erfindungsgemäßen graphischen Benutzerschnittstelle in Fig. 3a oder 3b gelingt
es also, die mathematische Funktion, die die Impulsantwort verkörpert, intuitiv und
allgemein verständlich so darzustellen, dass die Impulsantwort zielgerichtet dahingehend
manipuliert werden kann, dass ein gewünschter Richtungseindruck entsteht.
[0082] Während sich die Möglichkeiten der graphischen Benutzeroberfläche aus Fig. 3a oder
3b zur Positionierung einer Tonquelle, also zum Bestimmen eines Klangeindrucks, der
den Ort der Tonquelle wiedergibt, bezogen haben, wird anhand der Fig. 4 - 8 erläutert
werden, dass die erfindungsgemäße graphische Benutzerschnittstelle auch dazu geeignet
ist, solche Impulsantworten zu visualisieren und deren Änderung zu ermöglichen, die
einen Klangeindruck bewirken, der dem eines zu simulierenden Raums, wie beispielsweise
einer Kathedrale, entspricht.
[0083] Um dies zu ermöglichen, gibt es zwei prinzipielle Möglichkeiten, die anhand der Fig.
4 und 5 im Folgenden erläutert werden sollen.
[0084] Fig. 4 zeigt dabei eine Möglichkeit, bei der zunächst in einem Positionierungsschritt
50 die Tonquellen im Raum angeordnet werden, wie es beispielsweise anhand von Fig.
3a oder 3b beschrieben wurde. Dabei werden den Lautsprechen für jede Tonquelle Impulsantworten
zugeordnet.
[0085] Da sich die Tonquelle in definierter räumlicher Position bezüglich der Wiedergabeumgebung
befindet, kann ein räumlicher Klangeindruck der Tonquelle direkt aufgeprägt werden,
wenn sich diese in einer Raumrichtung bezüglich der Wiedergabeumgebung befindet, für
die ein bestimmter räumlicher Klangeindruck zu simulieren ist.
[0086] In diesem Fall wird in einem Raumsimulationsschritt 52 für jede Tonquelle und Raumrichtung
eine Impulsantwortfunktion erzeugt, die an ein Wiedergabesystem zusammen mit der Tonquelle
in einem Transferschritt 54 übertragen werden muss, um bei der Wiedergabe den gewünschten
räumlichen Klangeindruck zu erzielen.
[0087] Wie es Fig. 5 zeigt, ist es alternativ auch möglich, zunächst die Position der Tonquellen
in einem Positionierungsschritt 60 festzulegen, in dem für Lautsprecher für jede Tonquelle
Impulsantworten erzeugt werden, die die Position beschreiben. Der Raumeindruck, der
in einer Hörrichtung entstehen soll, kann, da die im Wiedergabesystem verwendeten
Lautsprecher ebenfalls festen Raumrichtungen zugeordnet sind, auch dadurch erzeugt
werden, dass für jeden Lautsprecher in einem Raumsimulationsschritt 62 zusätzlich
eine Impulsantwort erzeugt wird, die die Information über den in der Richtung des
betreffenden Lautsprechers befindlichen Raum enthält.
[0088] In einem Transfer- bzw. Speicherschritt 64 muss an das Tonwiedergabesystem dann die
Tonquelle und für jeden einzelnen Lautsprecher eine Positionsimpulsantwort und eine
Raumimpulsantwort übertragen werden. Durch die Flexibilität der erfindungsgemäßen
graphischen Benutzerschnittstelle kann die Zuordnung eines räumlichen Klangeindrucks
also entweder zu jeder Tonquelle individuell erfolgen oder es können Gruppen von Tonquellen,
die in einer ähnlichen Raumrichtung bezüglich der Wiedergabeumgebung angeordnet sind,
zusammengefasst werden, um mehrere diskrete Raumrichtungen darzustellen, wodurch bei
der Wiedergabe die erforderliche Rechenkapazität verringert wird.
[0089] Eine Ausführungsform der erfindungsgemäßen graphischen Benutzerschnittstelle, die
die Manipulation einer Impulsantwort in einer Impulsantwort-Zeitdarstellung zeigt,
ist in Fig. 6 gezeigt.
[0090] Dazu werden die Raumrichtungen bezüglich einer Wiedergabeumgebung 70 in acht diskrete
Sektoren 72a - 72h unterteilt. Für jeden der Sektoren 72a - 72h wird also ein gemeinsamer
Raumeindruck mittels einer Impulsantwort-Zeitdarstellung erzielt. Zur Visualisierung
werden dabei die Einhüllenden der zur Raumsimulation verwendeten acht Impulsantworten
zu Flächen extruiert. Diese Flächen werden in Form eines Achtecks angeordnet und zu
einer gemeinsamen Fläche 74 verbunden. Dabei entspricht die Höhe der Fläche über der
durch die Sektoren 72a - 72i definierten Fläche der Amplitude der Impulsantwort. Die
Entfernung vom Mittelpunkt der Wiedergabeumgebung 70 stellt die Zeit dar, zeitlich
am Ende der Impulsantwort auftretende Ereignisse sind daher weiter entfernt vom Mittelpunkt
der Wiedergabeumgebung 70.
[0091] Mit dieser Darstellung können die Amplitudenverläufe der Raumimpulsantworten über
die Zeit entsprechend ihrer Raumrichtung dargestellt werden. Die Veränderung erfolgt
interaktiv durch Bewegen von hier beispielhaft dargestellten Interaktionselementen
76a, b und c. Es wird also ermöglicht, mit einem Blick die gesamte räumliche Klangsituation
zu erfassen und Abweichungen von dem gewünschten Verhalten zu erkennen und zu beseitigen.
[0092] Beispielsweise soll für einen realen Raum die Nachhallzeit aus allen Richtungen in
der Regel nahezu gleich sein. In dem aufgezeigten Beispiel von Fig. 6 ist die Nachhallzeit
in Richtung des Sektors 72h jedoch reduziert, was sich durch die Unsymmetrie der Gesamtfläche
74 leicht erkennen lässt, so dass der Unterschied zum realen, gleichmäßig nachhallenden
Raum sofort erkannt werden kann.
[0093] Fig. 7 beschreibt eine Darstellung von räumlichen Impulsantworten in einer Zeit-Frequenz-Darstellung.
Dargestellt ist die Wiedergabeumgebung 80 und acht Zeit-Frequenz-Darstellungen von
Impulsantworten 82a - 82h, die acht diskreten Raumrichtungen bezüglich der Wiedergabeumgebung
80 zugeordnet sind.
[0094] Allgemein ist es mit dem erfindungsgemäßen Ausführungsbeispiel in Fig. 7 möglich,
sowohl die Zeit- als auch die Frequenzkomponenten von Impulsantworten bezogen auf
ihre Raumrichtungen zu visualisieren und manipulierbar zu machen. Die Zeitachse der
Visualisierung läuft dabei ausgehend vom Mittelpunkt der Wiedergabeumgebung 80 nach
außen, so dass weiter entfernte Punkte spätere Ereignisse beschreiben. Die acht Flächen
82a - 82h, die die Impulsantworten in Form eines Wasserfalldiagramms darstellen, können
beispielsweise anhand von Interaktionselementen 86a - 86c verändert werden. Die beispielhaft
dargestellten Interaktionselemente 86a - 86c erlauben die Manipulation des Amplitudenfrequenzgangs
zu einer bestimmten Zeit, im hier dargestellten Beispiel also am Anfang der Impulsantwort.
In dem hier dargestellten Fall sind tiefe Frequenzen weiter links und hohe Frequenzen
weiter rechts angeordnet, so dass sofort zu erkennen ist, dass in der räumlichen Simulation
die tiefen Frequenzen mit höherer Amplitude beginnen und länger ausklingen als die
hohen Frequenzen. Dieser komplexe Zusammenhang, der beispielsweise durch Beschreibung
der Flächen 82a - 82h in Form einer Matrix gespeichert werden kann, ist hier intuitiv
zu erfassen und zu verändern.
[0095] Die Art der Darstellung erlaubt es weiterhin, zusätzliche Effekte anzubringen bzw.
deren Wirkung zu erkennen, beispielsweise würden in dieser Darstellung starke Reflexionen
aus bestimmten Raumrichtungen als Erhebungen auf den Flächen der entsprechenden Raumimpulsantwort
sichtbar werden.
[0096] Es ist also durch die gleichzeitige Ansicht der Zeit- und Frequenzkomponente ersichtlich,
welche Frequenzanteile reflektiert werden. Mit einer Verschiebung der Interaktionselemente
86a - 86c an eine entsprechende Stelle in der Impulsantwort kann diese Reflexion sowohl
zeitlich als auch frequenzbezogen bearbeitet werden, so dass die große Anzahl von
der Visualisierung zugrundeliegenden Parameter günstig und effizient abgetastet und
gespeichert werden können.
[0097] Fig. 8 zeigt ein weiteres Beispiel einer erfindungsgemäßen graphischen Benutzerschnittstelle,
bei dem die Impulsantworten der einzelnen Raumrichtungen aus diskreten Peaks bestehen.
Dargestellt sind eine Wiedergabeumgebung 90, acht diskrete Raumrichtungen 92a - 92i
und fünf exemplarische, deltaförmige Impulsantworten 94a - 94e.
[0098] Da peak- oder deltaförmige Impulsantworten Zeitverzögerungen eines Tonsignals entsprechen,
können somit richtungsabhängige Multi-Tap-Delays realisiert werden. Dabei repräsentieren
die Wellenfronten 94a - 94e Echos aus den ihnen zugeordneten Raumrichtungen. Ihr Abstand
zum Mittelpunkt des Wiedergabevolumens gibt den Zeitpunkt der Wiederholung des Ursprungssignals
an. Erfindungsgemäß kann beispielsweise mittels eines Interaktionselementes 96 in
Form einer Kugel die Position der Wiederholungen durch radiale Bewegungen der Impulsantworten
von oder zum Mittelpunkt des Systems beeinflusst werden. Dabei kann gleichzeitig die
Amplitude der Wiederholungen durch die Höhe der Wellenfronten in der vertikalen Richtung
beeinflusst werden.
[0099] Der Vorteil der hohen Intuitivität der erfindungsgemäßen graphischen Benutzerschnittstelle
wird hier besonders deutlich, da die Position der deltaförmigen Peaks die Verzögerungszeit
eines Echos beschreibt, was akustisch gleichbedeutend ist mit einer reflektierenden
Wand mit vorgegebener Dämpfung, die sich an der Position der Impulsantworten befindet.
[0100] In einer erweiterten Variante der erfindungsgemäßen graphischen Benutzerschnittstelle
ist hier auch eine Zeit-Frequenz-Darstellung realisierbar, um jedem Echo zusätzlich
einen individuellen Frequenzgang einzuprägen.
[0101] Fig. 9 beschreibt ein System zum Visualisieren und Bearbeiten von räumlichen Toneffekten
100, das sich aus einem Signalverarbeitungsteil 102 und einem Visualisierungs- und
Interaktionsteil 104 zusammensetzt.
[0102] Erfindungsgemäß besteht die Signalverarbeitung darin, dass eingehende Audiosignale
106 mittels einer mathematischen Faltung 108 mit denen mittels des Visualisierungs-
und Interaktionsteils 104 bestimmten Impulsantworten gefaltet werden, um daraus Audiosignale
110 zu erzeugen, die den Klangeindruck eines zu simulierenden Raumes tragen. Der Visualisierungs-
und Interaktionsteil 104 weist eine Anzeigeeinrichtung zum Anzeigen von berechneten
Impulsantworten 112, eine Einrichtung zum Empfangen einer Benutzeränderungseingabe
114, eine Einrichtung zum Ermöglichen einer Änderung der graphischen Anzeige 116 sowie
eine Einrichtung zum Erfassen der geänderten Impulsantwort 118 auf. Die Einrichtung
zum Empfangen einer Benutzeränderungseingabe 114 umfasst ein Interaktionsgerät 120
sowie eine Einrichtung zum Umsetzen der Interaktion 122. Die Einrichtung zum Ermöglichen
einer Änderung der graphischen Anzeige der Impulsantwort 116 umfasst eine Ausgabeeinrichtung
124 zum Darstellen der ursprünglichen Impulsantwort sowie eine Bildberechnungseinheit
126 zum Visualisieren der ursprünglichen Impulsantwort.
[0103] Von der Einrichtung zum Empfangen einer Benutzeränderungseingabe und der Einrichtung
zum Ermöglichen einer Änderung der graphischen Anzeige der Impulsantwort 116 wird
ein visuelles Modell 112 erzeugt, das auf Parametern basiert, die die Impulsantworten
beschreiben und somit die Information über den zu simulierenden Raum beinhalten. Wenn
durch mehrmalige Interaktion und Visualisierung ein geeignetes visuelles Modell erstellt
wurde, wird von der Einrichtung zum Erfassen der geänderten Impulsantwort 118 die
Parameter, die der Visualisierung zugrunde liegen, extrahiert und als Impulsantworten
an die Signalverarbeitung 102 übermittelt.
[0104] Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung umfasst die
Signalverarbeitung die Faltung von N Eingangssignalen mit n Impulsantworten zu n Ausgangssignalen.
N kann dabei von z. B. acht Signalen bei der Generierung von Halleffekten für die
Wellenfeldsynthesewiedergabe bis hin zu einer sehr großen Zahl bei der Generierung
eines ganzen Wellenfeldes schwanken. Werden mehrere Effekte oder Quellen gleichzeitig
erzeugt, so müssen die Ausgangssignale für jeden Effekt oder jede Quelle am Ende aufsummiert
werden.
[0105] Die für die Signalverarbeitung benötigten Impulsantworten werden also mit Hilfe des
Visualisierungs- und Interaktionsteils des Systems generiert. Aus einer Impulsantwort
können klangrelevante Parameter generiert werden. Dabei ist zu unterscheiden, ob es
sich um Raumsignale oder Direktsignale handelt.
[0106] Bei Raumsignalen können unterschiedliche Methoden nach angewendet werden. Die gewonnenen
Werte lassen sich dann wie im Abschnitt zur Visualisierung beschrieben grafisch darstellen.
Mit Hilfe der Graphiken und den eingebauten Interaktionselementen können die Parameter
verändert und zu einer neuen Impulsantwort verarbeitet werden.
[0107] Im Falle der Positionierung von Direktschall können aus dem Interface ebenfalls Parameter
gewonnen werden. Allerdings können diese erst durch die Anwendung des Wellenfeldsynthese-Algorithmus
in Impulsantworten für die Lautsprecherkanäle umgewandelt werden. Die Parameter sind
damit auf einer abstrakteren Ebene. Doch der Aufbau des Blockschaltbildes in Fig.
9 ändert sich dadurch nicht.
[0108] Mit Hilfe dieses Systems können also alle räumlichen Toneffekte von Raumsimulation
bis hin zu Multi-Tap-Delays visualisiert und editiert werden. Dieses Konzept kann
in allen herkömmlichen Mehrkanalsystemen bis hin zur Wellenfeldsynthese eingesetzt
werden. Es bietet einen universellen Lösungsweg für räumliche Klangeffekte und deren
intuitive Nutzbarmachung für den Benutzer.
[0109] Wie es durch die beschriebenen Ausführungsbeispiele verdeutlicht wird, besteht ein
wesentlicher Vorteil der erfindungsgemäßen graphischen Benutzerschnittstelle darin,
dass komplexe mathematische Parameter intuitiv zugänglich gemacht werden. Dadurch
wird das Erzeugen bzw. Einstellen dieser Parameter ermöglicht, wobei insbesondere
das gesamte Klanggeschehen jederzeit im Auge behalten werden kann. Besonders vorteilhaft
ist dabei, dass bei den beschriebenen Ausführungsbeispielen, die auf 3D-Visualisierungen
basieren, die Richtung, in der die Wiedergabeumgebung betrachtet wird, variiert werden
kann, so dass ein entstehender Klangeindruck dadurch noch besser vorhergesagt werden
kann, dass dieser aus verschiedenen Raumrichtungen beurteilt wird.
[0110] Obwohl in der Darstellung in Fig. 1 die graphische Benutzerschnittstelle einzelne
diskrete Funktionsblöcke aufweist, ist eine derartige Aufteilung nur als beispielhaft
zu verstehen, es sind prinzipiell beliebige Kombinationen und Zusammenfassungen der
einzelnen Funktionsblöcke möglich. So kann z. B. in naheliegender Weise die Anzeigeeinrichtung
12 mit der Einrichtung zum Ermöglichen einer Änderung 14 der graphischen Anzeige kombiniert
werden, wie es in den dargestellten Ausführungsbeispielen teilweise der Fall ist,
wo die Änderungsmöglichkeit als Teil der Anzeige bereits implementiert ist, beispielsweise
in Form der Anfasser 36a und 36b in Fig. 3a oder 3b.
[0111] Bei der Einrichtung zum Empfangen einer Benutzeränderungseingabe sind prinzipiell
auch andere Verfahren als die in den Ausführungsbeispielen gezeigten denkbar. Die
Benutzereingabe kann mittels einer Maus, eines Touchscreens oder jedweden anderen
Möglichkeit der Bewegung eines Cursors auf einem Bildschirm erfolgen. Auch die direkte
Eingabe von diskreten Änderungsschritten mittels einer Tastatur ist darstellbar, beispielsweise
bei einer diskretisierten Darstellung einer Impulsantwort, wo in definierten Zeitbereichen
der Wert der Impulsantwort in diskreten Schritten eingestellt werden kann, was beispielsweise
mittels einer herkömmlichen Tastatur leicht möglich ist.
[0112] Die Darstellung der Wellenfronten bzw. Impulsantworten und die Möglichkeit zur Manipulation
derselben sind nur als Beispiele zu verstehen, es ist jedwede andere geeignete Darstellung
von Impulsantwortfunktionen ebenfalls möglich, um erfindungsgemäß das Einstellen bzw.
das Erzeugen eines Raumeindrucks zu ermöglichen. Beispielsweise wäre es denkbar, bei
der Betrachtung verschiedener Raumrichtungen eine gemeinsame Impulsantwortfunktion
darzustellen, die gewissermaßen den räumlichen Grundcharakter vorgibt, die also für
alle Raumrichtungen dieselbe ist. Einen richtungsabhängigen Raumklangcharakter könnte
man vorteilhafterweise dadurch darstellen, dass für jede Raumrichtung lediglich die
Differenz zur gemeinsamen Impulsantwortfunktion dargestellt wird, so dass man leicht
einen Eindruck davon erhält, wie sich die betrachtete Raumrichtung in ihren räumlichen
Eigenschaften von dem Gesamtklangbild (mittleres Klangbild) unterscheidet.
[0113] Eine Reihenfolge der Bearbeitung der Impulsantwortfunktionen, die die Position einer
Tonquelle bzw. den Raumeindruck beschreiben, ist nicht fest vorgegeben. Es ist sowohl
möglich, zuerst alle Tonquellen im Raum zu positionieren und danach einen Raumeindruck
zu erzeugen, als auch zuerst den zu simulierenden Raum zu definieren, um darauffolgend
die Tonquellen innerhalb des Raums zu positionieren.
[0114] Demzufolge unterscheiden sich die Bearbeitungsschritte für ein System zur Ansteuerung
eines Tonwiedergabesystems, das eine erfindungsgemäße graphische Benutzerschnittstelle
sowie einen Signalgenerator zum Liefern von Lautsprechersignalen aufweist. Zum einen
ist es möglich, jeder Tonquelle, die in einer definierten Raumrichtung befindlich
ist, eine Rauminformation durch Falten mit einer räumlichen Impulsantwortfunktion
einzuprägen, um dann in einem weiteren Schritt lautsprecherindividuell eine Faltung
mit Impulsantworten vorzunehmen, welche die Position der Tonquellen relativ zum Wiedergabevolumen
beschreiben.
[0115] Alternativ ist es möglich, zunächst die Tonquelle lautsprecherindividuell zu bearbeiten,
d. h. individuelle Lautsprechersignale durch Faltung des Tonsignals mit den die Position
der Tonquelle beschreibenden Impulsantworten zu erzeugen, um danach Lautsprecher individuell
eine weitere Faltung durchzuführen, die den Raumeindruck erzeugt, wobei die Lautsprecher,
die in fester geometrischer Richtung zur Wiedergabeumgebung angeordnet sind, mit einer
räumlichen Impulsantwort gefaltet werden, die dem zu simulierenden Raumeindruck in
der Richtung der Lautsprecher entsprechen.
[0116] Die Form der graphischen Elemente, die in den Ausführungsbeispielen zur Visualisierung
der einzelnen wesentlichen Komponenten, wie der Position der Tonquelle oder der Form
einer Impulsantwort, dargestellt sind, sind als bevorzugte Ausführungsbeispiele zu
verstehen, jedoch ist die erfindungsgemäße Funktionsweise ebenso sichergestellt, wenn
sich die Art der geometrischen Darstellung bezüglich der Form unterscheidet, je nach
Anwendungszweck könnte eine unterschiedliche Form sogar funktionalen Charakter haben,
d. h. verschiedene Eigenschaften beispielsweise einer Tonquelle beschreiben.
[0117] Die Signalbearbeitung, die lautsprecherindividuell durch Faltung eines Tonsignals
mit einer Impulsantwortfunktion dargestellt ist, kann sowohl kontinuierlich als auch
diskret implementiert sein, wobei auch alternative mathematische Methoden, den Raumeindruck,
den eine Impulsantwort beschreibt, einem Tonsignal aufzuprägen, möglich sind.
[0118] In den Ausführungsbeispielen, die im Vorhergehenden gezeigt sind, ist zur Erzeugung
eines Raumeindrucks der die Wiedergabeumgebung umschließende Raum in acht diskrete
Raumrichtungen unterteilt, wobei für jede Raumrichtung individuell ein räumlicher
Klangcharakter festgelegt werden kann. Dies ist nur als Beispiel zu verstehen, es
sind selbstverständlich beliebige andere Anzahlen von Raumrichtungen möglich, prinzipiell
ist die Zahl der Richtungen nach oben nicht begrenzt, so dass es erfindungsgemäß leicht
möglich ist, den gesamten Klangeindruck noch weiter zu verbessern.
[0119] Abhängig von den Gegebenheiten kann das erfindungsgemäße Verfahren zum Verwenden
einer graphischen Benutzerschnittstelle zum Benutzen eines Tonwiedergabesystems in
Hardware oder in Software implementiert werden. Die Implementation kann auf einem
digitalen Speichermedium, insbesondere einer Diskette oder CD mit elektronisch auslesbaren
Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken
können, dass das erfindungsgemäße Verfahren zum Überprüfen des Erfolges eines Entkernvorganges
ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computer-Programm-Produkt
mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung
des erfindungsgemäßen Verfahrens, wenn das Computer-Programm-Produkt auf einem Rechner
abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computer-Programm
mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das
Computer-Programm auf einem Computer abläuft.
1. Graphische Benutzerschnittstelle (10) für ein Tonwiedergabesystem, das ausgebildet
ist, um in einer Wiedergabeumgebung (32; 70; 80; 90) einen räumlichen Toneindruck
zu erzeugen, mit folgenden Merkmalen:
einer Anzeigeeinrichtung (12) zum graphischen Anzeigen von Impulsantworten (34; 74;
82a - 82h; 94a - 94e), die Raumrichtungen der Wiedergabeumgebung (32; 70; 80; 90)
zugeordnet sind, wobei die Impulsantworten bezüglich der Wiedergabeumgebung in den
Raumrichtungen dargestellt sind, denen sie zugeordnet sind;
einer Einrichtung zum Ermöglichen einer Änderung (14) der graphischen Anzeige der
Impulsantworten (34; 74; 82a - 82h; 94a - 94e) durch den Benutzer, wobei eine Änderung
der graphischen Anzeige der Impulsantworten (34; 74; 82a - 82h; 94a - 94e) an vorbestimmten
Punkten ermöglicht wird;
einer Einrichtung zum Empfangen (16) einer Benutzeränderungseingabe, um durch die
Anzeigeeinrichtung (12) geänderte Impulsantworten graphisch darzustellen; und
einer Einrichtung zum Erfassen der geänderten Impulsantworten (18).
2. Graphische Benutzerschnittstelle nach Anspruch 1, bei der die Anzeigeeinrichtung (12)
ausgebildet ist, um die Impulsantworten (74; 82a - 82h; 94a - 94e) als zeitliche Verläufe
einer Intensitätsgröße darzustellen.
3. Graphische Benutzerschnittstelle nach Anspruch 2, bei der die Anzeigeeinrichtung (12)
ausgebildet ist, um die zeitliche Verläufe der Impulsantworten (74; 82a - 82h; 94a
- 94e) so darzustellen, dass diese in diskrete Zeitabschnitte unterteilt sind, wobei
jedem Zeitabschnitt eine Intensitätsgröße zugeordnet ist.
4. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der
die Anzeigeeinrichtung (12) ausgebildet ist, um die Impulsantworten (82a - 82h) graphisch
als Funktion der Frequenz darzustellen.
5. Graphische Benutzerschnittstelle nach Anspruch 4, bei der die Anzeigeeinrichtung (12)
ausgebildet ist, um die Frequenzverläufe der Impulsantworten (74; 82a - 82h; 94a -
94e) so darzustellen, dass diese in diskrete Frequenzabschnitte unterteilt sind, wobei
jedem Frequenzabschnitt eine Intensitätsgröße zugeordnet ist.
6. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der
die Anzeigeeinrichtung (12) ausgebildet ist, um die Impulsantworten (82a - 82h) graphisch
als Funktionen der Zeit und als Funktionen der Frequenz in einer dreidimensionalen
Repräsentation darzustellen, wobei die Funktionswerte als Höhe über einer zweidimensionalen
Fläche dargestellt sind, von der eine erste Seite als Maßstab die Zeit aufweist und
von der eine an die erste Seite anschließende zweite Seite als Maßstab die Frequenz
aufweist.
7. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der
die Anzeigeeinrichtung (12) ausgebildet ist, um zusätzlich eine graphische Repräsentation
der Wiedergabeumgebung (32; 70; 80; 90) in einer dreidimensionalen Repräsentation
anzuzeigen, wobei die Impulsantworten (34; 74; 82a - 82h; 94a - 94e) bezüglich der
Wiedergabeumgebung (32; 70; 80; 90) in den Raumrichtungen dargestellt sind, der die
Impulsantworten (34; 74; 82a - 82h; 94a - 94e) zugeordnet sind.
8. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der
die Einrichtung zum Ermöglichen einer Änderung (14) der graphischen Anzeige der Impulsantworten
(34; 74; 82a - 82h; 94a - 94e) ausgebildet ist, um eine Änderung der graphischen Darstellung
der Impulsantworten (34; 74; 82a - 82h; 94a - 94e) an jedem beliebigen Punkt der graphischen
Darstellung der Impulsantworten (34; 74; 82a - 82h; 94a - 94e) zu ermöglichen.
9. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der
die Einrichtung zum Ermöglichen einer Änderung (14) der graphischen Anzeige der Impulsantworten
(94a - 94e) ausgebildet ist, um als Änderung der graphischen Darstellung der Impulsantworten
(94a - 94e) ein Verschieben der Impulsantworten (94a - 94e) in der Zeit zu ermöglichen.
10. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der
die Einrichtung zum Empfangen einer Benutzeränderungseingabe (16) ausgebildet ist,
um Signale einer Computermaus, eines Touchpads, eines Touchscreens, eines Trackballs
oder einer Tastatur zu empfangen.
11. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der
die Einrichtung zum Erfassen (18) der geänderten Impulsantworten ausgebildet ist,
um zur Erfassung die geänderten, graphisch dargestellten Impulsantwort abzutasten
und die abgetasteten Werte in einem Speicher zu speichern.
12. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der
die Anzeigeeinrichtung (12) ausgebildet ist, um Impulsantworten (74; 82a - 82h; 94a
- 94e) graphisch anzuzeigen, welche Informationen über einen zu simulierenden Raum
enthalten.
13. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der
die Anzeigeeinrichtung (12) ausgebildet ist, um Impulsantworten (34) graphisch anzuzeigen,
welche Informationen über die Position einer Tonquelle (30) bezüglich der Wiedergabeumgebung
(32) beinhalten.
14. Ansteuereinrichtung für ein Tonwiedergabesystem, das ausgebildet ist, um in einer
Wiedergabeumgebung einen räumlichen Toneindruck zu erzeugen, mit folgenden Merkmalen:
einer graphischen Benutzerschnittstelle (10) gemäß einem der Ansprüche 1 bis 13; und
einem Signalgenerator (102) zum Liefern von Lautsprechersignalen (110) für Lautsprecher
einer Mehrzahl von an unterschiedlichen räumlichen Positionen anbringbaren Lautsprechern.
15. Ansteuereinrichtung nach Anspruch 14, bei der der Signalgenerator (102) eine Kombinationseinrichtung
(108) zum Kombinieren von Tonsignalen (106) mit den geänderten Impulsantworten aufweist,
wobei die Tonsignale (106) für Lautsprecher vorgesehen sind, die an räumlichen Position
angeordnet sind, die mit den Raumrichtungen korrespondieren, denen die Impulsantworten
zugeordnet sind, um Lautsprechersignale (110) zu erhalten, wobei die Kombinationseinrichtung
(108) ausgebildet ist, um so zu kombinieren, dass die Lautsprechersignale (110) die
Information über den zu simulierenden Raum enthalten.
16. Ansteuereinrichtung nach Anspruch 15, bei der der Signalgenerator (102) eine Kombinationseinrichtung
(108) zum Kombinieren der Tonsignale (106) mit den geänderten Impulsantworten aufweist,
um Lautsprechersignale (110) zu erhalten, wobei die Kombinationseinrichtung (108)
ausgebildet ist, um so zu kombinieren, dass die Lautsprechersignale (110) die Informationen
über die relativen Positionen einer den Tonsignalen (106) zugeordneten Tonquelle enthält.
17. Ansteuereinrichtung nach einem der Ansprüche 15 oder 16, bei der die Kombinationseinrichtung
(108) ausgebildet ist, um beim Kombinieren die Tonsignale (106) mit den geänderten
Impulsantworten zu falten.
18. Verfahren zum Benutzen eines Tonwiedergabesystems, das ausgebildet ist, um in einer
Wiedergabeumgebung (32; 70; 80; 90) einen räumlichen Toneindruck zu erzeugen, mit
folgenden Schritten:
graphisches Anzeigen von Impulsantworten (34; 74; 82a - 82h; 94a - 94e), die Raumrichtungen
der Wiedergabeumgebung (32; 70; 80; 90) zugeordnet sind, wobei die Impulsantworten
bezüglich der Wiedergabeumgebung in den Raumrichtungen dargestellt sind, denen sie
zugeordnet sind;
Ermöglichen einer Änderung der graphischen Anzeige der Impulsantworten (34; 74; 82a
- 82h; 94a - 94e) durch den Benutzer, wobei eine Änderung der graphischen Anzeige
der Impulsantworten (34; 74; 82a - 82h; 94a - 94e) an vorbestimmten Punkten ermöglicht
wird;
Empfangen einer Benutzeränderungseingabe, um geänderte Impulsantworten graphisch darzustellen;
und
Erfassen der geänderten Impulsantworten.
19. Verfahren zum Ansteuern eines Tonwiedergabesystems, mit den Schritten des Verfahrens
gemäß Patentanspruch 18 und mit folgendem zusätzlichen Schritt:
Liefern von Lautsprechersignalen für Lautsprecher einer Mehrzahl von an unterschiedlichen
räumlichen Positionen anbringbaren Lautsprechern basierend auf den geänderten Impulsantworten.
20. Computerprogramm mit einem Programmcode zum Ausführen des Verfahrens gemäß Patentanspruch
18 oder 19, wenn das Computerprogramm auf einem Rechner abläuft.
1. Graphic user interface (10) for a sound-reproduction system, which is formed so as
to generate in a reproduction environment (32; 70; 80; 90) a spatial sound impression,
comprising:
display means (12) for graphically displaying impulse responses (34; 74; 82a - 82h;
94a - 94e), which are associated with spatial directions of the reproduction environment
(32; 70; 80; 90), the impulse responses, relative to the reproduction environment,
being represented in the spatial directions they are allocated to;
means for allowing changing (14) the graphical display of the impulse responses (34;
74; 82a - 82h; 94a - 94e) by the user, a change of the graphical display of the impulse
responses (34; 74; 82a - 82h; 94a - 94e) being enabled at predetermined points;
means for receiving (16) a user input of a change, in order to graphically represent
changed impulse responses by the display means (12); and
means for detecting the changed impulse responses (18).
2. Graphic user interface according to claim 1, wherein the display means (12) is formed
so as to represent the impulse responses (74; 82a - 82h; 94a - 94e) as time-dependent
evolutions of an intensity value.
3. Graphic user interface according to claim 2, wherein the display means (12) is formed
so as to represent the time-dependent evolutions of the impulse responses (74; 82a
- 82h; 94a - 94e) such that same are divided into discrete time periods, an intensity
value being associated with each time period.
4. Graphic user interface according to one of the previous claims, wherein the display
means (.12) is formed so as to represent the impulse responses (82a - 82h) as a function
of the frequency.
5. Graphic user interface according to claim 4, wherein the display means (12) is formed
so as to represent the frequency evolutions of the impulse responses (74; 82a - 82h;
94a - 94e) such that same are divided into discrete frequency segments, an intensity
value being associated with each frequency segment.
6. Graphic user interface according to one of the previous claims, wherein the display
means (12) is formed so as to graphically represent the impulse responses (82a - 82h)
as functions of the time and as functions of the frequency in a three-dimensional
representation, the function values being represented as a height over a two-dimensional
surface, one side of which has the time as a measure and a second side of which following
the first side has the frequency as a measure.
7. Graphic user interface according to one of the previous claims, wherein the display
means (12) is formed so as to display in addition a graphical representation of the
reproduction environment (32; 70; 80; 90) in a three-dimensional representation, the
impulse responses (34; 74; 82a - 82h; 94a - 94e) regarding the reproduction environment
(32; 70; 80; 90) being represented in the spatial directions, which the impulse responses
(34; 74; 82a - 82h; 94a - 94e) are associated with.
8. Graphic user interface according to one of the previous claims, wherein the means
for allowing changing (14) the graphical display of the impulse responses (34; 74;
82a - 82h; 94a - 94e) is formed so as to allow changing the graphical representation
of the impulse responses (34; 74; 82a - 82h; 94a - 94e) at any arbitrary point of
the graphical representation of the impulse responses (34; 74; 82a - 82h; 94a - 94e).
9. Graphic user interface according to one of the previous claims, wherein the means
for allowing changing (14) the graphical display of the impulse responses (94a - 94e)
is formed so as to allow shifting the impulse responses (94a - 94e) in the time as
a change of the graphical display of the impulse responses (94a - 94e).
10. Graphic user interface according to one of the previous claims, wherein the means
for receiving a user input of a change (16) is formed so as to receive signals of
a computer mouse, a touch pad, a touch screen, a track ball or a keyboard.
11. Graphic user interface according to one of the previous claims, wherein the means
for detecting (18) the changed impulse responses is formed so as to scan, for detecting,
the changed impulse responses graphically represented and to store the scanned values
in a memory.
12. Graphic user interface according to one of the previous claims, wherein the display
means (12) is formed so as to graphically display impulse responses (74; 82a - 82h;
94a - 94e), which contain information about a space to be simulated.
13. Graphic user interface according to one of the previous claims, wherein the display
means (12) is formed so as to graphically display impulse responses (34), which contain
information about the position of a sound source (30) with respect to the reproduction
environment (32).
14. Controlling apparatus for a sound-reproduction system, which is formed so as to generate
a spatial sound impression in a reproduction environment, comprising:
a graphic user interface (10) according to any one of claims 1 to 13; and
a signal generator (102) for providing loudspeaker signals (110) for loudspeakers
of a plurality of loudspeakers that can be placed at different spatial positions.
15. Controlling apparatus according to claim 14, wherein the signal generator (102) has
combination means (108) for combining sound signals (106) with the changed impulse
responses, the sound signals (106) being intended for loudspeakers arranged at spatial
positions corresponding to the spatial directions, which the impulse responses are
associated with, in order to obtain loudspeaker signals (110), the combination means
(108) being formed so as to combine such that the loudspeaker signals (110) contain
the information about the space to be simulated.
16. Controlling apparatus according to claim 15, wherein the signal generator (102) has
combination means (108) for combining the sound signals (106) with the changed impulse
responses, in order to obtain a loudspeaker signal (110), the combination means (108)
being formed so as to combine such that the loudspeaker signals (110) contain the
information about the relative positions of a sound source associated with the sound
signals (106).
17. Controlling apparatus according to one of claims 15 or 16, wherein the combination
means (108) is formed so as to alias, during the combination, the sound signals (106)
with the changed impulse responses.
18. Method for using a sound-reproduction system, which is formed so as to generate a
spatial sound impression in a reproduction environment (32; 70; 80; 90), comprising:
graphically displaying impulse responses (34; 74; 82a - 82h; 94a - 94e) associated
with spatial directions of the reproduction environment (32; 70; 80; 90), the impulse
responses, relative to the reproduction environment, being represented in the spatial
directions they are allocated to;
allowing changing the graphical display of the impulse responses (34; 74; 82a - 82h;
94a - 94e) by the user, a change of the graphical display of the impulse responses
(34; 74; 82a - 82h; 94a - 94e) being enabled at predetermined points;
receiving a user input of a change, in order to graphically represent changed impulse
responses; and
detecting the changed impulse responses.
19. Method for controlling a sound-reproduction system, comprising the steps of the method
according to claim 18 and additionally comprising:
providing loudspeaker signals for a plurality of loudspeakers, which can be placed
at different spatial positions based on the changed impulse responses.
20. Computer program with a program code for performing the method according to claim
18 or 19 when the computer program is executed on a computer.
1. Interface graphique d'utilisateur (10) pour un système de reproduction sonore, réalisée
de manière à générer une impression sonore spatiale dans un environnement de reproduction
(32; 70; 80; 90), aux caractéristiques suivantes:
un moyen d'affichage (12) destiné à afficher graphiquement des réponses impulsionnelles
(34; 74; 82a à 82h; 94a à 94e) qui sont associées à des directions spatiales de l'environnement
de reproduction (32; 70; 80; 90), les réponses impulsionnelles étant représentées,
par rapport à l'environnement de reproduction, dans les directions spatiales auxquelles
elles sont associées;
un moyen destiné à permettre une modification (14) de l'affichage graphique des réponses
impulsionnelles (34; 74; 82a à 82h; 94a à 94e) par l'utilisateur, une modification
de l'affichage graphique des réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e)
étant rendue possible à des points prédéterminés;
un moyen destiné à recevoir (16) une entrée de modification par l'utilisateur, pour
représenter graphiquement des réponses impulsionnelles modifiées par le moyen d'affichage
(12); et
un moyen destiné à détecter les réponses impulsionnelles modifiées (18).
2. Interface graphique d'utilisateur selon la revendication 1, dans laquelle le moyen
d'affichage (12) est réalisé de manière à représenter les réponses impulsionnelles
(74; 82a à 82h; 94a à 94e) comme évolutions dans le temps d'une grandeur d'intensité.
3. Interface graphique d'utilisateur selon la revendication 2, dans laquelle le moyen
d'affichage (12) est réalisé de manière à représenter les évolutions dans le temps
des réponses impulsionnelles (74; 82a à 82h; 94a à 94e) de sorte qu'elles soient subdivisées
en segments de temps discrets, à chaque segment de temps étant associée une grandeur
d'intensité.
4. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans
laquelle le moyen d'affichage (12) est réalisé de manière à représenter les réponses
impulsionnelles (82a à 82h) graphiquement en fonction de la fréquence.
5. Interface graphique d'utilisateur selon la revendication 4, dans laquelle le moyen
d'affichage (12) est réalisé de manière à représenter les évolutions de fréquence
des réponses impulsionnelles (74; 82a à 82h; 94a à 94e) de sorte qu'elles soient subdivisées
en segments de fréquence discrets, à chaque segment de fréquence étant associée une
grandeur d'intensité.
6. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans
laquelle le moyen d'affichage (12) est réalisé de manière à représenter les réponses
impulsionnelles (82a à 82h) graphiquement en fonction du temps et en fonction de la
fréquence dans une représentation tridimensionnelle, les valeurs de fonction étant
représentées comme hauteur au-dessus d'une surface bidimensionnelle dont un premier
côté présente, comme mesure, le temps et dont un deuxième côté se raccordant au premier
côté présente, comme mesure, la fréquence.
7. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans
laquelle le moyen d'affichage (12) est réalisé de manière à afficher, en outre, une
représentation graphique de l'environnement de reproduction (32; 70; 80; 90) dans
une représentation tridimensionnelle, les réponses impulsionnelles (34; 74; 82a à
82h; 94a à 94e) étant représentées, par rapport à l'environnement de reproduction
(32; 70; 80; 90), dans les directions spatiales auxquelles sont associées les réponses
impulsionnelles (34; 74; 82a à 82h; 94a à 94e).
8. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans
laquelle le moyen destiné à permettre une modification (14) de l'affichage graphique
des réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e) est réalisé de manière
à permettre une modification de la représentation graphique des réponses impulsionnelles
(34; 74; 82a à 82h; 94a à 94e) en tout point quelconque de la représentation graphique
des réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e).
9. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans
laquelle le moyen destiné à permettre une modification (14) de l'affichage graphique
des réponses impulsionnelles (94a à 94e) est réalisé de manière à permettre, comme
modification de la représentation graphique des réponses impulsionnelles (94a à 94e),
un décalage des réponses impulsionnelles (94a à 94e) dans le temps.
10. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans
laquelle le moyen destiné à recevoir une entrée de modification par l'utilisateur
(16) est réalisé de manière à recevoir des signaux d'une souris d'ordinateur, d'un
touchpad, d'un écran tactile, d'un pointeur ou d'un clavier.
11. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans
laquelle le moyen destiné à détecter (18) les réponses impulsionnelles modifiées est
réalisé de manière à balayer, pour la détection, la réponse impulsionnelle modifiée
représentée graphiquement et à mémoriser les valeurs balayées dans une mémoire.
12. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans
laquelle le moyen d'affichage (12) est réalisé de manière à afficher graphiquement
des réponses impulsionnelles (74; 82a à 82h; 94a à 94e) qui contiennent des informations
sur un espace à simuler.
13. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans
laquelle le moyen d'affichage (12) est réalisé de manière à afficher graphiquement
des réponses impulsionnelles (34) qui contiennent des informations sur la position
d'une source sonore (30) par rapport à l'environnement de reproduction (32).
14. Dispositif d'activation d'un système de reproduction sonore, qui est réalisé de manière
à générer, dans un environnement de reproduction, une impression sonore spatiale,
aux caractéristiques suivantes:
une interface graphique d'utilisateur (10) selon l'une des revendications 1 à 13;
et
un générateur de signal (102) destiné à fournir des signaux de haut-parleur (110)
pour les haut-parleurs d'une pluralité de haut-parleurs pouvant être placés à des
positions spatiales différentes.
15. Dispositif d'activation selon la revendication 14, dans lequel le générateur de signal
(102) présente un moyen de combinaison (108) destiné à combiner des signaux sonores
(106) avec les réponses impulsionnelles modifiées, les signaux sonores (106) étant
prévus pour les hauts-parleurs qui sont disposés à des positions spatiales correspondant
aux directions spatiales auxquelles sont associées les réponses impulsionnelles, pour
obtenir des signaux de haut-parleur (110), le moyen de combinaison (108) étant réalisé
de manière à combiner de sorte que les signaux de haut-parleur (110) contiennent l'information
sur l'espace à simuler.
16. Dispositif d'activation selon la revendication 15, dans lequel le générateur de signal
(102) présente un moyen de combinaison (108) destiné à combiner des signaux sonores
(106) avec les réponses impulsionnelles modifiées, pour obtenir des signaux de haut-parleur
(110), le moyen de combinaison (108) étant réalisé de manière à combiner de sorte
que les signaux de haut-parleur (110) contiennent l'information sur les positions
relatives d'une source sonore associée aux signaux sonores (106).
17. Dispositif d'activation selon l'une des revendications 15 ou 16, dans lequel le moyen
de combinaison (108) est réalisé de manière à replier, lors de la combinaison, les
signaux sonores (106) avec les réponses impulsionnelles modifiées.
18. Procédé permettant d'utiliser un système de reproduction sonore, réalisé de manière
à générer, dans un environnement de reproduction (32; 70; 80; 90), une impression
sonore spatiale, aux étapes suivantes consistant à:
afficher graphiquement des réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e)
qui sont associées à des directions spatiales de l'environnement de reproduction (32;
70; 80; 90), les réponses impulsionnelles étant représentées, par rapport à l'environnement
de reproduction, dans les directions spatiales auxquelles elles sont associées;
permettre une modification de l'affichage graphique des réponses impulsionnelles (34;
74; 82a à 82h; 94a à 94e) par l'utilisateur, une modification de l'affichage graphique
des réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e) étant rendue possible
à des points prédéterminés;
recevoir une entrée de modification par l'utilisateur, pour représenter graphiquement
des réponses impulsionnelles modifiées; et
détecter les réponses impulsionnelles modifiées.
19. Procédé d'activation d'un système de reproduction sonore, aux étapes du procédé selon
la revendication 18 et à l'étape additionnelle suivante consistant à:
fournir des signaux de haut-parleur pour les haut-parleurs d'une pluralité de haut-parleurs
pouvant être placés à des positions spatiales différentes sur base des réponses impulsionnelles
modifiées.
20. Programme d'ordinateur avec un code de programme pour réaliser le procédé selon la
revendication 18 ou 19 lorsque le programme d'ordinateur est exécuté sur un ordinateur.