(19)
(11) EP 1 878 308 B1

(12) EUROPÄISCHE PATENTSCHRIFT

(45) Hinweis auf die Patenterteilung:
19.08.2009  Patentblatt  2009/34

(21) Anmeldenummer: 06742644.5

(22) Anmeldetag:  21.04.2006
(51) Internationale Patentklassifikation (IPC): 
H04S 7/00(2006.01)
(86) Internationale Anmeldenummer:
PCT/EP2006/003709
(87) Internationale Veröffentlichungsnummer:
WO 2006/117089 (09.11.2006 Gazette  2006/45)

(54)

VORRICHTUNG UND VERFAHREN ZUR GENERIERUNG UND BEARBEITUNG VON TONEFFEKTEN IN RÄUMLICHEN TONWIEDERGABESYSTEMEN MITTELS EINER GRAPHISCHEN BENUTZERSCHNITTSTELLE

DEVICE AND METHOD FOR GENERATION AND PROCESSING OF SOUND EFFECTS IN SPATIAL AUDIO REPRODUCTION SYSTEMS USING A GRAPHICAL USER INTERFACE

DISPOSITIF ET PROCEDE DE PRODUCTION ET DE TRAITEMENT D'EFFETS SONORES DANS DES SYSTEMES DE REPRODUCTION SONORE SPATIALE A L'AIDE D'UNE INTERFACE GRAPHIQUE D'UTILISATEUR


(84) Benannte Vertragsstaaten:
AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU LV MC NL PL PT RO SE SI SK TR

(30) Priorität: 04.05.2005 DE 102005021378
13.09.2005 DE 102005043641

(43) Veröffentlichungstag der Anmeldung:
16.01.2008  Patentblatt  2008/03

(73) Patentinhaber: Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
80686 München (DE)

(72) Erfinder:
  • MELCHIOR, Frank
    98693 Ilmenau (DE)
  • LANGHAMMER, Jan
    98693 Ilmenau (DE)

(74) Vertreter: Schoppe, Fritz et al
Schoppe, Zimmermann, Stöckeler & Zinkler Patentanwälte Postfach 246
82043 Pullach bei München
82043 Pullach bei München (DE)


(56) Entgegenhaltungen: : 
WO-A-20/04047485
GB-A- 2 357 409
   
  • ANONYMOUS: "Surround Verb: Surround reverb for Steinberg's Nuendo" INTERNET ARTICLE, [Online] 30. Mai 2004 (2004-05-30), XP002419472 Hamburg (DE) Gefunden im Internet: URL:http://web.archive.org/web/20040530131 057/http://www.tcelectronic.com/media/Surr oundVerb.pdf> [gefunden am 2007-02-08]
  • THEILE G, WITTEK H, REISINGER M: "POTENTIAL WAVEFIELD SYNTHESIS APPLICATIONS IN THE MULTICHANNEL STEREOPHONIC WORLD" PROCEEDINGS OF THE AES 24TH INTERNATIONAL CONFERENCE: MULTICHANNEL AUDIO, 26-28 JUNE 2003, 26. Februar 2004 (2004-02-26), Seiten 1-15, XP002419473 Gefunden im Internet: URL:http://pddocserv/specdocs/data/handboo ks/AES/Int-Cnf-Proc/2003BA06/00034.pdf> [gefunden am 2007-02-09]
   
Anmerkung: Innerhalb von neun Monaten nach der Bekanntmachung des Hinweises auf die Erteilung des europäischen Patents kann jedermann beim Europäischen Patentamt gegen das erteilte europäischen Patent Einspruch einlegen. Der Einspruch ist schriftlich einzureichen und zu begründen. Er gilt erst als eingelegt, wenn die Einspruchsgebühr entrichtet worden ist. (Art. 99(1) Europäisches Patentübereinkommen).


Beschreibung


[0001] Die vorliegende Erfindung bezieht sich auf moderne Audiotechnologien und insbesondere auf die Erzeugung und Bearbeitung von räumlichen Toneindrücken für Tonwiedergabesysteme.

[0002] In modernen Tonwiedergabesystemen kann durch den Einsatz von mehreren Lautsprechern erreicht werden, dass einzelne Tonquellen im Raum präzise geortet werden können und dass innerhalb der Wiedergabeumgebung der Eindruck erzeugt wird, man befände sich innerhalb eines simulierten Raumes, wie z. B. einem Stadium oder einer Kathedrale. Dabei kann man prinzipiell zwei unterschiedliche Wiedergabekonzepte unterscheiden. Bei der herkömmlichen auch im Homeentertainmentbereich üblichen Surroundwiedergabe wird die Ortungs- und Rauminformation bereits während des Tonmischvorgangs in einzelne, diskret zu übertragende Kanäle gemischt, wobei ein Wiedergabesystem aus mehreren Lautsprechern dazu verwendet wird, die einzelnen Kanäle wiederzugeben. Dabei sollten sich die wiedergebenden Lautsprecher an einer vorgegebenen Position relativ zur Wiedergabeumgebung befinden, um einen bestmöglichen Raumeindruck zu erzielen.

[0003] Fortgeschrittenere Systeme, wie die auf Wellenfeldsynthese basierenden Raumsimulationen, erzeugen die Ansteuersignale für die einzelnen Lautsprecher erst während der Wiedergabe, basierend auf einer Positionsinformation einer Tonquelle bezüglich des Wiedergaberaums und der Rauminformation einer zu simulierenden Wiedergabeumgebung. Dadurch lassen sich bezüglich der Ortung und des räumlichen Eindrucks wesentlich authentischere Ergebnisse erzielen, da hier während der Wiedergabe das individuelle Lautsprechersetup berücksichtigt werden kann, um in der Wiedergabeumgebung eine Wellenfront zu erzeugen, die den zu simulierenden Raumeindruck bestmöglich repräsentiert.

[0004] Nachfolgend wird zum besseren Verständnis der vorliegenden Erfindung auf die Wellenfeldsynthese-Technik näher eingegangen.

[0005] Ein besserer natürlicher Raumeindruck sowie eine stärkere Einhüllung bei der Audiowiedergabe kann mit Hilfe einer neuen Technologie erreicht werden. Die Grundlagen dieser Technologie, die so genannte Wellenfeldsynthese (WFS; WFS = Wave-Field Synthesis), wurden an der TU Delft erforscht und erstmals in den späten 80er-Jahren vorgestellt (Berkhout, A.J.; de Vries, D.; Vogel, P.: Acoustic control by Wave-field Synthesis. JASA 93, 1993).

[0006] Infolge der enormen Anforderungen dieser Methode an Rechnerleistung und Übertragungsraten wurde die Wellenfeldsynthese bis jetzt nur selten in der Praxis angewendet. Erst die Fortschritte in den Bereichen der Mikroprozessortechnik und der Audiocodierung gestatten heute den Einsatz dieser Technologie in konkreten Anwendungen.

[0007] Die Grundidee von WFS basiert auf der Anwendung des Huygens' schen Prinzips der Wellentheorie:

[0008] Jeder Punkt, der von einer Welle erfasst wird, ist Ausgangspunkt einer Elementarwelle, die sich kugelförmig bzw. kreisförmig ausbreitet.

[0009] Angewandt auf die Akustik kann durch eine große Anzahl von Lautsprechern, die nebeneinander angeordnet sind (einem so genannten Lautsprecherarray), jede beliebige Form einer einlaufenden Wellenfront nachgebildet werden. Im einfachsten Fall, einer einzelnen wiederzugebenden Punktquelle und einer linearen Anordnung der Lautsprecher, müssen die Audiosignale eines jeden Lautsprechers mit einer Zeitverzögerung und Amplitudenskalierung so gespeist werden, dass sich die abgestrahlten Klangfelder der einzelnen Lautsprecher richtig überlagern. Bei mehreren Schallquellen wird für jede Quelle der Beitrag zu jedem Lautsprecher getrennt berechnet und die resultierenden Signale addiert. Befinden sich die wiederzugebenden Quellen in einem virtuellen Raum mit reflektierenden Wänden, dann müssen auch Reflexionen als zusätzliche Quellen über das Lautsprecherarray wiedergegeben werden. Der Aufwand bei der Berechnung hängt daher stark von der Anzahl der Schallquellen, den Reflexionseigenschaften des Raums und der Anzahl der Lautsprecher ab.

[0010] Der Vorteil dieser Technik liegt im Besonderen darin, dass ein natürlicher räumlicher Klangeindruck über einen großen Bereich des Wiedergaberaums möglich ist. Im Gegensatz zu den bekannten Techniken werden Richtung und Entfernung von Schallquellen sehr exakt wiedergegeben. In beschränktem Maße können virtuelle Schallquellen sogar zwischen dem realen Lautsprecherarray und dem Hörer positioniert werden.

[0011] Die Wellenfeldsynthese ermöglicht somit eine korrekte Abbildung von virtuellen Schallquellen über einen großen Wiedergabebereich. Gleichzeitig bietet sie dem Tonmeister und Toningenieur neues technisches und kreatives Potential bei der Erstellung auch komplexer Klanglandschaften. Die Wellenfeldsynthese (WFS oder auch Schallfeldsynthese), wie sie Ende der 80-er Jahre an der TU Delft entwickelt wurde, stellt einen holographischen Ansatz der Schallwiedergabe dar. Als Grundlage hierfür dient das Kirchhoff-Helmholtz-Integral. Dieses besagt, dass beliebige Schallfelder innerhalb eines geschlossenen Volumens mittels einer Verteilung von Monopol- und Dipolschallquellen (Lautsprecherarrays) auf der Oberfläche dieses Volumens erzeugt werden können. Details hierzu finden sich in M.M. Boone, E.N.G. Verheijen, P.F. v. Tol, "Spatial Sound-Field Reproduction by Wave-Field Synthesis", Delft University of Technology Laboratory of Seismics and Acoustics, Journal of J. Audio Eng. Soc., Bd. 43, Nr. 12, Dezember 1995 und Diemer de Vries, "Sound Reinforcement by Wavefield Synthesis: Adaption of the Synthesis Operator to the Loudspeaker Directivity Characteristics", Delft University of Technology Laboratory of Seismics and Acoustics, Journal of J. Audio Eng. Soc., Bd. 44, Nr. 12, Dezember 1996.

[0012] Bei der Wellenfeldsynthese wird aus einem Audiosignal, das eine virtuelle Quelle an einer virtuellen Position aussendet, eine Synthesesignal für jeden Lautsprecher des Lautsprecherarrays berechnet, wobei die Synthesesignale derart hinsichtlich Amplitude und Phase gestaltet sind, dass eine Welle, die sich aus der Überlagerung der einzelnen durch die im Lautsprecherarray vorhandenen Lautsprecher ausgegebenen Schallwelle ergibt, der Welle entspricht, die von der virtuellen Quelle an der virtuellen Position herrühren würde, wenn diese virtuelle Quelle an der virtuellen Position eine reale Quelle mit einer realen Position wäre.

[0013] Typischerweise sind mehrere virtuelle Quellen an verschiedenen virtuellen Positionen vorhanden. Die Berechnung der Synthesesignale wird für jede virtuelle Quelle an jeder virtuellen Position durchgeführt, so dass typischerweise eine virtuelle Quelle in Synthesesignalen für mehrere Lautsprecher resultiert. Von einem Lautsprecher aus betrachtet empfängt dieser Lautsprecher somit mehrere Synthesesignale, die auf verschiedene virtuelle Quellen zurückgehen. Eine Überlagerung dieser Quellen, die aufgrund des linearen Superpositionsprinzips möglich ist, ergibt dann das von dem Lautsprecher tatsächlich ausgesendete Wiedergabesignal.

[0014] Die Möglichkeiten der Wellenfeldsynthese können um so besser ausgeschöpft werden, je geschlossener die Lautsprecherarrays sind, d. h. um so mehr einzelne Lautsprecher möglichst nah beieinander angeordnet werden können. Damit steigt jedoch auch die Rechenleistung, die eine Wellenfeldsyntheseeinheit vollbringen muss, da typischerweise auch Kanalinformationen berücksichtigt werden müssen. Dies bedeutet im einzelnen, dass von jeder virtuellen Quelle zu jedem Lautsprecher prinzipiell ein eigener Übertragungskanal vorhanden ist, und dass prinzipiell der Fall vorhanden sein kann, dass jede virtuelle Quelle zu einem Synthesesignal für jeden Lautsprecher führt, bzw. dass jeder Lautsprecher eine Anzahl von Synthesesignalen erhält, die gleich der Anzahl von virtuellen Quellen ist.

[0015] Darüber hinaus sei an dieser Stelle angemerkt, dass die Qualität der Audiowiedergabe mit der Anzahl der zur Verfügung gestellten Lautsprecher steigt. Dies bedeutet, dass die Audiowiedergabequalität um so besser und realistischer wird, um so mehr Lautsprecher in dem bzw. den Lautsprecherarrays vorhanden sind.

[0016] Räumliche Tonwiedergabesysteme wie die Wellenfeldsynthese ermöglichen es also, den Ton in 360 Grad um den Zuhörerraum mit optimaler räumlicher Auflösung zu generieren. Bisher wurden diese Systeme im Wesentlichen zum Positionieren von diskreten Schallquellen und zur Direktschallwiedergabe verwendet. Auf die Signale der so generierten Schallquellen lassen sich zusätzlich alle bekannten linearen Signalverarbeitungen anwenden, wie z. B das Hinzufügen von Nachhall. In räumlichen Tonwiedergabesystemen wie der Wellenfeldsynthese (WFS) ist es weiterhin möglich, räumliche Effekte basierend auf dem Direktschall zu generieren. Dies geschieht beispielsweise bei der Raumsimulation, bei der aus Gründen der Effizienz die Wiedergabe auf eine begrenzte Anzahl von Raumrichtungen (ebene Wellen) vereinfacht werden kann.

[0017] In einem sehr einfachen Fall der Raumsimulation werden gleiche Parameter zur Beschreibung des Raumes für alle Raumrichtungen verwendet (diffuser Nachhall) und richtungsabhängige Raumanteile (frühe Reflexionen) automatisiert generiert. Ein Erzeugen räumlicher Effekte ist nicht nur dann sinnvoll, wenn es um die Nachbildung natürlicher Raumeffekte geht, da die prinzipiellen Möglichkeiten dieser Art der Signalverarbeitung auch anderweitig kreativ genutzt werden können.

[0018] Bei der Wellenfeldsynthese wird ein zu beschallender Raum von möglichst vielen individuellen Lautsprechern beschallt, um die Rekonstruktion von Wellenfronten mit bestmöglicher Genauigkeit zu erlauben. Für die Ortbarkeit von Tonsignalen und die Erzeugung eines Raumeindrucks werden üblicherweise eine Vielzahl von Parametern herangezogen, die für jeden Lautsprecher während des Abmischens des Tonsignals individuell zu bestimmen sind.

[0019] Wie im Vorhergehenden beschrieben wurde, zeichnen sich die mehrkanaligen Tonwiedergabesysteme durch außerordentlich hohe Komplexität aus, so dass das zusätzliche Erzeugen einer Rauminformation bzw. der Ortungsinformation während des Abmischens des Tons bedingt, eine Vielzahl von Parametern zu erzeugen, die lautsprecherindividuell die Ortungsinformation bzw. zusätzliche lineare Signalverarbeitungsschritte (zum Erzeugen von akustischen Effekten) beschreiben. Diese Beschreibung anhand einer Vielzahl abstrakter mathematischer Parameter ohne unmittelbar intuitiv erfassbare Bedeutung ist insbesondere bei Wellenfeldsynthesesystemen schwer beherrschbar.

[0020] Beispielsweise bietet die Wellenfeldsynthese die Möglichkeit, Schallquellen auf einer zweidimensionalen Hörebene frei zu positionieren. Dies geschieht durch die Synthetisierung unterschiedlicher Wellenfronten abhängig von der Position der Schallquellen. Benutzeroberflächen, wie sie derzeit verwendet werden, verwenden zur Positionierung der Schallquelle einen Punkt in einer Aufsicht der zweidimensionalen Hörebene, wobei der Punkt die Position der Schallquelle repräsentiert. Da bei diesem Ansatz die räumliche Position der Schallquelle zwar hinreichend visualisiert wird, der klangliche Tiefeneindruck (Raumeindruck) jedoch prinzipiell in der Visualisierung nicht simultan darstellbar ist, kommt es zu Diskrepanzen zwischen der realen Wahrnehmung und der Darstellung, so dass nur in wenigen Ausnahmefällen ein visuelles Bild zur Verfügung gestellt wird, welches dem realen Klangeindruck entspricht oder einen Rückschluss auf diesen zulässt.

[0021] Für das Audio-Authoring System Nuendo der Firma Steinberg existiert ein Plug-in, bei dem zeitliche Echoverläufe für ein Signal graphisch dargestellt werden, wenn Echoparameter des Echoverlaufs als Zahlenwerte eingegeben werden. Der E-choverlauf kann dabei teilweise für drei unterschiedliche Frequenzbereiche individuell beeinflusst werden.

[0022] Die internationale Patentanmeldung WO 2004/047485 A1 beschreibt ein Audiowiedergabesystem, das auf der Wellenfeldsynthese basiert und befasst sich dabei insbesondere mit einer möglichen Modularisierung des Wellenfeldsynthesesystems, um dieses sukzessive an sich verändernde Wiedergabeumgebungen anpassen zu können.

[0023] Die Autoren Theile G., Wittek H., Reisinger M. beschreiben in "Potential Wavefield Synthesis Applications in the Multichannel Stereophonic World", Processings of the AES 24th International Conference: Multichannel Audio, 26-28 June 2003, unterschiedliche Verfahren der Reproduktion von Audiosignalen unter Beibehaltung des räumlichen Höreindrucks. Insbesondere werden das Wellenfeldsyntheseverfahren und die diesem Verfahren zugrunde liegenden Parameter beschrieben.

[0024] Die Aufgabe der vorliegenden Erfindung besteht darin, eine graphische Benutzerschnittstelle zu schaffen, die es erlaubt, ein Tonwiedergabesystem zur Erzeugung eines räumlichen Toneindrucks effizienter zu steuern.

[0025] Diese Aufgabe wird durch eine Vorrichtung gemäß Anspruch 1 oder 20 sowie durch ein Verfahren gemäß Anspruch 25 oder 26 gelöst.

[0026] Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, dass ein Tonwiedergabesystem, das in einer Wiedergabeumgebung einen räumlichen Toneindruck erzeugen kann, effizient und intuitiv mittels einer graphischen Benutzerschnittstelle gesteuert werden kann, wenn eine einer Raumrichtung bezüglich der Wiedergabeumgebung zugeordnete Impulsantwort bzw. eine aus der Impulsantwort gewonnene graphische Repräsentation graphisch dargestellt wird, und wenn die Möglichkeit geschaffen wird, dass ein Benutzer diese Darstellung graphisch verändern kann, so dass basierend auf der Benutzeränderungseingabe die geänderte Impulsantwort graphisch dargestellt sowie die geänderte graphische Darstellung erfasst werden kann, um das Tonwiedergabesystem anzusteuern.Da es systemtheoretisch möglich ist, alle bekannten linearen Signalverarbeitungen durch Impulsantworten zu beschreiben, ist es mit der erfindungsgemäßen graphischen Benutzerschnittstelle möglich, einem Tongestalter über eine graphische Repräsentierung einen intuitiven Zugriff auf richtungsabhängige Klangeffekte zu geben, um somit die Effizienz und die Qualität bei der Steuerung des Tonwiedergabesystems zu erhöhen.

[0027] Durch Faltung eines ursprünglichen Signals mit Impulsantworten lassen sich alle linearen Signalverarbeitungsalgorithmen darstellen. Als Beispiel können so bei einer auf Wellenfeldsynthese basierenden Raumsimulation die Signale für ebene Wellen durch Faltung mit entsprechenden Raumimpulsantworten, die korrespondierenden Raumrichtungen zugeordnet sind, erzeugt werden. Damit können auch Räume nachgebildet werden, wobei die verwendeten Impulsantworten erfindungsgemäß neben einer Beschreibung durch die ihnen zugrundeliegenden Parameter auch direkt visualisiert werden. Das erfindungsgemäße neue Werkzeug zur Tongestaltung besteht aus eine simultanen Visualisierung aller richtungsabhängigen Impulsantworten korrespondierend zu einer Quelle. Die Klanggestaltung findet durch direkte Interaktion mit dieser Visualisierung statt. Die Bearbeitung der visuellen Darstellung wird in eine parametrische Beschreibung umgerechnet und aus dieser werden die zugehörigen Impulsantworten generiert.

[0028] Die Richtungsinformation bzw. eine Räumlichkeit wird einem Tonsignal also durch eine mathematische Faltung mit einer Impulsantwort eingeprägt, was zum besseren Verständnis des Erfindungsgedankens im Folgenden kurz erläutert wird.

[0029] Einem Tonsignal f(y) wird ein Raumeindruck oder Reflexionsmuster bzw. eine Ortungsinformation durch Faltung mit einer Impulsantwort g(x) eingeprägt, so dass sich das kombinierte Tonsignal F(x) gemäß folgendem Faltungsintegral ergibt:



[0030] Die Impulsantwort g(x) beschreibt allgemein die Antwort eines Systems auf einen Diracimpuls δ(x), also einen Impuls infinitesimaler Länge für den gilt:



[0031] Das heißt also, ein idealer Diracimpuls zeichnet sich durch eine infinitesimale Länge aus und zusätzlich dadurch, dass sein Integral, wie oben beschrieben, endlich ist. Im Falle eines Tonsignals bedeutet dies, dass ein Diracpuls beliebig klein ist, jedoch feste akustische Energie trägt.

[0032] Testet man einen Raum mit einem Diracpuls, so erhält man als einfachste Impulsantwort wiederum einen Diracpuls, der mit einer Laufzeitverzögerung t zum Aussenden des Testpulses am Ort des Aussendens des Testpulses registriert wird. Dies ist genau dann der Fall, wenn in der Richtung, in die der Testpuls emittiert wurde, ein idealer Reflektor befindlich ist, der das akustische Testsignal ohne Dämpfung reflektiert, wobei die Laufzeit zwischen dem Ort des Aussendens der Quelle und dem Reflektor dann genau t/2 beträgt.

[0033] Es sei hier bemerkt, dass es in der Realität unmöglich ist, einen idealen Diracpuls zu erzeugen, stattdessen werden von jetzt an auch Pulse, deren Breite endlich ist und deren Intensität A beträgt, als Diracpulse bezeichnet.

[0034] Anschaulich kann man sich solche realen Impulse beispielsweise aus gaussförmige Kurven geringer Breite mit Flächeninhalt A vorstellen.

[0035] Würde der oben beschriebene Reflektor einen Teil der akustischen Energie absorbieren, das Testsignal also dämpfen, so würde der nach Laufzeit t empfangene, reflektierte Diracpuls eine geringere Fläche B unter der Kurve aufweisen als der ursprüngliche Puls (B < A).

[0036] Neben den bislang beschriebenen, idealisierten einfachen Fällen einer Impulsantwort ist es ferner möglich, beliebig komplexe Impulsantworten zu erhalten. Befinden sich beispielsweise zwei Reflektoren in voneinander unterschiedlichen Entfernungen, die den akustischen Laufzeiten t1 und t2 entsprechen, zum Ort des Aussendens des Testsignals, so wird die Impulsantwort aus zwei zu den Zeitpunkten 2*t1 und 2*t2 empfangenen Diracpulsen bestehen. Normalerweise sind akustische Szenen sehr komplex, so dass eine reale Impulsantwort eine mit der Zeit dichter werdende Pulsfolge sein wird, die mit frühen Reflexionen beginnt, und deren zeitlich später eintreffenden Komponenten beispielsweise einen Nachhall beschreiben.

[0037] Wie oben erläutert beschreibt eine Impulsantwort in Form eines Diracpulses ein Delay bzw. ein Echo. Ebenso lässt sich beispielsweise ein Mehrfachecho durch eine Summe von diracförmigen Pulsen darstellen. Zur realistischen Raumsimulation wird im Allgemeinen die Impulsantwort, die mit dem Tonsignal gefaltet wird, kontinuierlich sein, z. B. ein zum Zeitpunkt t0 stark ansteigendes und dann sanft ausklingendes Signal, das eine Mehrfachreflexion beschreibt, wobei die zu späteren Zeitpunkten reflektierten Signale stärker gedämpft sind.

[0038] In realen Szenarien werden Tonsignale zusätzlich frequenzselektiv gedämpft, beispielsweise werden hohe Tonsignale von Teppichen und Wandbehängen stärker gedämpft als tiefe Tonsignale. Um diesem Sachverhalt gerecht zu werden, können beispielsweise für mehrere Frequenzbereiche getrennt unterschiedliche Impulsantworten verwendet und visualisiert werden oder muss die Visualisierung der Impulsantwort den Zeit- und Frequenzbereich umfassen.

[0039] In einem weiteren Ausführungsbeispiel der vorliegenden Erfindung wird die graphische Benutzerschnittstelle dazu verwendet, die räumliche Position einer Tonquelle relativ zum Tonwiedergabesystem darzustellen, und die daraus resultierenden Impulsantworten, die für jeden Lautsprecher eines Wiedergabesystems individuell die räumliche Orientierung des Tonsignals bezüglich des wiedergebenden Lautsprechers darstellen, zu visualisieren.

[0040] Dabei kann der Benutzer auf anschauliche Art und Weise die Position der Quelle bezüglich der Wiedergabeumgebung graphisch verändern, wobei sich aus der dargestellten Wellenfront der punktförmigen akustischen Signalquelle automatisch die lautsprecherindividuelle Impulsantwort bzw. die Parameter zur Ansteuerung der Lautsprecher ergeben. Ein Toningenieur hat somit die Möglichkeit, auf intuitive Art und Weise die komplexen Parameter, die zur Steuerung des Tonwiedergabesystems von Nöten sind, zu erzeugen.

[0041] Dabei ist ein wesentlicher Aspekt, dass zusätzlich die Möglichkeit geschaffen wird, durch graphische Interaktion mit der Benutzerschnittstelle die Impulsantworten direkt zu verändern, wobei unmittelbar dargestellt wird, wie sich die aktuelle Änderung auf die Wahrnehmung der Position der Tonquelle auswirkt. Mit der erfindungsgemäßen graphischen Benutzerschnittstelle hat man also vorteilhafterweise die Wahl, ob man von der physikalischen Realität ausgehend die Tonquelle direkt platzieren will oder ob man die Möglichkeiten der Veränderung der Impulsantwort kreativ nutzen möchte. Im letzteren Fall erhält man dabei zusätzlich eine Abschätzung, wie die manuelle Änderung der Impulsantworten in der Wahrnehmung eines Zuhörers interpretiert wird. Ein Toningenieur kann also zwischen zwei Möglichkeiten der visuellen Klangbearbeitung wählen und dabei den Ansatz verfolgen, der für das gewünschte klangliche Ergebnis bzw. den räumlichen Toneindruck, den es zu erzielen gilt, am vorteilhaftesten ist.

[0042] In einem weiteren Ausführungsbeispiel der vorliegenden Erfindung wird die erfindungsgemäße graphische Benutzerschnittstelle genutzt, um Impulsantworten, die Informationen über einen zu simulierenden Raum beinhalten, darzustellen. Dabei werden von der Anzeigeeinrichtung die Impulsantworten bezüglich eines festen Punktes innerhalb der Wiedergabeumgebung in den Raumrichtungen dargestellt, für die sie auch die Rauminformationen tragen.

[0043] Von der Anzeigeeinrichtung werden also simultan alle für den räumlichen Gesamteindruck relevanten Daten (Impulsantworten) dargestellt, wobei sie als dreidimensionales Abbild der Umgebung visualisiert werden. Ein Benutzer hat also den Vorteil, dass er sämtliche Informationen, die den räumlichen Klangeindruck betreffen, zeitgleich dargestellt bekommt bzw. dass er diese simultan verändern kann, wobei zu jedem Zeitpunkt der durch eine Veränderung entstandene veränderte räumliche Klangeindruck dargestellt wird und beurteilt werden kann.

[0044] Dadurch wird es ermöglicht, auf intuitive Art und Weise einen Klangeindruck mit Nachhall bzw. gewünschten Dämpfungen und anderen Signalmanipulationen zu erzielen, ohne die den Impulsantworten zugrundeliegenden Parameter manuell verändern zu müssen, was ein erhebliches Maß an Abstraktion erfordert.

[0045] Die graphische Darstellung erlaubt es ferner, den Designprozess losgelöst von technischen Rahmenbedingungen durchzuführen. So wird im Allgemeinen eine Impulsantwortfunktion diskret abgespeichert sein, d. h. für diskrete Zeitabschnitte existiert ein zugeordneter Amplitudenwert. Bei der intuitiven Bedienung der graphischen Benutzerschnittstelle muss darauf keine Rücksicht genommen werden, da die relevanten Parameter basierend auf einer graphischen Änderung der angezeigten Impulsantwort automatisch erzeugt werden.

[0046] Ein weiterer Vorteil besteht darin, dass die Komplexität eines Systems leicht erhöht werden kann, ohne dass die Intuitivität der Bedienung unter der erhöhten Anzahl von Parametern verringert wird.

[0047] In einem weiteren Ausführungsbeispiel der vorliegenden Erfindung wird es ermöglicht, die Impulsantworten mehrere Raumrichtungen betreffend frequenzselektiv darzustellen bzw. zu bearbeiten. Dadurch wird es möglich, die Natürlichkeit des Raumeindrucks weiter zu erhöhen, indem man beispielsweise für unterschiedliche Raumrichtungen verschiedene frequenzabhängige Dämpfungsprofile annimmt, was die Authentizität des erzielten Klangeindrucks einerseits erhöht, andererseits jedoch die Komplexität der Erzeugung der Parameter ebenfalls ansteigen lässt. In der visuellen Darstellung ist es dabei dennoch möglich, das erzielbare Klangerlebnis vorherzusagen, und dieses darüber hinaus kreativ zu verändern, indem beispielsweise bei einer bestimmten Frequenz für eine frei wählbare Raumrichtung eine starke künstliche Dämpfung eingeführt wird. Diese Änderungen sind sofort sichtbar und es ist möglich, im Kontext des Gesamtsystems den Einfluss auf das gesamte Klanggeschehen zuverlässig vorauszusagen.

[0048] In einem einfachen Beispiel können gleiche Parameter zur Beschreibung des Raumes für alle Raumrichtungen verwendet werden, was einem diffusen Nachhall entspricht. Richtungsabhängige Raumanteile (frühe Reflexionen) werden erst im Anschluss daran angebracht. Daraus entsteht für jede Raumrichtung eine spezifische Raumimpulsantwort, eine ungewünschte Abweichung der Parameter für eine Raumrichtung kann sofort erkannt und korrigiert werden.

[0049] Ein weiterer Vorteil der erfindungsgemäßen dreidimensionalen Darstellung ist, dass die frequenzselektive Impulsantwortdarstellung für jede Richtung durch einfaches Abtasten leicht in eine Matrixdarstellung überführt werden kann, deren weitere Verarbeitung außerordentlich effizient möglich ist.

[0050] Bei einem weiteren Ausführungsbeispiel der vorliegenden Erfindung werden für eine vorgegebene Anzahl von Raumrichtungen individuell Delayzeiten eingestellt, wobei die Delayzeiten als diracförmige Impulsantworten dargestellt werden. Diese sind bezüglich eines festen Punktes in der Wiedergabeumgebung in einer dreidimensionalen Ansicht dargestellt sind. Dabei ist besonders vorteilhaft, dass die graphische Manipulation, die das Verschieben der diracförmigen Impulsantworten bezüglich eines Referenzpunktes erlaubt, unmittelbar den räumlichen Effekt visuell widerspiegelt. Die einem Delay entsprechenden diracförmigen Impulsantworten beschreiben gerade eine Reflexion an einem Gegenstand, wobei das Vergrößern des Abstands der Impulsantwort bezüglich des Referenzpunktes in der graphischen Darstellung einem Vergrößern der Laufzeit des reflektierten Signals entspricht. Durch die unmittelbare Entsprechung der graphischen Darstellung zur simulierten Realität können somit auf effizienteste Art und Weise beispielsweise Räume simuliert werden, innerhalb derer sich die Wiedergabeumgebung befindet.

[0051] Ein besonderer Vorteil dieser vereinfachten Art der Raumgestaltung ist die hohe Intuitivität der Darstellung und die damit verbundene reduzierte Fehlerwahrscheinlichkeit bei der Steuerung eines Tonwiedergabesystems.

[0052] Bei einem weiteren Ausführungsbeispiel der vorliegenden Erfindung wird die graphische Benutzerschnittstelle für ein Tonwiedergabesystem mit einem Signalgenerator betrieben, der Lautsprechersignale für eine Mehrzahl von an unterschiedlichen räumlichen Positionen angebrachte Lautsprecher erzeugt. Die hohe Intuitivität und Benutzerfreundlichkeit der graphischen Benutzerschnittstelle macht es dabei möglich, die Wiedergabe von Signalquellen auch in Echtzeit so zu manipulieren, dass die akustische Ortbarkeit eines Tonsignals, beispielsweise eines Sängers auf der Bühne, mit dem optischen Eindruck übereinstimmt. In diesem Fall ist lediglich ein Nachführen der bewegten Tonquelle innerhalb der erfindungsgemäßen graphischen Benutzeroberfläche notwendig, was mittels klassischer Parametereingabe für ein zu steuerndes Lautsprechersystem nicht realisierbar wäre.

[0053] Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen näher erläutert. Es zeigen:
Fig. 1
ein Blockschaltbild zur Erläuterung der Funkti- onsweise der graphischen Benutzerschnittstelle;
Fig. 2
Blockschaltbild zum Festlegen und Bearbeiten der Position von Schallquellen;
Fig. 3a
ein Beispiel für eine graphische Benutzerschnitt- stelle zum Bearbeiten von Impulsantworten der Pa- rameter, die den Ort einer Schallquelle beschrei- ben;
Fig. 3b
ein weiteres Beispiel für eine graphische Benut- zerschnittstelle
Fig. 4
Hinzufügen eines räumlichen Klangeindrucks für zu einer Tonquelle;
Fig. 5
Hinzufügen eines räumlichen Klangeindrucks zu einzelnen Lautsprechersignalen;
Fig. 6
eine graphische Benutzerschnittstelle zum Anzei- gen und Ändern von Impulsantworten;
Fig. 7
eine graphische Benutzerschnittstelle zum Anzei- gen und Verändern von frequenzselektiven Impuls- antworten;
Fig. 8
eine graphische Benutzerschnittstelle zum Anzei- gen und Ändern von Zeitverzögerungen für ver- schiedene Raumrichtungen; und
Fig. 9
ein System zum Ansteuern eines Tonwiedergabesys- tems mit einer graphischen Benutzeroberfläche.


[0054] Fig. 1 zeigt in einem Blockschaltbild die Funktionsweise einer erfindungsgemäßen graphischen Benutzerschnittstelle 10, die eine Anzeigeeinrichtung 12 zum graphischen Anzeigen einer Impulsantwort, eine Einrichtung zum Ermöglichen einer Änderung der graphischen Anzeige 14, eine Einrichtung zum Empfangen einer Benutzeränderungseingabe 16 und eine Einrichtung zum Erfassen der geänderten Impulsantwort 18 aufweist.

[0055] Die Anzeigeeinrichtung 12 stellt die Impulsantworten für den Benutzer graphisch aufbereitet so dar, dass die Auswirkungen einer Veränderung der dargestellten Impulsantworten intuitiv interpretiert und vorhergesagt werden können.

[0056] Die Einrichtung zum Ermöglichen der Änderung der graphischen Anzeige 14 hat dabei Zugriff auf die Anzeigeeinrichtung 12 und die von ihr visualisierten Daten.

[0057] Um eine Änderung der Impulsantworten zu ermöglichen, ist eine Benutzereingabe erforderlich, die von der Einrichtung zum Empfangen einer Benutzeränderungseingabe 16 empfangen wird, wobei die Änderung beispielsweise mittels einer Computer-Maus, eines Touchpads oder Interaktions- und Visualisierungstechniken aus Systemen für virtuelle Realität geschehen kann.

[0058] Basierend auf der Benutzeränderungseingabe kann nun von der Anzeigeeinrichtung 12 eine geänderte Impulsantwort graphisch dargestellt.

[0059] Durch das Zusammenspiel der Anzeigeeinrichtung 12, der Einrichtung zum Ermöglichen einer Änderung 14 und der Einrichtung zum Empfangen einer Benutzeränderungseingabe 16 wird ein iteratives Änderungsverfahren aus Benutzereingabe und darauf folgender graphischer Aktualisierung möglich. Dies hat den großen Vorteil, dass die Auswirkung einer Benutzeränderung unmittelbar graphisch oder akustisch kontrolliert werden kann. Ein explizites Durchführen der Änderungen und eine anschließende Kontrolle durch Testhören innerhalb eines Tonwiedergabesystems kann dadurch entfallen, was erheblich zur Kosten- und Zeitersparnis beiträgt.

[0060] Von der Einrichtung zum Erfassen der geänderten Impulsantwort 18 wird die modifizierte Impulsantwort erfasst und beispielsweise zur weiteren Verwendung gespeichert. Die Möglichkeit, die Impulsantwort zu speichern, kann vorteilhafterweise dazu genutzt werden, eine bereits einmal erzeugte Impulsantwort, die einen speziellen zu simulierenden Raum beschreibt, für weitere Projekte wieder zu verwenden.

[0061] Es ist zu bemerken, dass verschiedene Möglichkeiten denkbar sind, Impulsantworten zu visualisieren. Die einfachste Möglichkeit ist, die Impulsantworten entsprechend ihrer Richtung um den Mittelpunkt eines Wiedergabesystems anzuordnen. In dem daraus entstehenden, dargestellten "Gebirge" können frequenzunabhängige Bearbeitungen der Amplitudenverläufe der Impulsantworten vorgenommen werden. Für Beispiele von Visualisierungsmethoden wird auf die folgenden Figuren verwiesen, in denen die folgenden vier Varianten der Visualisierung beschrieben werden:
  • Wellenfeldsynthese Punktquelle
  • Impulsantwort-Zeit Darstellung
  • Impulsantwort-Zeit-Frequenz Darstellung
  • Multitapdelay


[0062] Fig. 2 zeigt schematisch, wie es anhand der in Fig. 3a oder 3b gezeigten Visualisierung der graphischen Benutzerschnittstelle möglich ist, die Position einer Tonquelle mittels einer erfindungsgemäßen graphischen Benutzerschnittstelle festzulegen oder eine bestehende Position so zu verändern, dass ein gewünschter Positionseindruck entsteht.

[0063] Im Positionierungsschritt 20 wird dabei zunächst die Position einer Tonquelle relativ zur Wiedergabeumgebung graphisch festgelegt.

[0064] Die graphische Benutzerschnittstelle stellt im zweiten Schritt 22 die die Position der Tonquelle repräsentierenden Impulsantworten graphisch dar, welche vom Benutzer direkt verändert werden können.

[0065] Dabei ist zu bemerken, dass, wie es im Folgenden anhand von Fig. 3a oder 3b zu sehen sein wird, sowohl die Position der Quelle variiert, als auch der Verlauf der errechneten Impulsantworten direkt manipuliert werden kann. Dies ermöglicht es zusätzlich, kreative Toneffekte zu implementieren, welche nicht unmittelbar mit einer "realen" Ortsinformation verknüpft sein müssen.

[0066] Fig. 3a oder 3b zeigt eine Ausführungsform einer erfindungsgemäßen graphischen Benutzerschnittstelle zum Festlegen der räumlichen Position einer Tonquelle bzw. zum Ändern der die Tonquelle repräsentierenden Impulsantworten.

[0067] Dargestellt ist eine punktförmige Schallquelle 30 in Form einer Kugel, eine Wiedergabeumgebung 32 und eine zur Punktquelle korrespondierende Wellenfront 34.

[0068] Die Position der Kugel beschreibt die Position der Schallquelle 30 im Raum. Basierend auf der Position der Punktquelle 30 wird die Wellenfront 34 dargestellt, die sich aus der Schallabstrahlung der punktförmigen Signalquelle ergibt. Wird beispielsweise die Punktquelle 30 zu einem Punkt im Raum bewegt, der weiter von der Wiedergabeumgebung 32 entfernt ist, so wird die Wellenfront 34 flacher. Wird die Punktquelle 30 näher an das Lautsprechersystem heran bewegt, dann wird die entsprechende Wellenfront stärker gekrümmt sein.

[0069] Erfindungsgemäß lässt sich die Krümmung der Wellenfront auch direkt mit Hilfe von zwei Anfassern 36a und 36b verändern. Dies wirkt sich unmittelbar auf die wahrgenommene Position der Punktquelle 30 aus, was von der erfindungsgemäßen graphischen Benutzerschnittstelle automatisch dargestellt wird.

[0070] Die graphische Benutzerschnittstelle in Fig. 3a oder 3b zeigt ferner einen Verzögerungsradius 38, der dazu dient, akausale Zustände bei der Wiedergabe eines auf Wellenfeldsynthese basierenden Systems zu vermeiden wobei die Position der Wellenfront 34 durch den Verzögerungsradius bestimmt wird. Der Verzögerungsradius 38 entspricht dabei einer Grundverzögerung, die ein Wellenfeldsynthesesystem benötigt, und die der Entfernung des am weitesten vom Mittelpunkt des Systems entfernten Lautsprechers entspricht. Durch die Grundverzögerung wird es möglich, Quellen beliebig innerhalb und außerhalb des Lautsprechersystems/Rekonstruktions-gebiets bzw. der Wiedergabeumgebung 32 zu positionieren.

[0071] Wie es Fig. 3a oder 3b zeigt, wird die Position der Wellenfront durch den Schnittpunkt der Verbindungslinie zwischen Systemmittelpunkt und Position der Schallquelle 30 mit dem Verzögerungsradius definiert. Die so bestimmte Position der Wellenfront 34 ist somit gleichbedeutend mit einer verschwindenden Verzögerung, da der Verzögerungsradius 38 ja gerade die minimal einzuhaltende Verzögerungszeit bestimmt. Mit der erfindungsgemäßen graphischen Benutzerschnittstelle ist es möglich, eine Schallquelle beliebig zu positionieren und deren Wellenfront bzw. die die Wellenfront repräsentierende Impulsantwort zu verändern.

[0072] Bezüglich der Laufzeitverzögerungen ist zu bemerken, dass es bei der eines realen Schallfeldes abhängig von der Entfernung der Schallquelle zum Abhörraum zu einer realen Signallaufzeit kommt. Diese bestimmt sich durch den Abstand zwischen der Schallquellenposition und dem Mittelpunkt des Wiedergabesystems. Bei der Erstellung von imaginären auditiven Szenen ist diese Laufzeit in der Regel nicht erwünscht, da sie die Positionierungsmöglichkeiten der Quellen einschränkt, da dadurch beispielsweise zeitliche Zusammenhänge bei einer Musikaufnahme verändert werden können. Diese Verzögerung kann daher in Wellenfeldsynthesesystemen deaktiviert werden, was für einen authentischen Klangeindruck erforderlich sein kann. Dieser wichtige zusätzliche Parameter wird in der erfindungsgemäßen graphischen Benutzerschnittstelle als Kreis 40 dargestellt, wobei die Position des Kreises 40 auf der Verbindungslinie zwischen dem Systemmittelpunkt und der Schallquelle 30 die eingestellte Verzögerungszeit visualisiert.

[0073] Im in Fig. 3a oder 3b gezeigten Fall befindet sich der Kreis 40 direkt an der Grenze des Verzögerungsradius 38, die dargestellte Laufzeit hat ihren minimal möglichen Wert, welcher der Grundverzögerung des Wellenfeldsynthesesystems entspricht. Soll der Fall einer realen Schalllaufzeit/Verzögerung nachgebildet werden, würde die Position des Kreises 40 direkt unterhalb der die Schallquelle 30 repräsentierenden Kugel befindlich sein, wobei selbstverständlich sämtliche Zwischenwerte zusätzlich dar- und einstellbar sind. Mittels der erfindungsgemäßen graphischen Benutzeroberfläche lassen sich also auch die wichtigen Delayzeitparameter intuitiv einstellen und verändern, was die gestalterische Freiheit weiter erhöht und darüber hinaus die Effizienz des Designvorganges bei der räumliche Tonwiedergabe steigert.

[0074] Die erfindungsgemäße graphische Benutzerschnittstelle hat zusätzlich den Vorteil einer äußerst großen Flexibilität, so dass weitere Parameter leicht hinzugefügt werden können, beispielsweise könnte die Fläche des Kreises 40 ein Verhältnis von Diffusschall zu Direktschall beschreiben, was von einem Zuhörer als weiteres Merkmal für die Entfernung einer Schallquelle zur Abhörposition aufgefasst wird, wobei das Ändern dieses Verhältnisses beispielsweise durch ein Verschieben des Kreises 40 bzw. das Ändern seiner Fläche implementiert werden könnte.

[0075] Entsprechend der Position einer virtuellen Schallquelle S gegenüber den einzelnen Lautsprecherpositionen L1..n berechnet der Wellenfeldsynthesealgorithmus die Impulsantwort IRL1..Ln für jeden beteiligten Lautsprecher (Amplitude, Verzögerung). Betrachtet man zu einem Zeitpunkt t diese Impulsantworten nebeneinander aufgereiht, so ergeben die Peaks eine abgetastete Version der von der virtuellen Schallquelle ausgehenden Wellenfront. In einem weiteren graphischen Verarbeitungsschritt (siehe Fig. 3a) kann daraus die Wellenfront vereinfacht dargestellt und mit Interaktionselementen dargestellt werden. Interagiert der Nutzer nun mit diesen Elementen, so verändert sich die graphische Darstellung der Wellenfront. Diese Darstellungsänderung kann im nächsten Schritt auf die einzelnen Impulsantworten IRL1..Ln aufgeprägt werden

[0076] Allgemein gesagt wird durch das graphische Benutzerinterface die Manipulation von Impulsantworten ermöglicht, die für jeden einzelnen Lautsprecher, der das Wiedergabevolumen 32 beschallt, vorzugsweise zu berechnen sind.

[0077] Bei dem in Fig. 3b gezeigten Ausführungsbeispiel wird durch das graphische Benutzerinterface die Manipulation von Impulsantworten ermöglicht, die für jeden einzelnen Lautsprecher, der das Wiedergabevolumen 32 beschallt, zu berechnen sind. Die Darstellung der Impulsantworten ergibt sich dabei direkt aus der Darstellung der graphischen Benutzerschnittstelle, wozu exemplarisch eine Verbindungslinie 42 zwischen der Tonquelle 30 und einem gedachten Lautsprecher am Rand des Wiedergabevolumens 32 dargestellt ist. Die zu berechnende Impulsantwort ist dabei unmittelbar durch die Form der Wellenfront an dem Ort gegeben, an dem die Verbindungslinie 42 die Wellenfront 34 schneidet. Die räumliche Position einer Tonquelle 30 wird, wie es in Fig. 3a oder 3b zu sehen ist, für jeden einzelnen Lautsprecher in eine Zeitverzögerung und eine Amplitude übersetzt. Die Amplitude ergibt sich dabei unmittelbar aus der Höhe der graphischen Repräsentierung der Wellenfront 34, wobei die Zeitverzögerung ebenfalls durch den Schnittpunkt der Geraden 42 mit der Wellenfront 34 bestimmt ist, wobei für die Bestimmung der Zeitverzögerung die Länge der geschnittenen Teilstücke der Geraden 42 maßgeblich ist.

[0078] Alternativ zu den bereits beschriebenen Manipulationsformen, die in der graphischen Benutzerschnittstelle implementiert sind, ist eine Reihe weiterer alternativer Szenarien leicht implementierbar.

[0079] So wird z. B. die Wellenfrontdarstellung 34 in der Abbildung durch zwei Kugeln bzw. Anfasser 36a und 36b begrenzt. Die Manipulation der Wellenfront an diesen Punkten wirkt sich letztendlich auf die Delays bzw. die Zeitverzögerungen der an der Synthese beteiligten Lautsprecher des Wellenfeldsynthesesystems aus. Weitere Anfasser auf der dargestellten Wellenfront 34 könnten beispielsweise zur Veränderung der Lautsprecheramplituden benutzt werden. Damit wird die einfache Justierung einer Fensterung zur Vermeidung von Randeffekten genauso möglich wie die Definition eines Punktes mit maximaler Amplitude. Dieser Punkt kann dann der Schallquelle, zumindest bezogen auf die Intensität, eine frequenzunabhängige Richtcharakteristik geben.

[0080] Für die Darstellung der Lautstärke einer Schallquelle kann beispielsweise die Größe der die Tonquelle beschreibenden Kugel 30 benutzt werden. Die oben erwähnte Manipulation des Direktschall/Diffusschall-Verhältnisses kann auch hier noch einmal angezeigt werden. Wenn die Lautstärke des Direktschalls der Größe der Kugel 30 entspricht, ist z. B. eine entfernte Schallquelle eher leiser und entspricht somit einer kleinen Kugel. Eine Verknüpfung mit der entfernungsabhängigen Berechnung der Lautstärke einer Schallquelle ist durch diese Darstellung somit einfachst realisierbar.

[0081] Mit der erfindungsgemäßen graphischen Benutzerschnittstelle in Fig. 3a oder 3b gelingt es also, die mathematische Funktion, die die Impulsantwort verkörpert, intuitiv und allgemein verständlich so darzustellen, dass die Impulsantwort zielgerichtet dahingehend manipuliert werden kann, dass ein gewünschter Richtungseindruck entsteht.

[0082] Während sich die Möglichkeiten der graphischen Benutzeroberfläche aus Fig. 3a oder 3b zur Positionierung einer Tonquelle, also zum Bestimmen eines Klangeindrucks, der den Ort der Tonquelle wiedergibt, bezogen haben, wird anhand der Fig. 4 - 8 erläutert werden, dass die erfindungsgemäße graphische Benutzerschnittstelle auch dazu geeignet ist, solche Impulsantworten zu visualisieren und deren Änderung zu ermöglichen, die einen Klangeindruck bewirken, der dem eines zu simulierenden Raums, wie beispielsweise einer Kathedrale, entspricht.

[0083] Um dies zu ermöglichen, gibt es zwei prinzipielle Möglichkeiten, die anhand der Fig. 4 und 5 im Folgenden erläutert werden sollen.

[0084] Fig. 4 zeigt dabei eine Möglichkeit, bei der zunächst in einem Positionierungsschritt 50 die Tonquellen im Raum angeordnet werden, wie es beispielsweise anhand von Fig. 3a oder 3b beschrieben wurde. Dabei werden den Lautsprechen für jede Tonquelle Impulsantworten zugeordnet.

[0085] Da sich die Tonquelle in definierter räumlicher Position bezüglich der Wiedergabeumgebung befindet, kann ein räumlicher Klangeindruck der Tonquelle direkt aufgeprägt werden, wenn sich diese in einer Raumrichtung bezüglich der Wiedergabeumgebung befindet, für die ein bestimmter räumlicher Klangeindruck zu simulieren ist.

[0086] In diesem Fall wird in einem Raumsimulationsschritt 52 für jede Tonquelle und Raumrichtung eine Impulsantwortfunktion erzeugt, die an ein Wiedergabesystem zusammen mit der Tonquelle in einem Transferschritt 54 übertragen werden muss, um bei der Wiedergabe den gewünschten räumlichen Klangeindruck zu erzielen.

[0087] Wie es Fig. 5 zeigt, ist es alternativ auch möglich, zunächst die Position der Tonquellen in einem Positionierungsschritt 60 festzulegen, in dem für Lautsprecher für jede Tonquelle Impulsantworten erzeugt werden, die die Position beschreiben. Der Raumeindruck, der in einer Hörrichtung entstehen soll, kann, da die im Wiedergabesystem verwendeten Lautsprecher ebenfalls festen Raumrichtungen zugeordnet sind, auch dadurch erzeugt werden, dass für jeden Lautsprecher in einem Raumsimulationsschritt 62 zusätzlich eine Impulsantwort erzeugt wird, die die Information über den in der Richtung des betreffenden Lautsprechers befindlichen Raum enthält.

[0088] In einem Transfer- bzw. Speicherschritt 64 muss an das Tonwiedergabesystem dann die Tonquelle und für jeden einzelnen Lautsprecher eine Positionsimpulsantwort und eine Raumimpulsantwort übertragen werden. Durch die Flexibilität der erfindungsgemäßen graphischen Benutzerschnittstelle kann die Zuordnung eines räumlichen Klangeindrucks also entweder zu jeder Tonquelle individuell erfolgen oder es können Gruppen von Tonquellen, die in einer ähnlichen Raumrichtung bezüglich der Wiedergabeumgebung angeordnet sind, zusammengefasst werden, um mehrere diskrete Raumrichtungen darzustellen, wodurch bei der Wiedergabe die erforderliche Rechenkapazität verringert wird.

[0089] Eine Ausführungsform der erfindungsgemäßen graphischen Benutzerschnittstelle, die die Manipulation einer Impulsantwort in einer Impulsantwort-Zeitdarstellung zeigt, ist in Fig. 6 gezeigt.

[0090] Dazu werden die Raumrichtungen bezüglich einer Wiedergabeumgebung 70 in acht diskrete Sektoren 72a - 72h unterteilt. Für jeden der Sektoren 72a - 72h wird also ein gemeinsamer Raumeindruck mittels einer Impulsantwort-Zeitdarstellung erzielt. Zur Visualisierung werden dabei die Einhüllenden der zur Raumsimulation verwendeten acht Impulsantworten zu Flächen extruiert. Diese Flächen werden in Form eines Achtecks angeordnet und zu einer gemeinsamen Fläche 74 verbunden. Dabei entspricht die Höhe der Fläche über der durch die Sektoren 72a - 72i definierten Fläche der Amplitude der Impulsantwort. Die Entfernung vom Mittelpunkt der Wiedergabeumgebung 70 stellt die Zeit dar, zeitlich am Ende der Impulsantwort auftretende Ereignisse sind daher weiter entfernt vom Mittelpunkt der Wiedergabeumgebung 70.

[0091] Mit dieser Darstellung können die Amplitudenverläufe der Raumimpulsantworten über die Zeit entsprechend ihrer Raumrichtung dargestellt werden. Die Veränderung erfolgt interaktiv durch Bewegen von hier beispielhaft dargestellten Interaktionselementen 76a, b und c. Es wird also ermöglicht, mit einem Blick die gesamte räumliche Klangsituation zu erfassen und Abweichungen von dem gewünschten Verhalten zu erkennen und zu beseitigen.

[0092] Beispielsweise soll für einen realen Raum die Nachhallzeit aus allen Richtungen in der Regel nahezu gleich sein. In dem aufgezeigten Beispiel von Fig. 6 ist die Nachhallzeit in Richtung des Sektors 72h jedoch reduziert, was sich durch die Unsymmetrie der Gesamtfläche 74 leicht erkennen lässt, so dass der Unterschied zum realen, gleichmäßig nachhallenden Raum sofort erkannt werden kann.

[0093] Fig. 7 beschreibt eine Darstellung von räumlichen Impulsantworten in einer Zeit-Frequenz-Darstellung. Dargestellt ist die Wiedergabeumgebung 80 und acht Zeit-Frequenz-Darstellungen von Impulsantworten 82a - 82h, die acht diskreten Raumrichtungen bezüglich der Wiedergabeumgebung 80 zugeordnet sind.

[0094] Allgemein ist es mit dem erfindungsgemäßen Ausführungsbeispiel in Fig. 7 möglich, sowohl die Zeit- als auch die Frequenzkomponenten von Impulsantworten bezogen auf ihre Raumrichtungen zu visualisieren und manipulierbar zu machen. Die Zeitachse der Visualisierung läuft dabei ausgehend vom Mittelpunkt der Wiedergabeumgebung 80 nach außen, so dass weiter entfernte Punkte spätere Ereignisse beschreiben. Die acht Flächen 82a - 82h, die die Impulsantworten in Form eines Wasserfalldiagramms darstellen, können beispielsweise anhand von Interaktionselementen 86a - 86c verändert werden. Die beispielhaft dargestellten Interaktionselemente 86a - 86c erlauben die Manipulation des Amplitudenfrequenzgangs zu einer bestimmten Zeit, im hier dargestellten Beispiel also am Anfang der Impulsantwort. In dem hier dargestellten Fall sind tiefe Frequenzen weiter links und hohe Frequenzen weiter rechts angeordnet, so dass sofort zu erkennen ist, dass in der räumlichen Simulation die tiefen Frequenzen mit höherer Amplitude beginnen und länger ausklingen als die hohen Frequenzen. Dieser komplexe Zusammenhang, der beispielsweise durch Beschreibung der Flächen 82a - 82h in Form einer Matrix gespeichert werden kann, ist hier intuitiv zu erfassen und zu verändern.

[0095] Die Art der Darstellung erlaubt es weiterhin, zusätzliche Effekte anzubringen bzw. deren Wirkung zu erkennen, beispielsweise würden in dieser Darstellung starke Reflexionen aus bestimmten Raumrichtungen als Erhebungen auf den Flächen der entsprechenden Raumimpulsantwort sichtbar werden.

[0096] Es ist also durch die gleichzeitige Ansicht der Zeit- und Frequenzkomponente ersichtlich, welche Frequenzanteile reflektiert werden. Mit einer Verschiebung der Interaktionselemente 86a - 86c an eine entsprechende Stelle in der Impulsantwort kann diese Reflexion sowohl zeitlich als auch frequenzbezogen bearbeitet werden, so dass die große Anzahl von der Visualisierung zugrundeliegenden Parameter günstig und effizient abgetastet und gespeichert werden können.

[0097] Fig. 8 zeigt ein weiteres Beispiel einer erfindungsgemäßen graphischen Benutzerschnittstelle, bei dem die Impulsantworten der einzelnen Raumrichtungen aus diskreten Peaks bestehen. Dargestellt sind eine Wiedergabeumgebung 90, acht diskrete Raumrichtungen 92a - 92i und fünf exemplarische, deltaförmige Impulsantworten 94a - 94e.

[0098] Da peak- oder deltaförmige Impulsantworten Zeitverzögerungen eines Tonsignals entsprechen, können somit richtungsabhängige Multi-Tap-Delays realisiert werden. Dabei repräsentieren die Wellenfronten 94a - 94e Echos aus den ihnen zugeordneten Raumrichtungen. Ihr Abstand zum Mittelpunkt des Wiedergabevolumens gibt den Zeitpunkt der Wiederholung des Ursprungssignals an. Erfindungsgemäß kann beispielsweise mittels eines Interaktionselementes 96 in Form einer Kugel die Position der Wiederholungen durch radiale Bewegungen der Impulsantworten von oder zum Mittelpunkt des Systems beeinflusst werden. Dabei kann gleichzeitig die Amplitude der Wiederholungen durch die Höhe der Wellenfronten in der vertikalen Richtung beeinflusst werden.

[0099] Der Vorteil der hohen Intuitivität der erfindungsgemäßen graphischen Benutzerschnittstelle wird hier besonders deutlich, da die Position der deltaförmigen Peaks die Verzögerungszeit eines Echos beschreibt, was akustisch gleichbedeutend ist mit einer reflektierenden Wand mit vorgegebener Dämpfung, die sich an der Position der Impulsantworten befindet.

[0100] In einer erweiterten Variante der erfindungsgemäßen graphischen Benutzerschnittstelle ist hier auch eine Zeit-Frequenz-Darstellung realisierbar, um jedem Echo zusätzlich einen individuellen Frequenzgang einzuprägen.

[0101] Fig. 9 beschreibt ein System zum Visualisieren und Bearbeiten von räumlichen Toneffekten 100, das sich aus einem Signalverarbeitungsteil 102 und einem Visualisierungs- und Interaktionsteil 104 zusammensetzt.

[0102] Erfindungsgemäß besteht die Signalverarbeitung darin, dass eingehende Audiosignale 106 mittels einer mathematischen Faltung 108 mit denen mittels des Visualisierungs- und Interaktionsteils 104 bestimmten Impulsantworten gefaltet werden, um daraus Audiosignale 110 zu erzeugen, die den Klangeindruck eines zu simulierenden Raumes tragen. Der Visualisierungs- und Interaktionsteil 104 weist eine Anzeigeeinrichtung zum Anzeigen von berechneten Impulsantworten 112, eine Einrichtung zum Empfangen einer Benutzeränderungseingabe 114, eine Einrichtung zum Ermöglichen einer Änderung der graphischen Anzeige 116 sowie eine Einrichtung zum Erfassen der geänderten Impulsantwort 118 auf. Die Einrichtung zum Empfangen einer Benutzeränderungseingabe 114 umfasst ein Interaktionsgerät 120 sowie eine Einrichtung zum Umsetzen der Interaktion 122. Die Einrichtung zum Ermöglichen einer Änderung der graphischen Anzeige der Impulsantwort 116 umfasst eine Ausgabeeinrichtung 124 zum Darstellen der ursprünglichen Impulsantwort sowie eine Bildberechnungseinheit 126 zum Visualisieren der ursprünglichen Impulsantwort.

[0103] Von der Einrichtung zum Empfangen einer Benutzeränderungseingabe und der Einrichtung zum Ermöglichen einer Änderung der graphischen Anzeige der Impulsantwort 116 wird ein visuelles Modell 112 erzeugt, das auf Parametern basiert, die die Impulsantworten beschreiben und somit die Information über den zu simulierenden Raum beinhalten. Wenn durch mehrmalige Interaktion und Visualisierung ein geeignetes visuelles Modell erstellt wurde, wird von der Einrichtung zum Erfassen der geänderten Impulsantwort 118 die Parameter, die der Visualisierung zugrunde liegen, extrahiert und als Impulsantworten an die Signalverarbeitung 102 übermittelt.

[0104] Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung umfasst die Signalverarbeitung die Faltung von N Eingangssignalen mit n Impulsantworten zu n Ausgangssignalen. N kann dabei von z. B. acht Signalen bei der Generierung von Halleffekten für die Wellenfeldsynthesewiedergabe bis hin zu einer sehr großen Zahl bei der Generierung eines ganzen Wellenfeldes schwanken. Werden mehrere Effekte oder Quellen gleichzeitig erzeugt, so müssen die Ausgangssignale für jeden Effekt oder jede Quelle am Ende aufsummiert werden.

[0105] Die für die Signalverarbeitung benötigten Impulsantworten werden also mit Hilfe des Visualisierungs- und Interaktionsteils des Systems generiert. Aus einer Impulsantwort können klangrelevante Parameter generiert werden. Dabei ist zu unterscheiden, ob es sich um Raumsignale oder Direktsignale handelt.

[0106] Bei Raumsignalen können unterschiedliche Methoden nach angewendet werden. Die gewonnenen Werte lassen sich dann wie im Abschnitt zur Visualisierung beschrieben grafisch darstellen. Mit Hilfe der Graphiken und den eingebauten Interaktionselementen können die Parameter verändert und zu einer neuen Impulsantwort verarbeitet werden.

[0107] Im Falle der Positionierung von Direktschall können aus dem Interface ebenfalls Parameter gewonnen werden. Allerdings können diese erst durch die Anwendung des Wellenfeldsynthese-Algorithmus in Impulsantworten für die Lautsprecherkanäle umgewandelt werden. Die Parameter sind damit auf einer abstrakteren Ebene. Doch der Aufbau des Blockschaltbildes in Fig. 9 ändert sich dadurch nicht.

[0108] Mit Hilfe dieses Systems können also alle räumlichen Toneffekte von Raumsimulation bis hin zu Multi-Tap-Delays visualisiert und editiert werden. Dieses Konzept kann in allen herkömmlichen Mehrkanalsystemen bis hin zur Wellenfeldsynthese eingesetzt werden. Es bietet einen universellen Lösungsweg für räumliche Klangeffekte und deren intuitive Nutzbarmachung für den Benutzer.

[0109] Wie es durch die beschriebenen Ausführungsbeispiele verdeutlicht wird, besteht ein wesentlicher Vorteil der erfindungsgemäßen graphischen Benutzerschnittstelle darin, dass komplexe mathematische Parameter intuitiv zugänglich gemacht werden. Dadurch wird das Erzeugen bzw. Einstellen dieser Parameter ermöglicht, wobei insbesondere das gesamte Klanggeschehen jederzeit im Auge behalten werden kann. Besonders vorteilhaft ist dabei, dass bei den beschriebenen Ausführungsbeispielen, die auf 3D-Visualisierungen basieren, die Richtung, in der die Wiedergabeumgebung betrachtet wird, variiert werden kann, so dass ein entstehender Klangeindruck dadurch noch besser vorhergesagt werden kann, dass dieser aus verschiedenen Raumrichtungen beurteilt wird.

[0110] Obwohl in der Darstellung in Fig. 1 die graphische Benutzerschnittstelle einzelne diskrete Funktionsblöcke aufweist, ist eine derartige Aufteilung nur als beispielhaft zu verstehen, es sind prinzipiell beliebige Kombinationen und Zusammenfassungen der einzelnen Funktionsblöcke möglich. So kann z. B. in naheliegender Weise die Anzeigeeinrichtung 12 mit der Einrichtung zum Ermöglichen einer Änderung 14 der graphischen Anzeige kombiniert werden, wie es in den dargestellten Ausführungsbeispielen teilweise der Fall ist, wo die Änderungsmöglichkeit als Teil der Anzeige bereits implementiert ist, beispielsweise in Form der Anfasser 36a und 36b in Fig. 3a oder 3b.

[0111] Bei der Einrichtung zum Empfangen einer Benutzeränderungseingabe sind prinzipiell auch andere Verfahren als die in den Ausführungsbeispielen gezeigten denkbar. Die Benutzereingabe kann mittels einer Maus, eines Touchscreens oder jedweden anderen Möglichkeit der Bewegung eines Cursors auf einem Bildschirm erfolgen. Auch die direkte Eingabe von diskreten Änderungsschritten mittels einer Tastatur ist darstellbar, beispielsweise bei einer diskretisierten Darstellung einer Impulsantwort, wo in definierten Zeitbereichen der Wert der Impulsantwort in diskreten Schritten eingestellt werden kann, was beispielsweise mittels einer herkömmlichen Tastatur leicht möglich ist.

[0112] Die Darstellung der Wellenfronten bzw. Impulsantworten und die Möglichkeit zur Manipulation derselben sind nur als Beispiele zu verstehen, es ist jedwede andere geeignete Darstellung von Impulsantwortfunktionen ebenfalls möglich, um erfindungsgemäß das Einstellen bzw. das Erzeugen eines Raumeindrucks zu ermöglichen. Beispielsweise wäre es denkbar, bei der Betrachtung verschiedener Raumrichtungen eine gemeinsame Impulsantwortfunktion darzustellen, die gewissermaßen den räumlichen Grundcharakter vorgibt, die also für alle Raumrichtungen dieselbe ist. Einen richtungsabhängigen Raumklangcharakter könnte man vorteilhafterweise dadurch darstellen, dass für jede Raumrichtung lediglich die Differenz zur gemeinsamen Impulsantwortfunktion dargestellt wird, so dass man leicht einen Eindruck davon erhält, wie sich die betrachtete Raumrichtung in ihren räumlichen Eigenschaften von dem Gesamtklangbild (mittleres Klangbild) unterscheidet.

[0113] Eine Reihenfolge der Bearbeitung der Impulsantwortfunktionen, die die Position einer Tonquelle bzw. den Raumeindruck beschreiben, ist nicht fest vorgegeben. Es ist sowohl möglich, zuerst alle Tonquellen im Raum zu positionieren und danach einen Raumeindruck zu erzeugen, als auch zuerst den zu simulierenden Raum zu definieren, um darauffolgend die Tonquellen innerhalb des Raums zu positionieren.

[0114] Demzufolge unterscheiden sich die Bearbeitungsschritte für ein System zur Ansteuerung eines Tonwiedergabesystems, das eine erfindungsgemäße graphische Benutzerschnittstelle sowie einen Signalgenerator zum Liefern von Lautsprechersignalen aufweist. Zum einen ist es möglich, jeder Tonquelle, die in einer definierten Raumrichtung befindlich ist, eine Rauminformation durch Falten mit einer räumlichen Impulsantwortfunktion einzuprägen, um dann in einem weiteren Schritt lautsprecherindividuell eine Faltung mit Impulsantworten vorzunehmen, welche die Position der Tonquellen relativ zum Wiedergabevolumen beschreiben.

[0115] Alternativ ist es möglich, zunächst die Tonquelle lautsprecherindividuell zu bearbeiten, d. h. individuelle Lautsprechersignale durch Faltung des Tonsignals mit den die Position der Tonquelle beschreibenden Impulsantworten zu erzeugen, um danach Lautsprecher individuell eine weitere Faltung durchzuführen, die den Raumeindruck erzeugt, wobei die Lautsprecher, die in fester geometrischer Richtung zur Wiedergabeumgebung angeordnet sind, mit einer räumlichen Impulsantwort gefaltet werden, die dem zu simulierenden Raumeindruck in der Richtung der Lautsprecher entsprechen.

[0116] Die Form der graphischen Elemente, die in den Ausführungsbeispielen zur Visualisierung der einzelnen wesentlichen Komponenten, wie der Position der Tonquelle oder der Form einer Impulsantwort, dargestellt sind, sind als bevorzugte Ausführungsbeispiele zu verstehen, jedoch ist die erfindungsgemäße Funktionsweise ebenso sichergestellt, wenn sich die Art der geometrischen Darstellung bezüglich der Form unterscheidet, je nach Anwendungszweck könnte eine unterschiedliche Form sogar funktionalen Charakter haben, d. h. verschiedene Eigenschaften beispielsweise einer Tonquelle beschreiben.

[0117] Die Signalbearbeitung, die lautsprecherindividuell durch Faltung eines Tonsignals mit einer Impulsantwortfunktion dargestellt ist, kann sowohl kontinuierlich als auch diskret implementiert sein, wobei auch alternative mathematische Methoden, den Raumeindruck, den eine Impulsantwort beschreibt, einem Tonsignal aufzuprägen, möglich sind.

[0118] In den Ausführungsbeispielen, die im Vorhergehenden gezeigt sind, ist zur Erzeugung eines Raumeindrucks der die Wiedergabeumgebung umschließende Raum in acht diskrete Raumrichtungen unterteilt, wobei für jede Raumrichtung individuell ein räumlicher Klangcharakter festgelegt werden kann. Dies ist nur als Beispiel zu verstehen, es sind selbstverständlich beliebige andere Anzahlen von Raumrichtungen möglich, prinzipiell ist die Zahl der Richtungen nach oben nicht begrenzt, so dass es erfindungsgemäß leicht möglich ist, den gesamten Klangeindruck noch weiter zu verbessern.

[0119] Abhängig von den Gegebenheiten kann das erfindungsgemäße Verfahren zum Verwenden einer graphischen Benutzerschnittstelle zum Benutzen eines Tonwiedergabesystems in Hardware oder in Software implementiert werden. Die Implementation kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, dass das erfindungsgemäße Verfahren zum Überprüfen des Erfolges eines Entkernvorganges ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computer-Programm-Produkt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfahrens, wenn das Computer-Programm-Produkt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computer-Programm auf einem Computer abläuft.


Ansprüche

1. Graphische Benutzerschnittstelle (10) für ein Tonwiedergabesystem, das ausgebildet ist, um in einer Wiedergabeumgebung (32; 70; 80; 90) einen räumlichen Toneindruck zu erzeugen, mit folgenden Merkmalen:

einer Anzeigeeinrichtung (12) zum graphischen Anzeigen von Impulsantworten (34; 74; 82a - 82h; 94a - 94e), die Raumrichtungen der Wiedergabeumgebung (32; 70; 80; 90) zugeordnet sind, wobei die Impulsantworten bezüglich der Wiedergabeumgebung in den Raumrichtungen dargestellt sind, denen sie zugeordnet sind;

einer Einrichtung zum Ermöglichen einer Änderung (14) der graphischen Anzeige der Impulsantworten (34; 74; 82a - 82h; 94a - 94e) durch den Benutzer, wobei eine Änderung der graphischen Anzeige der Impulsantworten (34; 74; 82a - 82h; 94a - 94e) an vorbestimmten Punkten ermöglicht wird;

einer Einrichtung zum Empfangen (16) einer Benutzeränderungseingabe, um durch die Anzeigeeinrichtung (12) geänderte Impulsantworten graphisch darzustellen; und

einer Einrichtung zum Erfassen der geänderten Impulsantworten (18).


 
2. Graphische Benutzerschnittstelle nach Anspruch 1, bei der die Anzeigeeinrichtung (12) ausgebildet ist, um die Impulsantworten (74; 82a - 82h; 94a - 94e) als zeitliche Verläufe einer Intensitätsgröße darzustellen.
 
3. Graphische Benutzerschnittstelle nach Anspruch 2, bei der die Anzeigeeinrichtung (12) ausgebildet ist, um die zeitliche Verläufe der Impulsantworten (74; 82a - 82h; 94a - 94e) so darzustellen, dass diese in diskrete Zeitabschnitte unterteilt sind, wobei jedem Zeitabschnitt eine Intensitätsgröße zugeordnet ist.
 
4. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der die Anzeigeeinrichtung (12) ausgebildet ist, um die Impulsantworten (82a - 82h) graphisch als Funktion der Frequenz darzustellen.
 
5. Graphische Benutzerschnittstelle nach Anspruch 4, bei der die Anzeigeeinrichtung (12) ausgebildet ist, um die Frequenzverläufe der Impulsantworten (74; 82a - 82h; 94a - 94e) so darzustellen, dass diese in diskrete Frequenzabschnitte unterteilt sind, wobei jedem Frequenzabschnitt eine Intensitätsgröße zugeordnet ist.
 
6. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der die Anzeigeeinrichtung (12) ausgebildet ist, um die Impulsantworten (82a - 82h) graphisch als Funktionen der Zeit und als Funktionen der Frequenz in einer dreidimensionalen Repräsentation darzustellen, wobei die Funktionswerte als Höhe über einer zweidimensionalen Fläche dargestellt sind, von der eine erste Seite als Maßstab die Zeit aufweist und von der eine an die erste Seite anschließende zweite Seite als Maßstab die Frequenz aufweist.
 
7. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der die Anzeigeeinrichtung (12) ausgebildet ist, um zusätzlich eine graphische Repräsentation der Wiedergabeumgebung (32; 70; 80; 90) in einer dreidimensionalen Repräsentation anzuzeigen, wobei die Impulsantworten (34; 74; 82a - 82h; 94a - 94e) bezüglich der Wiedergabeumgebung (32; 70; 80; 90) in den Raumrichtungen dargestellt sind, der die Impulsantworten (34; 74; 82a - 82h; 94a - 94e) zugeordnet sind.
 
8. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der die Einrichtung zum Ermöglichen einer Änderung (14) der graphischen Anzeige der Impulsantworten (34; 74; 82a - 82h; 94a - 94e) ausgebildet ist, um eine Änderung der graphischen Darstellung der Impulsantworten (34; 74; 82a - 82h; 94a - 94e) an jedem beliebigen Punkt der graphischen Darstellung der Impulsantworten (34; 74; 82a - 82h; 94a - 94e) zu ermöglichen.
 
9. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der die Einrichtung zum Ermöglichen einer Änderung (14) der graphischen Anzeige der Impulsantworten (94a - 94e) ausgebildet ist, um als Änderung der graphischen Darstellung der Impulsantworten (94a - 94e) ein Verschieben der Impulsantworten (94a - 94e) in der Zeit zu ermöglichen.
 
10. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der die Einrichtung zum Empfangen einer Benutzeränderungseingabe (16) ausgebildet ist, um Signale einer Computermaus, eines Touchpads, eines Touchscreens, eines Trackballs oder einer Tastatur zu empfangen.
 
11. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der die Einrichtung zum Erfassen (18) der geänderten Impulsantworten ausgebildet ist, um zur Erfassung die geänderten, graphisch dargestellten Impulsantwort abzutasten und die abgetasteten Werte in einem Speicher zu speichern.
 
12. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der die Anzeigeeinrichtung (12) ausgebildet ist, um Impulsantworten (74; 82a - 82h; 94a - 94e) graphisch anzuzeigen, welche Informationen über einen zu simulierenden Raum enthalten.
 
13. Graphische Benutzerschnittstelle nach einem der vorhergehenden Ansprüche, bei der die Anzeigeeinrichtung (12) ausgebildet ist, um Impulsantworten (34) graphisch anzuzeigen, welche Informationen über die Position einer Tonquelle (30) bezüglich der Wiedergabeumgebung (32) beinhalten.
 
14. Ansteuereinrichtung für ein Tonwiedergabesystem, das ausgebildet ist, um in einer Wiedergabeumgebung einen räumlichen Toneindruck zu erzeugen, mit folgenden Merkmalen:

einer graphischen Benutzerschnittstelle (10) gemäß einem der Ansprüche 1 bis 13; und

einem Signalgenerator (102) zum Liefern von Lautsprechersignalen (110) für Lautsprecher einer Mehrzahl von an unterschiedlichen räumlichen Positionen anbringbaren Lautsprechern.


 
15. Ansteuereinrichtung nach Anspruch 14, bei der der Signalgenerator (102) eine Kombinationseinrichtung (108) zum Kombinieren von Tonsignalen (106) mit den geänderten Impulsantworten aufweist, wobei die Tonsignale (106) für Lautsprecher vorgesehen sind, die an räumlichen Position angeordnet sind, die mit den Raumrichtungen korrespondieren, denen die Impulsantworten zugeordnet sind, um Lautsprechersignale (110) zu erhalten, wobei die Kombinationseinrichtung (108) ausgebildet ist, um so zu kombinieren, dass die Lautsprechersignale (110) die Information über den zu simulierenden Raum enthalten.
 
16. Ansteuereinrichtung nach Anspruch 15, bei der der Signalgenerator (102) eine Kombinationseinrichtung (108) zum Kombinieren der Tonsignale (106) mit den geänderten Impulsantworten aufweist, um Lautsprechersignale (110) zu erhalten, wobei die Kombinationseinrichtung (108) ausgebildet ist, um so zu kombinieren, dass die Lautsprechersignale (110) die Informationen über die relativen Positionen einer den Tonsignalen (106) zugeordneten Tonquelle enthält.
 
17. Ansteuereinrichtung nach einem der Ansprüche 15 oder 16, bei der die Kombinationseinrichtung (108) ausgebildet ist, um beim Kombinieren die Tonsignale (106) mit den geänderten Impulsantworten zu falten.
 
18. Verfahren zum Benutzen eines Tonwiedergabesystems, das ausgebildet ist, um in einer Wiedergabeumgebung (32; 70; 80; 90) einen räumlichen Toneindruck zu erzeugen, mit folgenden Schritten:

graphisches Anzeigen von Impulsantworten (34; 74; 82a - 82h; 94a - 94e), die Raumrichtungen der Wiedergabeumgebung (32; 70; 80; 90) zugeordnet sind, wobei die Impulsantworten bezüglich der Wiedergabeumgebung in den Raumrichtungen dargestellt sind, denen sie zugeordnet sind;

Ermöglichen einer Änderung der graphischen Anzeige der Impulsantworten (34; 74; 82a - 82h; 94a - 94e) durch den Benutzer, wobei eine Änderung der graphischen Anzeige der Impulsantworten (34; 74; 82a - 82h; 94a - 94e) an vorbestimmten Punkten ermöglicht wird;

Empfangen einer Benutzeränderungseingabe, um geänderte Impulsantworten graphisch darzustellen; und

Erfassen der geänderten Impulsantworten.


 
19. Verfahren zum Ansteuern eines Tonwiedergabesystems, mit den Schritten des Verfahrens gemäß Patentanspruch 18 und mit folgendem zusätzlichen Schritt:

Liefern von Lautsprechersignalen für Lautsprecher einer Mehrzahl von an unterschiedlichen räumlichen Positionen anbringbaren Lautsprechern basierend auf den geänderten Impulsantworten.


 
20. Computerprogramm mit einem Programmcode zum Ausführen des Verfahrens gemäß Patentanspruch 18 oder 19, wenn das Computerprogramm auf einem Rechner abläuft.
 


Claims

1. Graphic user interface (10) for a sound-reproduction system, which is formed so as to generate in a reproduction environment (32; 70; 80; 90) a spatial sound impression, comprising:

display means (12) for graphically displaying impulse responses (34; 74; 82a - 82h; 94a - 94e), which are associated with spatial directions of the reproduction environment (32; 70; 80; 90), the impulse responses, relative to the reproduction environment, being represented in the spatial directions they are allocated to;

means for allowing changing (14) the graphical display of the impulse responses (34; 74; 82a - 82h; 94a - 94e) by the user, a change of the graphical display of the impulse responses (34; 74; 82a - 82h; 94a - 94e) being enabled at predetermined points;

means for receiving (16) a user input of a change, in order to graphically represent changed impulse responses by the display means (12); and

means for detecting the changed impulse responses (18).


 
2. Graphic user interface according to claim 1, wherein the display means (12) is formed so as to represent the impulse responses (74; 82a - 82h; 94a - 94e) as time-dependent evolutions of an intensity value.
 
3. Graphic user interface according to claim 2, wherein the display means (12) is formed so as to represent the time-dependent evolutions of the impulse responses (74; 82a - 82h; 94a - 94e) such that same are divided into discrete time periods, an intensity value being associated with each time period.
 
4. Graphic user interface according to one of the previous claims, wherein the display means (.12) is formed so as to represent the impulse responses (82a - 82h) as a function of the frequency.
 
5. Graphic user interface according to claim 4, wherein the display means (12) is formed so as to represent the frequency evolutions of the impulse responses (74; 82a - 82h; 94a - 94e) such that same are divided into discrete frequency segments, an intensity value being associated with each frequency segment.
 
6. Graphic user interface according to one of the previous claims, wherein the display means (12) is formed so as to graphically represent the impulse responses (82a - 82h) as functions of the time and as functions of the frequency in a three-dimensional representation, the function values being represented as a height over a two-dimensional surface, one side of which has the time as a measure and a second side of which following the first side has the frequency as a measure.
 
7. Graphic user interface according to one of the previous claims, wherein the display means (12) is formed so as to display in addition a graphical representation of the reproduction environment (32; 70; 80; 90) in a three-dimensional representation, the impulse responses (34; 74; 82a - 82h; 94a - 94e) regarding the reproduction environment (32; 70; 80; 90) being represented in the spatial directions, which the impulse responses (34; 74; 82a - 82h; 94a - 94e) are associated with.
 
8. Graphic user interface according to one of the previous claims, wherein the means for allowing changing (14) the graphical display of the impulse responses (34; 74; 82a - 82h; 94a - 94e) is formed so as to allow changing the graphical representation of the impulse responses (34; 74; 82a - 82h; 94a - 94e) at any arbitrary point of the graphical representation of the impulse responses (34; 74; 82a - 82h; 94a - 94e).
 
9. Graphic user interface according to one of the previous claims, wherein the means for allowing changing (14) the graphical display of the impulse responses (94a - 94e) is formed so as to allow shifting the impulse responses (94a - 94e) in the time as a change of the graphical display of the impulse responses (94a - 94e).
 
10. Graphic user interface according to one of the previous claims, wherein the means for receiving a user input of a change (16) is formed so as to receive signals of a computer mouse, a touch pad, a touch screen, a track ball or a keyboard.
 
11. Graphic user interface according to one of the previous claims, wherein the means for detecting (18) the changed impulse responses is formed so as to scan, for detecting, the changed impulse responses graphically represented and to store the scanned values in a memory.
 
12. Graphic user interface according to one of the previous claims, wherein the display means (12) is formed so as to graphically display impulse responses (74; 82a - 82h; 94a - 94e), which contain information about a space to be simulated.
 
13. Graphic user interface according to one of the previous claims, wherein the display means (12) is formed so as to graphically display impulse responses (34), which contain information about the position of a sound source (30) with respect to the reproduction environment (32).
 
14. Controlling apparatus for a sound-reproduction system, which is formed so as to generate a spatial sound impression in a reproduction environment, comprising:

a graphic user interface (10) according to any one of claims 1 to 13; and

a signal generator (102) for providing loudspeaker signals (110) for loudspeakers of a plurality of loudspeakers that can be placed at different spatial positions.


 
15. Controlling apparatus according to claim 14, wherein the signal generator (102) has combination means (108) for combining sound signals (106) with the changed impulse responses, the sound signals (106) being intended for loudspeakers arranged at spatial positions corresponding to the spatial directions, which the impulse responses are associated with, in order to obtain loudspeaker signals (110), the combination means (108) being formed so as to combine such that the loudspeaker signals (110) contain the information about the space to be simulated.
 
16. Controlling apparatus according to claim 15, wherein the signal generator (102) has combination means (108) for combining the sound signals (106) with the changed impulse responses, in order to obtain a loudspeaker signal (110), the combination means (108) being formed so as to combine such that the loudspeaker signals (110) contain the information about the relative positions of a sound source associated with the sound signals (106).
 
17. Controlling apparatus according to one of claims 15 or 16, wherein the combination means (108) is formed so as to alias, during the combination, the sound signals (106) with the changed impulse responses.
 
18. Method for using a sound-reproduction system, which is formed so as to generate a spatial sound impression in a reproduction environment (32; 70; 80; 90), comprising:

graphically displaying impulse responses (34; 74; 82a - 82h; 94a - 94e) associated with spatial directions of the reproduction environment (32; 70; 80; 90), the impulse responses, relative to the reproduction environment, being represented in the spatial directions they are allocated to;

allowing changing the graphical display of the impulse responses (34; 74; 82a - 82h; 94a - 94e) by the user, a change of the graphical display of the impulse responses (34; 74; 82a - 82h; 94a - 94e) being enabled at predetermined points;

receiving a user input of a change, in order to graphically represent changed impulse responses; and

detecting the changed impulse responses.


 
19. Method for controlling a sound-reproduction system, comprising the steps of the method according to claim 18 and additionally comprising:

providing loudspeaker signals for a plurality of loudspeakers, which can be placed at different spatial positions based on the changed impulse responses.


 
20. Computer program with a program code for performing the method according to claim 18 or 19 when the computer program is executed on a computer.
 


Revendications

1. Interface graphique d'utilisateur (10) pour un système de reproduction sonore, réalisée de manière à générer une impression sonore spatiale dans un environnement de reproduction (32; 70; 80; 90), aux caractéristiques suivantes:

un moyen d'affichage (12) destiné à afficher graphiquement des réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e) qui sont associées à des directions spatiales de l'environnement de reproduction (32; 70; 80; 90), les réponses impulsionnelles étant représentées, par rapport à l'environnement de reproduction, dans les directions spatiales auxquelles elles sont associées;

un moyen destiné à permettre une modification (14) de l'affichage graphique des réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e) par l'utilisateur, une modification de l'affichage graphique des réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e) étant rendue possible à des points prédéterminés;

un moyen destiné à recevoir (16) une entrée de modification par l'utilisateur, pour représenter graphiquement des réponses impulsionnelles modifiées par le moyen d'affichage (12); et

un moyen destiné à détecter les réponses impulsionnelles modifiées (18).


 
2. Interface graphique d'utilisateur selon la revendication 1, dans laquelle le moyen d'affichage (12) est réalisé de manière à représenter les réponses impulsionnelles (74; 82a à 82h; 94a à 94e) comme évolutions dans le temps d'une grandeur d'intensité.
 
3. Interface graphique d'utilisateur selon la revendication 2, dans laquelle le moyen d'affichage (12) est réalisé de manière à représenter les évolutions dans le temps des réponses impulsionnelles (74; 82a à 82h; 94a à 94e) de sorte qu'elles soient subdivisées en segments de temps discrets, à chaque segment de temps étant associée une grandeur d'intensité.
 
4. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans laquelle le moyen d'affichage (12) est réalisé de manière à représenter les réponses impulsionnelles (82a à 82h) graphiquement en fonction de la fréquence.
 
5. Interface graphique d'utilisateur selon la revendication 4, dans laquelle le moyen d'affichage (12) est réalisé de manière à représenter les évolutions de fréquence des réponses impulsionnelles (74; 82a à 82h; 94a à 94e) de sorte qu'elles soient subdivisées en segments de fréquence discrets, à chaque segment de fréquence étant associée une grandeur d'intensité.
 
6. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans laquelle le moyen d'affichage (12) est réalisé de manière à représenter les réponses impulsionnelles (82a à 82h) graphiquement en fonction du temps et en fonction de la fréquence dans une représentation tridimensionnelle, les valeurs de fonction étant représentées comme hauteur au-dessus d'une surface bidimensionnelle dont un premier côté présente, comme mesure, le temps et dont un deuxième côté se raccordant au premier côté présente, comme mesure, la fréquence.
 
7. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans laquelle le moyen d'affichage (12) est réalisé de manière à afficher, en outre, une représentation graphique de l'environnement de reproduction (32; 70; 80; 90) dans une représentation tridimensionnelle, les réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e) étant représentées, par rapport à l'environnement de reproduction (32; 70; 80; 90), dans les directions spatiales auxquelles sont associées les réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e).
 
8. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans laquelle le moyen destiné à permettre une modification (14) de l'affichage graphique des réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e) est réalisé de manière à permettre une modification de la représentation graphique des réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e) en tout point quelconque de la représentation graphique des réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e).
 
9. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans laquelle le moyen destiné à permettre une modification (14) de l'affichage graphique des réponses impulsionnelles (94a à 94e) est réalisé de manière à permettre, comme modification de la représentation graphique des réponses impulsionnelles (94a à 94e), un décalage des réponses impulsionnelles (94a à 94e) dans le temps.
 
10. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans laquelle le moyen destiné à recevoir une entrée de modification par l'utilisateur (16) est réalisé de manière à recevoir des signaux d'une souris d'ordinateur, d'un touchpad, d'un écran tactile, d'un pointeur ou d'un clavier.
 
11. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans laquelle le moyen destiné à détecter (18) les réponses impulsionnelles modifiées est réalisé de manière à balayer, pour la détection, la réponse impulsionnelle modifiée représentée graphiquement et à mémoriser les valeurs balayées dans une mémoire.
 
12. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans laquelle le moyen d'affichage (12) est réalisé de manière à afficher graphiquement des réponses impulsionnelles (74; 82a à 82h; 94a à 94e) qui contiennent des informations sur un espace à simuler.
 
13. Interface graphique d'utilisateur selon l'une des revendications précédentes, dans laquelle le moyen d'affichage (12) est réalisé de manière à afficher graphiquement des réponses impulsionnelles (34) qui contiennent des informations sur la position d'une source sonore (30) par rapport à l'environnement de reproduction (32).
 
14. Dispositif d'activation d'un système de reproduction sonore, qui est réalisé de manière à générer, dans un environnement de reproduction, une impression sonore spatiale, aux caractéristiques suivantes:

une interface graphique d'utilisateur (10) selon l'une des revendications 1 à 13; et

un générateur de signal (102) destiné à fournir des signaux de haut-parleur (110) pour les haut-parleurs d'une pluralité de haut-parleurs pouvant être placés à des positions spatiales différentes.


 
15. Dispositif d'activation selon la revendication 14, dans lequel le générateur de signal (102) présente un moyen de combinaison (108) destiné à combiner des signaux sonores (106) avec les réponses impulsionnelles modifiées, les signaux sonores (106) étant prévus pour les hauts-parleurs qui sont disposés à des positions spatiales correspondant aux directions spatiales auxquelles sont associées les réponses impulsionnelles, pour obtenir des signaux de haut-parleur (110), le moyen de combinaison (108) étant réalisé de manière à combiner de sorte que les signaux de haut-parleur (110) contiennent l'information sur l'espace à simuler.
 
16. Dispositif d'activation selon la revendication 15, dans lequel le générateur de signal (102) présente un moyen de combinaison (108) destiné à combiner des signaux sonores (106) avec les réponses impulsionnelles modifiées, pour obtenir des signaux de haut-parleur (110), le moyen de combinaison (108) étant réalisé de manière à combiner de sorte que les signaux de haut-parleur (110) contiennent l'information sur les positions relatives d'une source sonore associée aux signaux sonores (106).
 
17. Dispositif d'activation selon l'une des revendications 15 ou 16, dans lequel le moyen de combinaison (108) est réalisé de manière à replier, lors de la combinaison, les signaux sonores (106) avec les réponses impulsionnelles modifiées.
 
18. Procédé permettant d'utiliser un système de reproduction sonore, réalisé de manière à générer, dans un environnement de reproduction (32; 70; 80; 90), une impression sonore spatiale, aux étapes suivantes consistant à:

afficher graphiquement des réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e) qui sont associées à des directions spatiales de l'environnement de reproduction (32; 70; 80; 90), les réponses impulsionnelles étant représentées, par rapport à l'environnement de reproduction, dans les directions spatiales auxquelles elles sont associées;

permettre une modification de l'affichage graphique des réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e) par l'utilisateur, une modification de l'affichage graphique des réponses impulsionnelles (34; 74; 82a à 82h; 94a à 94e) étant rendue possible à des points prédéterminés;

recevoir une entrée de modification par l'utilisateur, pour représenter graphiquement des réponses impulsionnelles modifiées; et

détecter les réponses impulsionnelles modifiées.


 
19. Procédé d'activation d'un système de reproduction sonore, aux étapes du procédé selon la revendication 18 et à l'étape additionnelle suivante consistant à:

fournir des signaux de haut-parleur pour les haut-parleurs d'une pluralité de haut-parleurs pouvant être placés à des positions spatiales différentes sur base des réponses impulsionnelles modifiées.


 
20. Programme d'ordinateur avec un code de programme pour réaliser le procédé selon la revendication 18 ou 19 lorsque le programme d'ordinateur est exécuté sur un ordinateur.
 




Zeichnung



































Angeführte Verweise

IN DER BESCHREIBUNG AUFGEFÜHRTE DOKUMENTE



Diese Liste der vom Anmelder aufgeführten Dokumente wurde ausschließlich zur Information des Lesers aufgenommen und ist nicht Bestandteil des europäischen Patentdokumentes. Sie wurde mit größter Sorgfalt zusammengestellt; das EPA übernimmt jedoch keinerlei Haftung für etwaige Fehler oder Auslassungen.

In der Beschreibung aufgeführte Patentdokumente




In der Beschreibung aufgeführte Nicht-Patentliteratur