Verfahren zum Zusammensetzen von Ansagen zur Sprachausgabe

(19)

(11)

EP 1 168 298 A2

(12)	EUROPÄISCHE PATENTANMELDUNG

(43)	Veröffentlichungstag:
	02.01.2002 Patentblatt 2002/01

(21)	Anmeldenummer: 01114995.2

(22)	Anmeldetag: 20.06.2001

(51)	Internationale Patentklassifikation (IPC)⁷: G10L 13/06

(84)	Benannte Vertragsstaaten:
	AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR
	Benannte Erstreckungsstaaten:
	AL LT LV MK RO SI

(30)

Priorität:

30.06.2000 DE 10031008

(71)	Anmelder: NOKIA MOBILE PHONES LTD.
	02150 Espoo (FI)

(72)	Erfinder:
	Buth, Peter 44795 Bochum (DE) Grothues, Simona 44789 Bochum (DE) Iman, Amir 44801 Bochum (DE) Theimer, Wolfgang 44879 Bochum (DE)

(74)	Vertreter: TER MEER STEINMEISTER & PARTNER GbR
	Patentanwälte, Mauerkircherstrasse 45 81679 München 81679 München (DE)

(54)	Verfahren zum Zusammensetzen von Ansagen zur Sprachausgabe

(57) Die Erfindung befaßt sich mit einem Verfahren zum Zusammensetzen von Ansagen zur Sprachausgabe, insbesondere mit der Verbesserung der Wiedergabequalität solcher Sprachausgaben. Zu diesem Zweck werden eine Reihe von Originalsätze für Ansagen segmentiert. Diese Segmente (10) werden in der Form von Audiofiles zusammen mit Suchkriterien in einer Datenbank (11) gespeichert. Zusätzlich zu diesen Informationen werden auch noch weiter Einträge (12) zu den Segmenten (10) gemacht, indem die Länge, die Position und die Übergangswerte für die jeweiligen Segmente (10) erfaßt und gespeichert werden. Soll nun ein Satz wiedergegeben werden, wird dieser in einem Format übermittelt, welches dem Format der Suchkriterien entspricht. Sodann wird untersucht, ob der wiederzugebende Satz durch ein Segment oder durch eine Aneinanderreihung von gespeicherten Segmenten (10) vollständig abgebildet werden kann. Ist dies der Fall, werden die jeweils gefundenen Segmente unter Verwendung ihrer Einträge (12) untersucht, in wie weit die einzelnen Segmente hinsichtlich Sprachrhythmus zusammen passen, wobei dann die Audiofiles der Segmente (10) zur Wiedergabe zusammengestellt und ausgegeben werden, bei denen die Untersuchung die Voraussetzungen für eine optimale Aufrechterhaltung des natürlichen Sprachrhythmus ergeben hat.

Beschreibung

Technisches Gebiet

[0001] Die Erfindung befaßt sich mit einem Verfahren zum Zusammensetzen von Ansagen zur Sprachausgabe, insbesondere mit der Verbesserung der Wiedergabequalität solcher Sprachausgaben.

Stand der Technik

[0002] Im Stand der Technik sind Anordnungen bekannt, bei denen zur Realisierung von Sprachausgaben entsprechende Einträge aus einer Datenbank aufgerufen werden. Im einzelnen kann diese so ausgeführt sein, daß beispielsweise eine bestimmte Anzahl von verschiedenen Ansagen, also z. B. von verschiedenen Sätzen, Befehlen, Benutzeraufforderungen, Redewendungen, Phrasen oder dergleichen, in einem Speicher abgelegt sind und daß entsprechend dem Bedarf nach einer abgelegten Ansage diese aus dem Speicher ausgelesen und wiedergegeben wird. Wie leicht einzusehen ist, sind derartige Anordnungen sehr inflexibel, da nur die Ansagen wiedergegeben werden können, die vorher vollständig gespeichert worden sind.

[0003] Daher ist man dazu übergegangen, Ansagen in Segmente aufzuteilen und als entsprechende Audiofiles zu speichern. Soll nun eine Ansage ausgegeben werden, ist es notwendig die gewünschte Ansage aus den Segmenten zu rekonstruieren. Dies geschieht im Stand der Technik so, daß für die zu bildende Ansage lediglich entsprechende Hinweise auf die Segmente in der für die Ausgabe relevanten Reihenfolge übertragen werden. Mittels dieser Hinweise werden dann die entsprechenden Audiofiles aus dem Speicher ausgelesen und für die Ausgabe zusammengefügt. Diese Methode zur Bildung von Sätzen oder Satzteilen zeichnet sich durch eine große Flexibilität bei nur geringem Speicherbedarf aus. Als nachteilig wird aber empfunden, daß sich eine mittels dieser Methode erstellte Wiedergabe durch die Nichtberücksichtigung des natürlichen Sprachflusses sehr synthetisch klingt.

Zusammenfassung der Erfindung

[0004] Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren zum Bilden von Ansagen aus Segmenten anzugeben, welches den natürlichen Sprachfluß berücksichtigt und somit zu harmonischen Wiedergabeergebnissen führt.

[0005] Diese Aufgabe wird durch das Verfahren nach Anspruch 1 gelöst. Vorteilhafte Aus- und Weiterbildungen sind den abhängigen Ansprüchen entnehmbar..

[0006] Erfindungsgemäß ist also bei einem Verfahren zum Zusammensetzen von Ansagen zur Sprachausgabe aus Segmenten zumindest eines Originalsatzes, die als Audiofiles gespeichert sind, bei dem eine zur Ausgabe bestimmte Ansage aus den als Audiofiles gespeicherten Segmenten zusammengesetzt wird, die anhand von Suchkriterien aus den gespeicherten Audiofiles ausgewählt werden, vorgsehen, daß jedem Segment zumindest eine seine phonetischen Eigenschaften im Originalsatz kennzeichnende Größe zugeordnet ist, und daß anhand der die phonetischen Eigenschaften im Originalsatz kennzeichnenden Größen der einzelnen Segmente überprüft wird, ob die den als Ansage auszugebenden Wiedergabesatz bildenden Segmente entsprechend ihrem natürlichen Sprachfluß zusammengesetzt sind. Auf diese Weise läßt es sich erreichen, daß bei der Sprachwiedergabe der natürliche Sprachfluß und rhythmus einer Ansage weitgehend rekonstruiert wird, ohne daß die Ansage selbst vollständig gespeichert sein muß.

[0007] Um noch natürlichere Ansage zu erhalten, ist es zweckmäßig, wenn jedem Segment mehrere seine phonetischen Eigenschaften im Originalsatz kennzeichnende Größen zugeordnet sind, wobei die Größen vorteilhafter Weise aus folgenden Größen ausgewählbar sind: Länge des jeweiligen Segments, Position des jeweiligen Segments im Originalsatz, vorderer und/oder hinterer Übergangswert des jeweiligen Segments zum vorstehenden bzw. nachfolgenden Segment im Originalsatz, wobei weiter als Länge des jeweiligen Segments die Länge des jeweils zugeordneten Suchkriteriums verwendet wird.

[0008] Um besonders gute Ergebnisse zu erreichen, ist bei einer vorteilhaften Weiterbildung der Erfindung vorgesehen, daß als Übergangswerte die letzten bzw. ersten Buchstaben, Silben oder Phoneme des vorstehenden bzw. nachfolgenden Segments im Originalsatz verwendet werden. Eine besonders hochwertige Wiedergabe von aus Audiofiles zusammengesetzten Wiedergabesätzen wird dann erreicht, wenn als Übergangswerte Phoneme verwendet werden

[0009] Da die Satzmelodie weitgehend von der Satzart abhängt, wird eine weitere Verbesserung der Wiedergabe erreicht, wenn als weitere Größe Angaben darüber vorgesehen sind, ob das jeweilige Segment des Originalsatzes aus einem Frage- oder Ausrufesatz stammt.

[0010] Eine zweckmäßige Weiterbildung der Erfindung zeichnet dadurch aus, daß für eine gefundene Kombination von Segmenten, die den als Ansage auszugebenden Wiedergabesatz bildet, ein Bewertungsmaß aus den die phonetischen Eigenschaften im Originalsatz kennzeichnenden Größen der einzelnen Segmente gemäß der nachfolgenden Formel berechnet wird:

wobei f_n,i(n) ein funktionaler Zusammenhang der n-ten Größe, i ein das Segment bezeichnender Index und W_n ein Gewichtungsfaktor für den funktionalen Zusammenhang der n-ten Größe ist. Als funktionaler Zusammenhang einer Größe kann dabei z. B. die Größe selbst, ihr Kehrwert oder ein Übereinstimmungswert der dem gespeicherten Segment zugeordneten Größe mit der Größe vorgesehen sein, die diesem Segment in der Kombination für die Ansage zuzuordnen wäre. Die Gewichtungsfaktoren ermöglichen dabei eine sehr leichte Verschiebung der Präferenzen bei der Ermittlung des Bewertungsmaß.

[0011] Entsprechend den Bewertungsmaßen wird dann aus den gefundenen Kombinationen von Segmenten diejenige als wiederzugebende Ansage ausgewählt, deren Bewertungsmaß anzeigt, daß die Segmente der Kombination entsprechend einem natürlichen Sprachfluß zusammengesetzt sind.

[0012] Bei einer anderen Ausgestaltung der Erfindung ist vorgesehen, daß das Bewertungsmaß B aus den funktionalen Zusammenhängen f_n(n) zumindest der folgenden Größen Länge L und Position P sowie vorderer und hinterer Übergangswert Ü_vorn, Ü_hinten des Segments gemäß nachfolgender Formel berechnet wird:

[0013] Besonders einfach ist die Auswertung dann, wenn der Wiedergabesatz in einem, den Suchkriterien entsprechenden Format vorliegt, wobei vorzugsweise für die Suchkriterien und die übermittelten Wiedergabesätze alphanumerische Zeichenketten verwendet werden.

[0014] Um eine schnelle Suche in einer Datenbank zu erzielen, ist es zweckmäßig, wenn die Suchkriterien in einer Datenbank hierachisch angeordnet sind.

[0015] Die Auswahl der Segmente für die Wiedergabe einer Ansage ist besonders einfach, wenn zum Auswählen der als Audiofiles gespeicherten Segmente für eine Ansage geprüft wird, ob der als Ansage gewünschte Wiedergabesatz in seiner Gesamtheit mit einem in einer Datenbank zusammen mit einem zugeordneten Audiofile abgelegten Suchkriterium übereinstimmt, wobei, wenn dies nicht der Fall ist, das Ende des jeweiligen Wiedergabesatzes solange reduziert und dann auf Übereinstimmungen mit in der Datenbank abgelegten Suchkriterien überprüft wird, bis für den verbleibenden Teil des Wiedergabesatzes eine oder mehrere Übereinstimmung gefunden wurden, wenn für solche Teile des Wiedergabesatzes, die im einem vorhergehenden Schritt abgetrennt wurden, die im letzen Absatz angegebene Überprüfung fortgesetzt wird, wenn für jede Kombination von Segmenten, deren Suchkriterien vollständig mit dem Wiedergabesatz übereinstimmen, überprüft wird, ob die den als Ansage auszugebenden Wiedergabesatz bildenden Segmente entsprechend ihrem natürlichen Sprachfluß zusammengesetzt sind, und wenn zur Wiedergabe einer gewünschten Ansage die Audiofiles der Segmente verwendet werden, deren Kombination dem natürlichen Sprachfluß am nächsten kommen.

[0016] Wird also sichergestellt, daß für jedes Segment mindestens ein Datensatz mit einem Suchkriterium, einem Audiofile und wenigstens einer eine seine phonetischen Eigenschaften im Originalsatz kennzeichnende Größe, also eine zusätzliche Information über das jeweilige Segment angelegt wird, kann anhand der so aufbereiteten Datensätze sehr leicht eine Kombination von Segmenten erstellt werden, deren Wiedergabe sich von einer gesprochenen Wiedergabe der entsprechenden Ansage nicht mehr unterscheidet. Diese Wirkung wird dadurch erreicht, daß vor der Ausgabe einer Ansage, also vor der Wiedergabe von Sätzen, Satzteilen, Aufforderungen, Befehlen, Phrasen oder dergleichen innerhalb der Datenbank nach Segmenten gesucht wird, aus denen der gewünschten Ansage entsprechende Kombinationen gebildet werden können, und daß dann jede gefundene und aus einem oder mehreren Segmenten bestehende Kombination anhand der Informationen zu jedem verwendeten Segment eine Bewertung durchgeführt wird, die die Annäherung der Kombination an den natürlichen Sprachfluß beschreibt. Sind für die ermittelten Kombinationen die Bewertungen abgeschlossen, so wird für die Ansage die Kombination von Segmenten ausgewählt, die dem natürlichen Sprachfluß am nächsten kommt.

Kurzdarstellung der Figuren

[0017] Die Erfindung wird im folgenden beispielsweise anhand von Ausführungsbeispielen mit Bezug auf die beiliegende Zeichnung näher erläutert. Es zeigen:

Fig. 1: eine Liste mit vier Originalsätzen;
Fig. 2: eine Tabelle zur Veranschaulichung einer Datenbank mit 10 Datensätzen;
Fig. 3: eine Tabelle mit Kombinationen aus Segmenten, welche den Wiedergabesatz vollständig wiedergeben;
Fig. 4: eine Tabelle, welche Datensätze für einen segmentierten Wiedergabesatz zeigt; und
Fig. 5: eine Tabelle, welche die Gesamtauswertung zeigt.

Wege zum Ausführen der Erfindung.

[0018] In Fig. 1 ist eine Liste von vier Originalsätzen gezeigt, die bei Bedarf als Ansagen mittels einer Sprachausgabeeinrichtung wiedergegeben können, wobei jeder dieser Originalsätze durch einen senkrechten Strich in zwei oder mehr Segmente 10 unterteilt ist. Obwohl jeder dieser vier Originalsätze den gleichen Bedeutungsgehalt aufweist und sich auch - sieht man von der Reihenfolge einmal ab - keine Unterschiede in den verwendeten Buchstaben und Ziffern ergeben, zeigen sich doch erhebliche Unterschiede zwischen den einzelnen Originalsätzen dann, wenn sie akustisch wiedergegeben werden. Dies ist darauf zurückzuführen, daß sich je nach Stellung von einzelnen Worten oder Wortgruppen im Satzgefüge unterschiedliche Betonungen ergeben können. Soll beispielsweise der Satz "In 100 Metern links abbiegen" als Ansage wiedergegeben werden und werden für die Wiedergabe nicht die Segmente 10.1 und 10.2, sondern die Segmente 10.4 und 10.3 verwendet, führt dies zu keiner harmonischen, dem normalen Sprachfluß entsprechenden Wiedergabe.

[0019] Will man die satzspezifische Betonung der vier in der Liste (Fig. 1) veranschaulichten Originalsätze erhalten, ist es ohne Kenntnis der Erfindung erforderlich, jeden dieser Originalsätze in seiner Gesamtheit als Audiofile abzulegen. Wie leicht einzusehen ist, führt dies zu einem erheblichen Speicherbedarf.

[0020] Um eine Ausdehnung des Speicherbedarfs zu vermeiden, gleichwohl aber sicherzustellen, daß harmonische und dem normalen Sprachfluß entsprechende Wiedergabeergebnisse hervorgebracht werden, ist es erforderlich, eine Reihe von Sätzen in ihrer ursprünglich gesprochenen Form zu analysieren. Eine derartige Analyse wird nun im folgenden anhand der in Fig. 1 gezeigten Originalsätze exemplarisch durchgeführt:

[0021] Zunächst werden die verschiedenen Sätze für eine Ansage als sogenannte Originalsätze von einem Sprecher gesprochen und aufgezeichnet.

[0022] Anschließend werden die so aufgenommenen Originalsätze in Segmente 10 unterteilt, wobei jedes dieser Segmente 10 in einem Audiofile abgelegt wird.

[0023] Außerdem wird jedem Originalsatz eine Gruppe von Suchkriterien zugeordnet. Diese Gruppe von Suchkriterien wird entsprechend der Segmentierung der Originalsätze aufgeteilt, wobei jedem Segment 10 ein Suchkriterium zugeordnet wird. Die gegenseitige Zuordnung von Audiofiles und Suchkriterien erfolgt in einer Datenbank 11, die in Fig. 2 näher gezeigt ist. Wie dieser Datenbank 11 entnehmbar ist, werden vorliegend als Suchkriterien alphanumerische Zeichenketten verwendet, wobei die als Suchkriterien verwendeten Zeichenketten der textlichen Wiedergabe der zugeordneten und als Audiofile abgelegten Segmente 10 entsprechen. Der Vollständigkeit halber sei darauf hingewiesen, daß weder die zuvor benannten Zeichenketten noch alphanumerische Zeichen als Suchkriterien verwendet werden müssen sofern sichergestellt ist, daß die als Suchkriterien eingesetzten Zeichen oder Zeichenfolgen solche Segmente 10, deren textlicher Inhalt gleich ist, auch gleich kennzeichnen. Beispielsweise ist es denkbar jedem Segment eine Segmentidentifaktionsnummer zuzuordnen.

[0024] Wie der Darstellung der Fig. 2 weiter entnehmbar ist, besitzt die Datenbank 11 noch weitere Einträge 12. Entsprechend den Spaltenkopfüberschriften handelt es sich bei diesen Einträgen 12 um die Länge (L) des jeweiligen Segments, seine Position (P) innerhalb des Satzes und um zwei Anschlußlaute oder Übergangswerte (Ü_vorn, Ü_hinten).

[0025] Die Gewinnung dieser Einträge 12 wird nun im Folgenden erläutert:

[0026] Werden die Originalsätze segmentiert, werden die jeweiligen Einträge 12, welche die Länge (L) betreffen, z. B. dadurch gewonnen, daß für jedes der Suchkriterien die Anzahl der Worte des zugeordneten Segments 10 ermittelt wird. Hierzu können im vorliegenden Ausführungsbeispiel die Worte innerhalb des zugeordneten Suchkriteriums herangezogen werden. Dies ergibt für das Audiofile bzw. das dem Suchkriterium "abbiegen" zugeordnete Segment 10 den Längenwert 1, während dem Suchkriterium "in 100 Metern" der Längenwert 3 zugeordnet wird, da die Zahlenfolge "100" als Wort angesehen wird. Der Vollständigkeit halber sei darauf hingewiesen, daß für die Gewinnung der Längeninformation nicht notwendig die im Suchkriterium enthaltenen Worte herangezogen werden müssen. Vielmehr kann in einem anderen - nicht weiter dargestellten - Ausführungsbeispiel auch auf die Anzahl der im jeweiligen Suchkriterium enthaltenen Zeichen benutzt werden. Dies würde beispielsweise für das Suchkriterium "abbiegen" zu einem Längenwert von 8 und für das Suchkriterium "in 100 Metem" zu einem Längenwert von 13 führen, da beim letzten Suchkriterium auch die Leeranschläge zwischen den Worten sowie die Zahlen als Zeichen gewertet werden. Ferner ist es denkbar die Anzahl der Silben oder Phoneme als Längenwert zu verwenden.

[0027] Der Eintrag 12, welcher die Position (P) wiedergibt, wird beispielsweise dadurch gewonnen, daß zunächst die Anzahl der Segmente 10 bzw. Suchkriterien je Originalsatz ermittelt werden. Ergibt sich beispielsweise für einen Originalsatz, daß dieser bei seiner Segmentierung in drei Segmente 10 aufgeteilt wird, wird dem ersten Segment 10 der Positionswert 0, dem zweiten Segment 10 der Positionswert 0,5 und dem letzten der drei Segmente 10 der Positionswert 1 zugewiesen. Wird der Originalsatz aber nur in zwei Segmente 10 unterteilt (etwa bei den ersten beiden Originalsätzen in Fig. 1), erhält das erste Segment 10 den Positionswert 0, während das zweite und letzte Segment 10 den Positionswert 1 erhält. Besteht der Originalsatz aus vier Segmenten 10 hat das erste Segment 10 den Positionswert 0, das zweite Segment 10 den Positionswert 0,33 und das dritte Segment 10 den Positionswert 0,66, während das letzte Segment wieder den Positionswert 1 erhält.

[0028] Ferner ist es möglich, anstelle der tatsächlichen Position in einem Satz nur anzugeben, ob das jeweilige Segment 10 am Anfang oder am Ende einer Ansage oder zwischen zwei Segementen 10 steht.

[0029] Unter Übergangswerten (Ü) im Sinne dieser Anmeldung werden die Beziehungen eines Segments 10 bzw. Suchkriteriums zu dem diesem Segment 10 bzw. Suchkriterium vorangehenden und folgenden Segment 10 bzw. Suchkriterium verstanden. Diese Beziehung für das jeweilige Segment 10 wird vorliegend zu dem letzten Buchstaben des vorherigen Segments 10 und zum ersten Buchstaben des folgenden Segments 10 hergestellt. Die genauere Erläuterung soll nun anhand des ersten Orignalsatzes (In 100 Metern links abbiegen) gemäß Fig. 1 vollzogen werden. Da das erste Segment 10 bzw. Suchkriterium dieses Originalsatzes (In 100 Metern) kein vorangehendes Segment 10 bzw. Suchkriterium aufweist, wird in dem Datensatz, welcher dieses Segment 10 betrifft und die Indexnummer 3 (Fig.2) trägt, als vorderer Übergangswert der Eintrag "leer" vermerkt. Da dem Segment 10 (In 100 Metem) im Originalsatz das Segment 10 (links abbiegen) folgt, wird, weil im vorliegenden Ausführungsbeispiel als Übergangswerte (Ü) lediglich ein Buchstabe verwendet wird, als hinterer Übergangswert (Ü) im Datensatz mit der Indexhummer 3 ein "I" vermerkt. In gleicher Weise wird mit dem zweiten Segment (10) des Originalsatzes (links abbiegen) verfahren, das im Datensatz mit der Indexnummer 9 zu dem vorderen Übergangswert (Ü) "n" und zu dem hinteren Übergangswert (Ü) "leer" führt, da das Segment 10 (In 100 Metem), welches dem Segment 10 (links abbiegen) im Originalsatz vorangeht, mit einem "n" endet und dem Segment 10 (links abbiegen) im Originalssatz kein Segment 10 mehr folgt.

[0030] Die im vorstehenden Absatz gezeigte Beschränkung der Übergangswerte (Ü) für das jeweilige Segment 10 auf den letzten Buchstaben des diesem Segments 10 vorangehenden bzw. den ersten Buchstaben des diesem Segments 10 folgenden Segments 10 ist nicht zwingend. Vielmehr können anstelle von Einzelbuchstaben als jeweilige Übergangswerte (Ü) auch Buchstabengruppen oder Phoneme von dem jeweils betrachten Segment 10 vorgehenden und folgenden Segmenten 10 verwendet werden. Dabei führt insbesondere die Verwendung von Phonemen zu einer qualitativ hochwertigen Wiedergabe von aus Audiofiles anhand der Datensätze gemäß Fig. 2 zusammengesetzten Ansagen.

[0031] Weiter sei darauf hingewiesen, daß die in Fig. 2 gezeigten Einträge 12 nicht auf die Länge, die Position und die beiden Übergangswerte beschränkt sein müssen. Vielmehr können auch noch weitere Einträge 12 - nicht gezeigt - vorgesehen sein, um die Qualität der Ansagen weiter zu verbessern. Da es einen Betonungsunterschied zwischen Frage- und Ausrufsätzen gibt, obwohl die textliche Wiedergabe des entsprechenden Satzes ohne Berücksichtigung von Satzzeichen völlig identisch ist, kann als weiterer Eintrag 12 in der Datenbank 11 gemäß Fig.2 eine Spalte vorgesehen sein, in der vermerkt ist, ob das jeweilige Segment 10 bzw. Suchkriterium aus einem Frage- oder Ausrufesatz stammt. Letzteres kann beispielsweise so organisiert sein, dass eine "O" vergeben wird, wenn das jeweilige Segment 10 aus einen Originalsatz stammt, der eine Frage aufwirft, und daß eine "1" eingeschrieben wird, wenn das Segment 10 aus einem Originalsatz entnommen wurde, der einen Ausruf zum Gegenstand hat. Über den Eintrag von Frage- und Ausrufesätzen hinaus können in einem anderen - nicht näher erläuterten - Ausführungsbeispiel auch weitere Satzzeichen als Einträge 12 in die Datenbank 11 gemäß Fig. 2 aufgenommen werden, die geeignet sind, Betonungsunterschiede herbeizuführen.

[0032] Sind nun alle Originalsätze in der vorstehenden Weise segmentiert und die sich ergebenden Segmente 10 analysiert worden, führt dies für die vier Originalsätze gemäß Fig. 1 zu einer in Fig. 2 gezeigten Datenbank 11. Deutlich ist dieser Datenbank 11 entnehmbar, daß die verschiedenen Datensätze anhand der Suchkriterien alphabetisch aufsteigend sortiert sind.

[0033] Im folgenden soll nun die Rekonstruktion des in der Liste gemäß Fig. 1 aufgeführten Originalsatzes "In 100 Metem links abbiegen" anhand der Datensätze der Datenbank 11 veranschaulicht werden.

[0034] Dazu wird der gesamte, zur Wiedergabe bestimmte Satz "In 100 Metem links abbiegen" in ein Format gebracht, in welchem auch die Suchkriterien der entsprechenden Segmente 10 vorliegen. Da im dargestellten Ausführungsbeispiel die Suchkriterien der textlichen Wiedergabe der Audiofiles entsprechen, wird der wiederzugebende Satz ebenfalls in dieses Format gebracht, sofern er nicht schon in diesem Format vorliegen sollte. Dann wird geprüft, ob ein oder mehrere Suchkriterien in der Datenbank 11 vorhanden sind, die eine vollständige Übereinstimmung mit dem entsprechend formatierten und zur Wiedergabe bestimmten Satz "In 100 Metem links abbiegen" aufweisen. Da dies entsprechend der in Fig. 2 gezeigten Datenbank nicht der Fall ist, wird der Suchstring des zur Wiedergabe bestimmten Satzes (In 100 Metem links abbiegen) um das letzte Wort "abbiegen" gekürzt und untersucht, ob dieser Teilsatz "In 100 Metem links" in dieser Form in der Datenbank 11 als Suchkriterum vorkommt. Da auch dieser Vergleich wegen des Inhalts der Datenbank 11 negativ ausfallen muß, erfolgt eine erneute Reduzierung des zur Wiedergabe bestimmten Satzes um ein Wort. Sodann wird wieder geprüft, ob der dann so reduzierte Teil des Satzes "In 100 Metem" in den Datensätzen der Datenbank 11 als Suchkriterium vorkommt. Gemäß dem Inhalt der Datenbank 11 kann dies für die Datensätze mit den Indizes 3 bis 6 bejaht werden. Dies führt dann zu einer Zwischenspeicherung der gefundenen Indizes 3 bis 6.

[0035] Dann werden die Teile des Satzes, welche in den vorherigen Schritten abgetrennt wurden, wieder in ihrer ursprünglichen Reihenfolge "links abbiegen" zusammengefügt und untersucht, ob es für diesen Satzbestandteil wenigstens eine Entsprechung in den Suchkriterien der Datenbank 11 gibt. Bei diesem Vergleich werden die Datensätze mit den lndizes 9 und 10 als Datensätze erkannt, bei denen die Suchkriterien mit dem Teilsatz "links abbiegen" vollständig übereinstimmen. Auch diese lndizes 9 und 10 werden zwischengespeichert. Damit ist die Sucharbeit beendet, da der Suchstring vollständig durch Suchkriterien in der Datenbank 11 abgebildet werden kann.

[0036] Anschließend werden aus den jeweils gefundenen Indizes Kombinationen gebildet, welche jeweils den wiederzugebenden Satz ergeben. Letzeres ist in Fig.3 näher gezeigt. Da vorliegend der wiederzugebende Satz aus den Indizes 9 und 10 sowie den Indizes 3 bis 6 gebildet wird, haben nur die Kombinationen in Fig. 3 mit den laufenden Nummern 1 bis 8 Relevanz. Die übrigen Kombinationen in Fig. 3 haben in diesem Ausführungsbeispiel keine Bedeutung.

[0037] Der Vollständigkeit halber sie darauf hingewiesen, dass in Fig. 3 die Spalteninhalte der Spalte "Text" nur der Veranschaulichung dienen und nicht zusammen mit den Kombinationen abgelegt werden.

[0038] Mit Beendigung der Sucharbeit werden dann die Längen- und Positionsangaben und Angaben zu den Übergangswerten des wiederzugebenden Satz entsprechend der Konvention, welche bei der Erstellung der entsprechenden Einträge 12 in die Datenbank 11 maßgeblich waren, erstellt, indem für die Satzteile, deren Index in der relevanten Kombination steht, die Längen- und Positionsangabe sowie die jeweiligen Übergangswerte zwischengespeichert werden. Eine solche Zwischenspeicherung ist für den wiederzugebenden Satz "In 100 Metem links abbiegen" in Fig.4 gezeigt, wobei durch die Bezeichnung W angedeutet ist, daß es sich um die Position und die Übergangswerte der Segmente im wiederzugebenden Satz und nicht um die in der Datenbank 11 gespeicherten Werte handelt. Für die Längenangaben kann auf die Werte zurückgegriffen werden, die in den Datensätzen mit den Indizes 3 bis 6 bzw. 9 und 10 eingetragen sind, da durch den Umstand, daß, wenn der wiederzugebende Satz oder ein Tell davon eine vollständige Entsprechung in den Suchkriterien gemäß Fig. 2 gefunden hat, die Längenangabe in den entsprechenden Datensätzen der Datenbank 11 gemäß Fig. 2 mit dem Längenwert des Teils des wiederzugebenen Satzes übereinstimmt.

[0039] Nachdem die Kombinationen entsprechend der laufenden Nummern 1 bis 8 in Figur 3 gebildet worden sind, wird eine Bewertung der Kombinationen durchgeführt, indem für jede dieser Kombinationen ein Bewertungsmaß B mit Hilfe der Einträge 12 für die Segmente 10 oder Suchkriterien in der Datenbank 11 ermittelt wird, die an der jeweiligen Kombination beteiligt sind. Die Ermittlung des Bewertungsmaßes B erfolgt dabei gemäß der nachfolgenden Formel:

wobei W_n ein Gewichtungsfaktor für den n-ten Eintrag 12, f_n,i ein funktionaler Zusammenhang des n-ten Eintrags 12, n ein Laufindex, der über die einzelnen Einträge eines einem an einer Kombination beteiligten Segments zugeordneten Datensatzes läuft, und i weiterer Laufindex ist, über alle Indizes der an der Kombination beteiligten Datensätze oder Segmente läuft.

[0040] Wie leicht einzusehen ist, wird also für jeden in die Formel aufgenommenen Eintrag n ein funktionaler Zusammenhang f_n,i(n) erstellt. Um eine Gewichtung der verschiedenen, in die Formel eingesetzten funktionalen Zusammenhänge herstellen zu können, können einige oder auch alle funktionalen Zusammenhänge mit einem Gewichtungsfaktor W_n versehen sein.

[0041] Wird beispielsweise für die Längeninformation L eines Segments 10 der funktionelle Zusammenhang f_L,i(L) so gebildet, daß der Wert eins durch den Wert der Länge L geteilt wird, der dem Eintrag (Länge) im jeweiligen Datensatz i entspricht, so wird jeweils ein Wert erhalten, der für jeden Datensatz, dessen Index an einer Kombination beteiligt ist, kleiner eins ist, sofern - wie hier angenommen - der Gewichtungsfaktor W_L für die Länge gleich eins ist. Wie leicht einzusehen ist, liefern längere Segmente 10 formelbedingt kleinere Werte f_Li(L). Diese kleineren Werte sind bevorzugt anzustreben, weil durch die längeren Segmente eine schon vorhandene Satzmelodie besser ausgenutzt werden kann.

[0042] Um einen funktionellen Zusammenhang f_Pi(P) für die Positionsinformation P herzustellen, kann dieser beispielsweise so ausgestaltet sein, daß die zwischengespeicherten Positionswerte Pw aus Fig. 4 mit den Positionswerten P_A der entsprechenden Datensätze in der Datenbank so in Beziehung gesetzt werden, daß bei einer Überstimmung in den Positionswerten der Wert Null vergeben wird (wenn P_W = P_A dann f_P,i(P) = 0) und bei fehlender Übereinstimmung beispielsweise der Wert eins (wenn Pw ≠ P_A) dann f_P,i(P) = 1) ausgegeben wird, wenn der Gewichtungsfaktor W_P eins ist. Andere Werte als eins lassen sich über den Gewichtungsfaktor W_P einstellen.

[0043] Der funktionelle Zusammenhang für die Übergangswerte f_Ü,i(Ü_vorn), f_Ü,i(Ü_hinten) kann anlog zum vorstehenden Absatz gebildet werden, indem die zwischengespeicherten Übergangswerte Ü_vorn,W, Ü_hinten,W aus Fig. 4 mit den Übergangswerten Ü_vorn,D, Ü_hinten,D der entsprechenden Datensätze aus der Datenbank so in Beziehung gesetzt werden, daß bei Übereinstimmungen eine Null und bei fehlender Übereinstimmung ein Wert größer Null vergeben wird. Auch hier kann wieder ein entsprechender Gewichtungsfaktor W_Ü verwendet werden. Um eine Gleichgewichtung der Übergangswerte Ü mit den übrigen Faktoren herzustellen, sollten die funktionellen Zusammenhänge für den vorderen und hinteren Übergangswert zweckmäßigerweise jeweils mit einem Gewichtungsfaktor Wü von 0,5 versehen werden. Für das beschriebene Ausführungsbeispielbeispiel ergibt sich somit folgende Formel

[0044] In Fig 5 ist eine Tabelle gezeigt, die für jede der acht gefundenen Kombinationen die Berechnung des Bewertungsmaßes B anhand der obigen Formel näher veranschaulicht. In dieser Tabelle haben die Spaltenbezeichnungen folgende bedeutung:

Ldf. Nr.: entspricht der laufenden Nummer der Kombinationen gemäß Fig. 3,

[0045] Kombinationen entspricht den Kombinationen gemäß Fig. 3,

Länge: entspricht der Länge L des Suchkriteriums entsprechend Fig. 2,
Ergebnis I: entspricht dem funktionalen Zusammenhang f_L(L) = 1/Länge,
Position W: entspricht Positionswerten P, die für den wiederzugebenden Satz zwischengespeichert und in Fig. 4 gezeigt sind,
Position A: entspricht den datensatzbezogenen Positionseinträgen P in der Datenbank 11 gemäß Fig. 2,
Ergebnis II: zeigt das Ergebnis des funktionalen Zusammenhangs f_P,i(P) zischen Position W und Position A,
Vorne W: entspricht den in Fig. 4 gezeigten vorderen Übergangswerten, die für den wiederzugebenden Satz zwischengespeichert sind,
Vorne A: entspricht den datensatzbezogenen vorderen Übergangswerten in der Datenbank 11 gemäß Fig. 2,
WÜ (vorne): zeigt den Gewichtungsfaktor W_ü für den vorderen Übergangswert,
Ergebnis III: zeigt das Ergebnis des funktionalen Zusammenhangs f_Ü,i(Ü_vorn) zwischen vorne W und vorne A unter Berücksichtigung des Gewichtungsfaktors W_ü,
Hinten W: entspricht den in Fig. 4 gezeigten hinteren Übergangswerten, die für den wiederzugebenden Satz zwischengespeichert sind,
Hinten A: entspricht den datensatzbezogenen hinteren Übergangswerten in der Datenbank 11 gemäß Fig. 2,
WÜ (hinten): zeigt den Gewichtungsfaktor W_ü für den hinteren Übergangswert,
Ergebnis IV: zeigt das Ergebnis des funktionalen Zusammenhangs f_Ü,i(Ü_hinten) zwischen hinten W und hinten A unter Berücksichtigung des Gewichtungsfaktors W_ü
Summe: Addition der Ergebnisse I bis IV
B: Addition der Summen je laufender Nummer

[0046] Deutlich ist der Tabelle gemäß Fig. 5 entnehmbar, daß sich für jede laufende Nummer B-Werte ergeben, die zwischen 0,8 und 4,8 liegen. Außerdem ist der Tabelle gemäß Fig. 5 entnehmbar, daß auch doppelte B-Werte vorhanden sind. Da vorzugsweise nur solche Audiofiles aus Datensätzen der Datenbank 11 zur Sprachwiedergabe kombiniert werden sollen, deren Kombinationen entsprechend Fig. 3 nach einer Bewertung gemäß der obigen Formel den niedrigsten B-Wert von allen Kombination haben, sind alle vorkommenden B-Werte, die gemäß der Tabelle gemäß Fig. 5 größer als 0,8 sind, bedeutungslos. Diese Bedeutungslosigkeit ist aber bei den Kombinationen der laufenden Nummern 1 und 5 gemäß Fig. 5 nicht gegeben, da bei diesen Kombinationen die B-Werte bei 0,8 liegen und somit die kleinsten B-Werte darstellen. Außerdem sind die zur Bildung der Kombinationen gemäß der laufenden Nummern 1 und 5 verwendeten Datensätze 3 und 5 (gemäß Fig. 2) gleich. Eine solche Situation tritt jedoch in der Praxis praktisch nicht ein, da die Datenbank gemäß Fig. 2 vor ihrer endgültigen Festigstellung optimiert wird. Diese Optimierung wird so durchgeführt, daß nach Erstellung derDatenbank die Datensätze der einzelnen Segmente verglichen werden, um festzustellen, ob Datensätze vorhanden sind, die in allen Einträgen übereinstimmen, die also beim beschriebenen Ausführungsbeispiel gleiche Suchkriterien, Längenangaben, Positionsangaben und Übergangswerte aufweisen. Kann dies festgesteltt werden, werden die doppelt vorhandenen Datensätze gelöscht. Damit ist kein Qualitätsverlust verbunden, da die doppelt vorkommenden Datensätze bezüglich ihrer Bewertung identisch sind.

[0047] Wird dieser Optimierungsschritt durchgeführt, werden die Datensätze mit den Indizes 3 und 5 als doppelt vorhanden gekennzeichnet und nur noch entsprechend einer weiteren Konvention der Datensatz in der Datenbank belassen, der die kleinste Index-Nummer hat. Das Herauslöschen des Datensatzes mit dem Index 5 führt dazu, daß in Fig. 4 keine Kombinationen mehr auftreten, die die laufenden Nummern 5 und 6 haben. Folglich entfallen auch in der Tabelle gemäß Fig. 5 die laufenden Nummern 5 und 6 weg, so daß für diese Kombinationen keine B-Werte ermittelt werden und die Kombination 3/9 (laufende Nummer 1) als die Kombination mit dem kleinsten B-Wert festgestellt wird.

[0048] Aber selbst dann, wenn nach Ausführung von Optimierungschritten und der Bewertung von Kombinationen gleiche B-Werte ermittelt werden, können Probleme dadurch verhindert werden, daß mittels einer Festlegung bestimmt wird, daß beispielsweise in einem solchen Fall nur die Kombination, welche zuerst gefunden wurde, verwendet wird.

[0049] Steht nach der Durchführung der Bewertung fest, welche Kombination den geringsten B-Wert hat, werden anhand der beteiligten Indizes die entsprechenden Audiofiles zusammengesetzt und ausgegeben. Hat sich herausgestellt, daß im vorstehend erörterten Ausführungsbeispiel die Kombination 3/9 die Kombination mit dem kleinsten B-Wert ist, werden die entsprechenden Audiofiles (file 3 und file 9) kombiniert und ausgegeben.

[0050] Der Vollständigkeit halber sei darauf hingewiesen, daß die Audiofiles nicht notwendig in der Datenbank 11 gemäß Fig. 2 gespeichert sein müssen. Vielmehr ist ausreichend, wenn in der Datenbank 11 entsprechende Verweise auf die an einem anderen Ort abgelegten Audiofiles vorhanden sind.

Im folgenden soll nun eine andere Art der Suche erläutert werden:

[0051] Auch in diesem Beispiel wird von dem Wiedergabesatz "In 100 Metern links abbiegen" ausgegangen. Wird dieser Satz als Textstring empfangen, wird zunächst geprüft, ob zumindest der Anfang dieses Satzes mit einem Suchkriterien in der Tabelle gemäß Fig. 2 übereinstimmt. Bei dieser Prüfung wird die Tabelle gemäß Fig. 2 von hinten, d. h. beginnend mit dem letzten Eintrag begonnen. Dies wäre vorliegend der Datensatz mit dem Index 10. Während dieser Prüfung wird dann der Eintrag "in 100 Metern" gefunden, der den Index 6 aufweist. Da der gefundene Eintrag "in 100 Metern" den Wiedergabesatz nicht vollständig abdecken kann, wird der Teil, welcher vomSuchkriterium des eben gefundenen Datensatzes nicht angedeckt wird, abgetrennt. Außerdem wird der der Datensatz mit Index 6 zwischengespeichert.

[0052] Sodann wird geprüft, ob denn für den abgetrennten Teil des Wiedergabesatzes "links abbiegen" wenigstens eine teilweise Entsprechung in den Suchkriterien gemäß der Tabelle in Fig. 2 vorhanden ist. Auch bei dieser Suche wird die Tabelle gemäß Fig. 2 von unten nach oben durchsucht. Bei dieser Suche wird-wie leicht einzusehen ist - sofort der Eintrag "links abbiegen" gefunden, welcher den Index 10 besitzt. Sodann wird der eben gefundene Datensatz mit Index 10 kopiert und zusammen mit dem Datensatz mit Index 6 zwischengespeichert. Wie oben schon erläutert wird dann der gefundene Satzteil aus dem Suchstring abgetrennt und die Suche ggf. erneut gestartet. Da jetzt jedoch der abgetrennte Teil keinen Inhalt mehr hat, bedeutet dies, daß die Kombination der Suchkriterien mit den Indizes 6 und 10 eine Kombination ist, welche den wiederzugebenden Satz vollständig erfaßt.

[0053] Tritt diese Situation ein, wird die Suche nach dem Teil des Wiedergabesatzes "links abbiegen" fortgesetzt, wobei nicht am Ende der Tabelle gemäß Fig. 2 begonnen wird, sondern nach der Stelle, an der die letzte Entsprechung (hier Datensatz mit dem Index 10) gefunden wurde. Dies führt dazu, daß dann der Eintrag mit dem Index 9 gefunden wird. Nach dem Finden des Datensatzes mit Index 9 wird auch hier der mit Index 6 kopiert und zusammen mit dem gefundenen Datensatz mit Index 9 als mögliche Zwischenlösung zwischengespeichert. Sodann wird der gefundene Teil "links abbiegen" von Suchstring abgetrennt und die Suche nach dem Rest begonnen. Da mit dem Abtrennen des Teils "links abbiegen" der Suchstring keinen Inhalt mehr hat, wird die Indexkombination 6, 9 als Kombination vermerkt wird, die den wiederzugebenden Satz vollständig erschöpft.

[0054] Diese vollständige Erschöpfung führt dazu, daß mit der Suche nach dem Teil des Wiedergabesatzes "links abbiegen" fortgesetzt wird, wobei auch hier nicht am Ende der Tabelle gemäß Fig. 2 begonnen wird, sondern nach der Stelle, an der der letzte Eintrag (hier der Datensatz mit dem Index 9) gefunden wurde. Dies führt dazu, daß der Eintrag "links" mit dem Index 8 gefunden wird, weil bei der Suche immer danach gesucht wird, ob der Anfang des jeweiligen Suchstrings in den Suchkriterien enthalten ist.

[0055] Dann werden die Datensätze mit Index 6 und Index 8 als mögliche Teillösung zwischengespeichert.

[0056] Anschließend erfolgt wieder das Abtrennen des gefundenen Teils "links" und die Weitersuche nach dem im Suchstring verbliebenen Teils "abbiegen". Diese Suche führt dann dazu, daß der Eintrag mit dem Index 2 gefunden wird. Dann wird wieder die im letzten Schritt als Teillösung zwischengespeicherte Kombination 6, 8 kopiert und zusammen mit dem Datensatz mit Index 2 als weitere Teillösung zwischengespeichert. Wiederum wird dann der gefundene Teil aus dem Suchstring abgetrennt. Da der Suchstring nun wiederum leer ist, wird die Kombination der Datensätze mit den Indizes 6, 8, 2 als Kombination gespeichert, welche den Wiedergabesatz vollständig wiedergibt. Dann wird zum vorherigen Schritt zurückgekehrt und die Suche nach einer Entsprechung des Suchstrings "abbiegen" fortgesetzt, wobei auch hier die Suche nach dem Eintrag begonnen wird, wo die letzte Entsprechung (hier der Datensatz mit dem Index 2) gefunden wurde. Hierbei wird der Datensatz mit dem Index 1 gefunden, was zu dem Resultat führt, daß die Kombination der Datensätze mit den Indizes 6, 8, 1 als Kombination gespeichert wird, welche den Wiedergabesatz vollständig wiedergibt.

[0057] Dann wird die Suche nach einer Entsprechung des Suchstrings "links abbiegen" fortgesetzt, wobei auch hier die Suche nach dem Eintrag begonnen wird, wo die letzte Entsprechung (hier der Datensatz mit dem Index 8) gefunden wurde. Dies führt in entsprechender Anwendung der erläuterten Grundsätze zum Finden der folgenden Indexkombinationen 6/7/2,und 6/7/1.

[0058] Nach dem Finden der Kombination 6/7/1 wird dann die Suche mit dem Suchstring "In 100 Metem links abbiegen" fortgesetzt, wobei diese Suche nach dem zuletzt gefundenen Index 6 einsetzt. Wird der gesammte Wiedergabesatz entsprechend der vorstehenden Grundsätze analysiert, werden alle Kombinationen gefunden die in Fig. 3 unter den laufenden Nummern 1 bis 28 gezeigt sind. Dies führt - wie leicht einzusehen ist - zu einer entsprechenden Ausdehnung der Tabelle gemäß Fig. 5.

[0059] Um die erforderlichen Such- und Rechenschritte zu begrenzen, ist zweckmäßigerweise vorgesehen, daß, wenn der Wiedergabesatz entsprechend der vorstehenden Grundsätze vollständig analysiert werden soll, diese Analyse abgebrochen wird, wenn beispielsweise B-Werte ermittelt werden, die kleiner oder gleich einem vorgegebenen Wert, z. B. 0,9 sind. Dies führt nicht zu einem Qualitätsverlust, weil bei der Suche nach Entsprechungen des jeweiligen Suchtrings zuerst immer lange Suchkriterien in der Datenbank 11 gefunden werden.

[0060] Ferner kann vorgesehen sein, daß die Suche nach Kombinationen dann abgebrochen wird, wenn eine bestimmte vorgebbare Anzahl von Kombinationen, beispielsweise 10 Kombinationen gefunden wurde. Wie leicht einzusehen ist, wird durch diese Maßnahme der Speicherbedarf und die erforderliche Rechenleistung reduziert. Besonders vorteilhaft ist diese Kombinationsbegrenzung dann, wenn die Suche entsprechend der letztbenannten Methode durchgeführt wird. Dies ist darauf zurückzuführen, daß bei dieser Suchmethode zuerst immer Iängere Segmente gefunden werden. Dieses Finden der längeren Segmente bietet die Gewähr dafür, daß in der Regel schon unter den ersten Kombinationen die beste Kombination erkannt wird und somit kein Qualitätsverlust eintritt.

Ansprüche

1. Verfahren zum Zusammensetzen von Ansagen zur Sprachausgabe aus Segmenten (10) zumindest eines Originalsatzes, die als Audiofiles gespeichert sind, bei dem eine zur Ausgabe bestimmte Ansage aus den als Audiofiles gespeicherten Segmenten (10) zusammengesetzt wird, die anhand von Suchkriterien aus den gespeicherten Audiofiles ausgewählt werden,
dadurch gekennzeichnet, daß jedem Segment (10) zumindest eine seine phonetischen Eigenschaften im Originalsatz kennzeichnende Größe (12) zugeordnet ist, und daß anhand der die phonetischen Eigenschaften im Originalsatz kennzeichnenden Größen (12) der einzelnen Segmente (10) überprüft wird, ob die den als Ansage auszugebenden Wiedergabesatz bildenden Segmente (10) entsprechend ihrem natürlichen Sprachfluß zusammengesetzt sind.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß jedem Segment (10) mehrere seine phonetischen Eigenschaften im Originalsatz kennzeichnende Größen (12) zugeordnet sind.

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß als die phonetischen Eigenschaften der Segmente (10) im jeweiligen Originalsatz kennzeichnenden Größen (12) zumindest eine der folgenden Größen verwendet wird:

- Länge (L) des jeweiligen Segments (10),

- Position (P) des jeweiligen Segments (10) im Originalsatz,

- vorderer und/oder hinterer Übergangswert (Ü) des jeweiligen Segments (10) zum vorstehenden bzw. nachfolgenden Segment (10) im Originalsatz.

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß als Länge (L) des jeweiligen Segments (10) die Länge des jeweils zugeordneten Suchkriteriums verwendet wird.

5. Verfahren nach Anspruch 3 oder 4, dadurch gekennzeichnet, daß daß als Übergangswerte (Ü) die letzten bzw. ersten Buchstaben, Silben oder Phoneme des vorstehenden bzw. nachfolgenden Segments (10) im Originalsatz verwendet werden.

6. Verfahren nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, daß als weitere Größe (12) Angaben darüber vorgesehen sind, ob das jeweilige Segment (10) des Originalsatzes aus einem Frage- oder Ausrufesatz stammt.

7. Verfahren nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, daß für eine gefundene Kombination von Segmenten (10), die den als Ansage auszugebenden Wiedergabesatz bildet, ein Bewertungsmaß (B) aus den die phonetischen Eigenschaften im Originalsatz kennzeichnenden Größen (12) der einzelnen Segmente (10) gemäß der nachfolgenden Formel berechnet wird:

wobei f_n,i(n) ein funktionaler Zusammenhang der n-ten Größe, i ein das Segment (10) bezeichnender Index und W_n ein Gewichtungsfaktor für den funktionalen Zusammenhang der n-ten Größe ist.

8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß für jede gefundene Kombination von Segmenten (10), die den als Ansage auszugebenden Wiedergabesatz bildet, ein Bewertungsmaß (B) berechnet wird, und daß aus den gefundenen Kombinationen von Segmenten (10) diejenige als wiederzugebende Ansage ausgewählt wird, deren Bewertungsmaß (B) anzeigt, daß die Segmente (10) der Kombination entsprechend einem natürlichen Sprachfluß zusammengesetzt sind.

9. Verfahren nach Anspruch 7 oder 8, dadurch gekennzeichnet, daß das Bewertungsmaß (B) aus den funktionalen Zusammenhängen f_n(n) zumindest der folgenden Größen Länge (L) und Position (P) sowie vorderer und hinterer Übergangswert (Ü_vorn, Ü_hinten) des Segments (10) gemäß nachfolgender Formel berechnet wird:

10. Verfahren nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, daß der Wiedergabesatz in einem, den Suchkriterien entsprechenden Format vorliegt, wobei vorzugsweise für die Suchkriterien und die übermittelten Wiedergabesätze alphanumerische Zeichenketten verwendet werden.

11. Verfahren nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, daß die Suchkriterien in einer Datenbank (11) hierachisch angeordnet sind.

12. Verfahren nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, daß

- zum Auswählen der als Audiofiles gespeicherten Segmente (10) für eine Ansage geprüft wird, ob der als Ansage gewünschte Wiedergabesatz in seiner Gesamtheit mit einem in einer Datenbank (11) zusammen mit einem zugeordneten Audiofile abgelegten Suchkriterium übereinstimmt, wobei, wenn dies nicht der Fall ist, das Ende des jeweiligen Wiedergabesatzes solange reduziert und dann auf Übereinstimmungen mit in der Datenbank (11) abgelegten Suchkriterien überprüft wird, bis für den verbleibenden Teil des Wiedergabesatzes eine oder mehrere Übereinstimmung gefunden wurden,

- für solche Teile des Wiedergabesatzes, die im einem vorhergehenden Schritt abgetrennt wurden, die im letzen Absatz angegebene Überprüfung fortgesetzt wird,

- für jede Kombination von Segmenten (10), deren Suchkriterien vollständig mit dem Wiedergabesatz übereinstimmen, überprüft wird, ob die den als Ansage auszugebenden Wiedergabesatz bildenden Segmente (10) entsprechend ihrem natürlichen Sprachfluß zusammengesetzt sind, und

- zur Wiedergabe einer gewünschten Ansage die Audiofiles der Segmente (10) verwendet werden, deren Kombination dem natürlichen Sprachfluß am nächsten kommen.

Zeichnung