Technisches Gebiet
[0001] Die Erfindung befaßt sich mit einem Verfahren zum Zusammensetzen von Ansagen zur
Sprachausgabe, insbesondere mit der Verbesserung der Wiedergabequalität solcher Sprachausgaben.
Stand der Technik
[0002] Im Stand der Technik sind Anordnungen bekannt, bei denen zur Realisierung von Sprachausgaben
entsprechende Einträge aus einer Datenbank aufgerufen werden. Im einzelnen kann diese
so ausgeführt sein, daß beispielsweise eine bestimmte Anzahl von verschiedenen Ansagen,
also z. B. von verschiedenen Sätzen, Befehlen, Benutzeraufforderungen, Redewendungen,
Phrasen oder dergleichen, in einem Speicher abgelegt sind und daß entsprechend dem
Bedarf nach einer abgelegten Ansage diese aus dem Speicher ausgelesen und wiedergegeben
wird. Wie leicht einzusehen ist, sind derartige Anordnungen sehr inflexibel, da nur
die Ansagen wiedergegeben werden können, die vorher vollständig gespeichert worden
sind.
[0003] Daher ist man dazu übergegangen, Ansagen in Segmente aufzuteilen und als entsprechende
Audiofiles zu speichern. Soll nun eine Ansage ausgegeben werden, ist es notwendig
die gewünschte Ansage aus den Segmenten zu rekonstruieren. Dies geschieht im Stand
der Technik so, daß für die zu bildende Ansage lediglich entsprechende Hinweise auf
die Segmente in der für die Ausgabe relevanten Reihenfolge übertragen werden. Mittels
dieser Hinweise werden dann die entsprechenden Audiofiles aus dem Speicher ausgelesen
und für die Ausgabe zusammengefügt. Diese Methode zur Bildung von Sätzen oder Satzteilen
zeichnet sich durch eine große Flexibilität bei nur geringem Speicherbedarf aus. Als
nachteilig wird aber empfunden, daß sich eine mittels dieser Methode erstellte Wiedergabe
durch die Nichtberücksichtigung des natürlichen Sprachflusses sehr synthetisch klingt.
Zusammenfassung der Erfindung
[0004] Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren zum Bilden von Ansagen aus
Segmenten anzugeben, welches den natürlichen Sprachfluß berücksichtigt und somit zu
harmonischen Wiedergabeergebnissen führt.
[0005] Diese Aufgabe wird durch das Verfahren nach Anspruch 1 gelöst. Vorteilhafte Aus-
und Weiterbildungen sind den abhängigen Ansprüchen entnehmbar..
[0006] Erfindungsgemäß ist also bei einem Verfahren zum Zusammensetzen von Ansagen zur Sprachausgabe
aus Segmenten zumindest eines Originalsatzes, die als Audiofiles gespeichert sind,
bei dem eine zur Ausgabe bestimmte Ansage aus den als Audiofiles gespeicherten Segmenten
zusammengesetzt wird, die anhand von Suchkriterien aus den gespeicherten Audiofiles
ausgewählt werden, vorgsehen, daß jedem Segment zumindest eine seine phonetischen
Eigenschaften im Originalsatz kennzeichnende Größe zugeordnet ist, und daß anhand
der die phonetischen Eigenschaften im Originalsatz kennzeichnenden Größen der einzelnen
Segmente überprüft wird, ob die den als Ansage auszugebenden Wiedergabesatz bildenden
Segmente entsprechend ihrem natürlichen Sprachfluß zusammengesetzt sind. Auf diese
Weise läßt es sich erreichen, daß bei der Sprachwiedergabe der natürliche Sprachfluß
und rhythmus einer Ansage weitgehend rekonstruiert wird, ohne daß die Ansage selbst
vollständig gespeichert sein muß.
[0007] Um noch natürlichere Ansage zu erhalten, ist es zweckmäßig, wenn jedem Segment mehrere
seine phonetischen Eigenschaften im Originalsatz kennzeichnende Größen zugeordnet
sind, wobei die Größen vorteilhafter Weise aus folgenden Größen ausgewählbar sind:
Länge des jeweiligen Segments, Position des jeweiligen Segments im Originalsatz, vorderer
und/oder hinterer Übergangswert des jeweiligen Segments zum vorstehenden bzw. nachfolgenden
Segment im Originalsatz, wobei weiter als Länge des jeweiligen Segments die Länge
des jeweils zugeordneten Suchkriteriums verwendet wird.
[0008] Um besonders gute Ergebnisse zu erreichen, ist bei einer vorteilhaften Weiterbildung
der Erfindung vorgesehen, daß als Übergangswerte die letzten bzw. ersten Buchstaben,
Silben oder Phoneme des vorstehenden bzw. nachfolgenden Segments im Originalsatz verwendet
werden. Eine besonders hochwertige Wiedergabe von aus Audiofiles zusammengesetzten
Wiedergabesätzen wird dann erreicht, wenn als Übergangswerte Phoneme verwendet werden
[0009] Da die Satzmelodie weitgehend von der Satzart abhängt, wird eine weitere Verbesserung
der Wiedergabe erreicht, wenn als weitere Größe Angaben darüber vorgesehen sind, ob
das jeweilige Segment des Originalsatzes aus einem Frage- oder Ausrufesatz stammt.
[0010] Eine zweckmäßige Weiterbildung der Erfindung zeichnet dadurch aus, daß für eine gefundene
Kombination von Segmenten, die den als Ansage auszugebenden Wiedergabesatz bildet,
ein Bewertungsmaß aus den die phonetischen Eigenschaften im Originalsatz kennzeichnenden
Größen der einzelnen Segmente gemäß der nachfolgenden Formel berechnet wird:

wobei f
n,i(n) ein funktionaler Zusammenhang der n-ten Größe, i ein das Segment bezeichnender
Index und W
n ein Gewichtungsfaktor für den funktionalen Zusammenhang der n-ten Größe ist. Als
funktionaler Zusammenhang einer Größe kann dabei z. B. die Größe selbst, ihr Kehrwert
oder ein Übereinstimmungswert der dem gespeicherten Segment zugeordneten Größe mit
der Größe vorgesehen sein, die diesem Segment in der Kombination für die Ansage zuzuordnen
wäre. Die Gewichtungsfaktoren ermöglichen dabei eine sehr leichte Verschiebung der
Präferenzen bei der Ermittlung des Bewertungsmaß.
[0011] Entsprechend den Bewertungsmaßen wird dann aus den gefundenen Kombinationen von Segmenten
diejenige als wiederzugebende Ansage ausgewählt, deren Bewertungsmaß anzeigt, daß
die Segmente der Kombination entsprechend einem natürlichen Sprachfluß zusammengesetzt
sind.
[0012] Bei einer anderen Ausgestaltung der Erfindung ist vorgesehen, daß das Bewertungsmaß
B aus den funktionalen Zusammenhängen f
n(n) zumindest der folgenden Größen Länge L und Position P sowie vorderer und hinterer
Übergangswert Ü
vorn, Ü
hinten des Segments gemäß nachfolgender Formel berechnet wird:

[0013] Besonders einfach ist die Auswertung dann, wenn der Wiedergabesatz in einem, den
Suchkriterien entsprechenden Format vorliegt, wobei vorzugsweise für die Suchkriterien
und die übermittelten Wiedergabesätze alphanumerische Zeichenketten verwendet werden.
[0014] Um eine schnelle Suche in einer Datenbank zu erzielen, ist es zweckmäßig, wenn die
Suchkriterien in einer Datenbank hierachisch angeordnet sind.
[0015] Die Auswahl der Segmente für die Wiedergabe einer Ansage ist besonders einfach, wenn
zum Auswählen der als Audiofiles gespeicherten Segmente für eine Ansage geprüft wird,
ob der als Ansage gewünschte Wiedergabesatz in seiner Gesamtheit mit einem in einer
Datenbank zusammen mit einem zugeordneten Audiofile abgelegten Suchkriterium übereinstimmt,
wobei, wenn dies nicht der Fall ist, das Ende des jeweiligen Wiedergabesatzes solange
reduziert und dann auf Übereinstimmungen mit in der Datenbank abgelegten Suchkriterien
überprüft wird, bis für den verbleibenden Teil des Wiedergabesatzes eine oder mehrere
Übereinstimmung gefunden wurden, wenn für solche Teile des Wiedergabesatzes, die im
einem vorhergehenden Schritt abgetrennt wurden, die im letzen Absatz angegebene Überprüfung
fortgesetzt wird, wenn für jede Kombination von Segmenten, deren Suchkriterien vollständig
mit dem Wiedergabesatz übereinstimmen, überprüft wird, ob die den als Ansage auszugebenden
Wiedergabesatz bildenden Segmente entsprechend ihrem natürlichen Sprachfluß zusammengesetzt
sind, und wenn zur Wiedergabe einer gewünschten Ansage die Audiofiles der Segmente
verwendet werden, deren Kombination dem natürlichen Sprachfluß am nächsten kommen.
[0016] Wird also sichergestellt, daß für jedes Segment mindestens ein Datensatz mit einem
Suchkriterium, einem Audiofile und wenigstens einer eine seine phonetischen Eigenschaften
im Originalsatz kennzeichnende Größe, also eine zusätzliche Information über das jeweilige
Segment angelegt wird, kann anhand der so aufbereiteten Datensätze sehr leicht eine
Kombination von Segmenten erstellt werden, deren Wiedergabe sich von einer gesprochenen
Wiedergabe der entsprechenden Ansage nicht mehr unterscheidet. Diese Wirkung wird
dadurch erreicht, daß vor der Ausgabe einer Ansage, also vor der Wiedergabe von Sätzen,
Satzteilen, Aufforderungen, Befehlen, Phrasen oder dergleichen innerhalb der Datenbank
nach Segmenten gesucht wird, aus denen der gewünschten Ansage entsprechende Kombinationen
gebildet werden können, und daß dann jede gefundene und aus einem oder mehreren Segmenten
bestehende Kombination anhand der Informationen zu jedem verwendeten Segment eine
Bewertung durchgeführt wird, die die Annäherung der Kombination an den natürlichen
Sprachfluß beschreibt. Sind für die ermittelten Kombinationen die Bewertungen abgeschlossen,
so wird für die Ansage die Kombination von Segmenten ausgewählt, die dem natürlichen
Sprachfluß am nächsten kommt.
Kurzdarstellung der Figuren
[0017] Die Erfindung wird im folgenden beispielsweise anhand von Ausführungsbeispielen mit
Bezug auf die beiliegende Zeichnung näher erläutert. Es zeigen:
- Fig. 1
- eine Liste mit vier Originalsätzen;
- Fig. 2
- eine Tabelle zur Veranschaulichung einer Datenbank mit 10 Datensätzen;
- Fig. 3
- eine Tabelle mit Kombinationen aus Segmenten, welche den Wiedergabesatz vollständig
wiedergeben;
- Fig. 4
- eine Tabelle, welche Datensätze für einen segmentierten Wiedergabesatz zeigt; und
- Fig. 5
- eine Tabelle, welche die Gesamtauswertung zeigt.
Wege zum Ausführen der Erfindung.
[0018] In Fig. 1 ist eine Liste von vier Originalsätzen gezeigt, die bei Bedarf als Ansagen
mittels einer Sprachausgabeeinrichtung wiedergegeben können, wobei jeder dieser Originalsätze
durch einen senkrechten Strich in zwei oder mehr Segmente 10 unterteilt ist. Obwohl
jeder dieser vier Originalsätze den gleichen Bedeutungsgehalt aufweist und sich auch
- sieht man von der Reihenfolge einmal ab - keine Unterschiede in den verwendeten
Buchstaben und Ziffern ergeben, zeigen sich doch erhebliche Unterschiede zwischen
den einzelnen Originalsätzen dann, wenn sie akustisch wiedergegeben werden. Dies ist
darauf zurückzuführen, daß sich je nach Stellung von einzelnen Worten oder Wortgruppen
im Satzgefüge unterschiedliche Betonungen ergeben können. Soll beispielsweise der
Satz "In 100 Metern links abbiegen" als Ansage wiedergegeben werden und werden für
die Wiedergabe nicht die Segmente 10.1 und 10.2, sondern die Segmente 10.4 und 10.3
verwendet, führt dies zu keiner harmonischen, dem normalen Sprachfluß entsprechenden
Wiedergabe.
[0019] Will man die satzspezifische Betonung der vier in der Liste (Fig. 1) veranschaulichten
Originalsätze erhalten, ist es ohne Kenntnis der Erfindung erforderlich, jeden dieser
Originalsätze in seiner Gesamtheit als Audiofile abzulegen. Wie leicht einzusehen
ist, führt dies zu einem erheblichen Speicherbedarf.
[0020] Um eine Ausdehnung des Speicherbedarfs zu vermeiden, gleichwohl aber sicherzustellen,
daß harmonische und dem normalen Sprachfluß entsprechende Wiedergabeergebnisse hervorgebracht
werden, ist es erforderlich, eine Reihe von Sätzen in ihrer ursprünglich gesprochenen
Form zu analysieren. Eine derartige Analyse wird nun im folgenden anhand der in Fig.
1 gezeigten Originalsätze exemplarisch durchgeführt:
[0021] Zunächst werden die verschiedenen Sätze für eine Ansage als sogenannte Originalsätze
von einem Sprecher gesprochen und aufgezeichnet.
[0022] Anschließend werden die so aufgenommenen Originalsätze in Segmente 10 unterteilt,
wobei jedes dieser Segmente 10 in einem Audiofile abgelegt wird.
[0023] Außerdem wird jedem Originalsatz eine Gruppe von Suchkriterien zugeordnet. Diese
Gruppe von Suchkriterien wird entsprechend der Segmentierung der Originalsätze aufgeteilt,
wobei jedem Segment 10 ein Suchkriterium zugeordnet wird. Die gegenseitige Zuordnung
von Audiofiles und Suchkriterien erfolgt in einer Datenbank 11, die in Fig. 2 näher
gezeigt ist. Wie dieser Datenbank 11 entnehmbar ist, werden vorliegend als Suchkriterien
alphanumerische Zeichenketten verwendet, wobei die als Suchkriterien verwendeten Zeichenketten
der textlichen Wiedergabe der zugeordneten und als Audiofile abgelegten Segmente 10
entsprechen. Der Vollständigkeit halber sei darauf hingewiesen, daß weder die zuvor
benannten Zeichenketten noch alphanumerische Zeichen als Suchkriterien verwendet werden
müssen sofern sichergestellt ist, daß die als Suchkriterien eingesetzten Zeichen oder
Zeichenfolgen solche Segmente 10, deren textlicher Inhalt gleich ist, auch gleich
kennzeichnen. Beispielsweise ist es denkbar jedem Segment eine Segmentidentifaktionsnummer
zuzuordnen.
[0024] Wie der Darstellung der Fig. 2 weiter entnehmbar ist, besitzt die Datenbank 11 noch
weitere Einträge 12. Entsprechend den Spaltenkopfüberschriften handelt es sich bei
diesen Einträgen 12 um die Länge (L) des jeweiligen Segments, seine Position (P) innerhalb
des Satzes und um zwei Anschlußlaute oder Übergangswerte (Ü
vorn, Ü
hinten).
[0025] Die Gewinnung dieser Einträge 12 wird nun im Folgenden erläutert:
[0026] Werden die Originalsätze segmentiert, werden die jeweiligen Einträge 12, welche die
Länge (L) betreffen, z. B. dadurch gewonnen, daß für jedes der Suchkriterien die Anzahl
der Worte des zugeordneten Segments 10 ermittelt wird. Hierzu können im vorliegenden
Ausführungsbeispiel die Worte innerhalb des zugeordneten Suchkriteriums herangezogen
werden. Dies ergibt für das Audiofile bzw. das dem Suchkriterium "abbiegen" zugeordnete
Segment 10 den Längenwert 1, während dem Suchkriterium "in 100 Metern" der Längenwert
3 zugeordnet wird, da die Zahlenfolge "100" als Wort angesehen wird. Der Vollständigkeit
halber sei darauf hingewiesen, daß für die Gewinnung der Längeninformation nicht notwendig
die im Suchkriterium enthaltenen Worte herangezogen werden müssen. Vielmehr kann in
einem anderen - nicht weiter dargestellten - Ausführungsbeispiel auch auf die Anzahl
der im jeweiligen Suchkriterium enthaltenen Zeichen benutzt werden. Dies würde beispielsweise
für das Suchkriterium "abbiegen" zu einem Längenwert von 8 und für das Suchkriterium
"in 100 Metem" zu einem Längenwert von 13 führen, da beim letzten Suchkriterium auch
die Leeranschläge zwischen den Worten sowie die Zahlen als Zeichen gewertet werden.
Ferner ist es denkbar die Anzahl der Silben oder Phoneme als Längenwert zu verwenden.
[0027] Der Eintrag 12, welcher die Position (P) wiedergibt, wird beispielsweise dadurch
gewonnen, daß zunächst die Anzahl der Segmente 10 bzw. Suchkriterien je Originalsatz
ermittelt werden. Ergibt sich beispielsweise für einen Originalsatz, daß dieser bei
seiner Segmentierung in drei Segmente 10 aufgeteilt wird, wird dem ersten Segment
10 der Positionswert 0, dem zweiten Segment 10 der Positionswert 0,5 und dem letzten
der drei Segmente 10 der Positionswert 1 zugewiesen. Wird der Originalsatz aber nur
in zwei Segmente 10 unterteilt (etwa bei den ersten beiden Originalsätzen in Fig.
1), erhält das erste Segment 10 den Positionswert 0, während das zweite und letzte
Segment 10 den Positionswert 1 erhält. Besteht der Originalsatz aus vier Segmenten
10 hat das erste Segment 10 den Positionswert 0, das zweite Segment 10 den Positionswert
0,33 und das dritte Segment 10 den Positionswert 0,66, während das letzte Segment
wieder den Positionswert 1 erhält.
[0028] Ferner ist es möglich, anstelle der tatsächlichen Position in einem Satz nur anzugeben,
ob das jeweilige Segment 10 am Anfang oder am Ende einer Ansage oder zwischen zwei
Segementen 10 steht.
[0029] Unter Übergangswerten (Ü) im Sinne dieser Anmeldung werden die Beziehungen eines
Segments 10 bzw. Suchkriteriums zu dem diesem Segment 10 bzw. Suchkriterium vorangehenden
und folgenden Segment 10 bzw. Suchkriterium verstanden. Diese Beziehung für das jeweilige
Segment 10 wird vorliegend zu dem letzten Buchstaben des vorherigen Segments 10 und
zum ersten Buchstaben des folgenden Segments 10 hergestellt. Die genauere Erläuterung
soll nun anhand des ersten Orignalsatzes (In 100 Metern links abbiegen) gemäß Fig.
1 vollzogen werden. Da das erste Segment 10 bzw. Suchkriterium dieses Originalsatzes
(In 100 Metern) kein vorangehendes Segment 10 bzw. Suchkriterium aufweist, wird in
dem Datensatz, welcher dieses Segment 10 betrifft und die Indexnummer 3 (Fig.2) trägt,
als vorderer Übergangswert der Eintrag "leer" vermerkt. Da dem Segment 10 (In 100
Metem) im Originalsatz das Segment 10 (links abbiegen) folgt, wird, weil im vorliegenden
Ausführungsbeispiel als Übergangswerte (Ü) lediglich ein Buchstabe verwendet wird,
als hinterer Übergangswert (Ü) im Datensatz mit der Indexhummer 3 ein "I" vermerkt.
In gleicher Weise wird mit dem zweiten Segment (10) des Originalsatzes (links abbiegen)
verfahren, das im Datensatz mit der Indexnummer 9 zu dem vorderen Übergangswert (Ü)
"n" und zu dem hinteren Übergangswert (Ü) "leer" führt, da das Segment 10 (In 100
Metem), welches dem Segment 10 (links abbiegen) im Originalsatz vorangeht, mit einem
"n" endet und dem Segment 10 (links abbiegen) im Originalssatz kein Segment 10 mehr
folgt.
[0030] Die im vorstehenden Absatz gezeigte Beschränkung der Übergangswerte (Ü) für das jeweilige
Segment 10 auf den letzten Buchstaben des diesem Segments 10 vorangehenden bzw. den
ersten Buchstaben des diesem Segments 10 folgenden Segments 10 ist nicht zwingend.
Vielmehr können anstelle von Einzelbuchstaben als jeweilige Übergangswerte (Ü) auch
Buchstabengruppen oder Phoneme von dem jeweils betrachten Segment 10 vorgehenden und
folgenden Segmenten 10 verwendet werden. Dabei führt insbesondere die Verwendung von
Phonemen zu einer qualitativ hochwertigen Wiedergabe von aus Audiofiles anhand der
Datensätze gemäß Fig. 2 zusammengesetzten Ansagen.
[0031] Weiter sei darauf hingewiesen, daß die in Fig. 2 gezeigten Einträge 12 nicht auf
die Länge, die Position und die beiden Übergangswerte beschränkt sein müssen. Vielmehr
können auch noch weitere Einträge 12 - nicht gezeigt - vorgesehen sein, um die Qualität
der Ansagen weiter zu verbessern. Da es einen Betonungsunterschied zwischen Frage-
und Ausrufsätzen gibt, obwohl die textliche Wiedergabe des entsprechenden Satzes ohne
Berücksichtigung von Satzzeichen völlig identisch ist, kann als weiterer Eintrag 12
in der Datenbank 11 gemäß Fig.2 eine Spalte vorgesehen sein, in der vermerkt ist,
ob das jeweilige Segment 10 bzw. Suchkriterium aus einem Frage- oder Ausrufesatz stammt.
Letzteres kann beispielsweise so organisiert sein, dass eine "O" vergeben wird, wenn
das jeweilige Segment 10 aus einen Originalsatz stammt, der eine Frage aufwirft, und
daß eine "1" eingeschrieben wird, wenn das Segment 10 aus einem Originalsatz entnommen
wurde, der einen Ausruf zum Gegenstand hat. Über den Eintrag von Frage- und Ausrufesätzen
hinaus können in einem anderen - nicht näher erläuterten - Ausführungsbeispiel auch
weitere Satzzeichen als Einträge 12 in die Datenbank 11 gemäß Fig. 2 aufgenommen werden,
die geeignet sind, Betonungsunterschiede herbeizuführen.
[0032] Sind nun alle Originalsätze in der vorstehenden Weise segmentiert und die sich ergebenden
Segmente 10 analysiert worden, führt dies für die vier Originalsätze gemäß Fig. 1
zu einer in Fig. 2 gezeigten Datenbank 11. Deutlich ist dieser Datenbank 11 entnehmbar,
daß die verschiedenen Datensätze anhand der Suchkriterien alphabetisch aufsteigend
sortiert sind.
[0033] Im folgenden soll nun die Rekonstruktion des in der Liste gemäß Fig. 1 aufgeführten
Originalsatzes "In 100 Metem links abbiegen" anhand der Datensätze der Datenbank 11
veranschaulicht werden.
[0034] Dazu wird der gesamte, zur Wiedergabe bestimmte Satz "In 100 Metem links abbiegen"
in ein Format gebracht, in welchem auch die Suchkriterien der entsprechenden Segmente
10 vorliegen. Da im dargestellten Ausführungsbeispiel die Suchkriterien der textlichen
Wiedergabe der Audiofiles entsprechen, wird der wiederzugebende Satz ebenfalls in
dieses Format gebracht, sofern er nicht schon in diesem Format vorliegen sollte. Dann
wird geprüft, ob ein oder mehrere Suchkriterien in der Datenbank 11 vorhanden sind,
die eine vollständige Übereinstimmung mit dem entsprechend formatierten und zur Wiedergabe
bestimmten Satz "In 100 Metem links abbiegen" aufweisen. Da dies entsprechend der
in Fig. 2 gezeigten Datenbank nicht der Fall ist, wird der Suchstring des zur Wiedergabe
bestimmten Satzes (In 100 Metem links abbiegen) um das letzte Wort "abbiegen" gekürzt
und untersucht, ob dieser Teilsatz "In 100 Metem links" in dieser Form in der Datenbank
11 als Suchkriterum vorkommt. Da auch dieser Vergleich wegen des Inhalts der Datenbank
11 negativ ausfallen muß, erfolgt eine erneute Reduzierung des zur Wiedergabe bestimmten
Satzes um ein Wort. Sodann wird wieder geprüft, ob der dann so reduzierte Teil des
Satzes "In 100 Metem" in den Datensätzen der Datenbank 11 als Suchkriterium vorkommt.
Gemäß dem Inhalt der Datenbank 11 kann dies für die Datensätze mit den Indizes 3 bis
6 bejaht werden. Dies führt dann zu einer Zwischenspeicherung der gefundenen Indizes
3 bis 6.
[0035] Dann werden die Teile des Satzes, welche in den vorherigen Schritten abgetrennt wurden,
wieder in ihrer ursprünglichen Reihenfolge "links abbiegen" zusammengefügt und untersucht,
ob es für diesen Satzbestandteil wenigstens eine Entsprechung in den Suchkriterien
der Datenbank 11 gibt. Bei diesem Vergleich werden die Datensätze mit den lndizes
9 und 10 als Datensätze erkannt, bei denen die Suchkriterien mit dem Teilsatz "links
abbiegen" vollständig übereinstimmen. Auch diese lndizes 9 und 10 werden zwischengespeichert.
Damit ist die Sucharbeit beendet, da der Suchstring vollständig durch Suchkriterien
in der Datenbank 11 abgebildet werden kann.
[0036] Anschließend werden aus den jeweils gefundenen Indizes Kombinationen gebildet, welche
jeweils den wiederzugebenden Satz ergeben. Letzeres ist in Fig.3 näher gezeigt. Da
vorliegend der wiederzugebende Satz aus den Indizes 9 und 10 sowie den Indizes 3 bis
6 gebildet wird, haben nur die Kombinationen in Fig. 3 mit den laufenden Nummern 1
bis 8 Relevanz. Die übrigen Kombinationen in Fig. 3 haben in diesem Ausführungsbeispiel
keine Bedeutung.
[0037] Der Vollständigkeit halber sie darauf hingewiesen, dass in Fig. 3 die Spalteninhalte
der Spalte "Text" nur der Veranschaulichung dienen und nicht zusammen mit den Kombinationen
abgelegt werden.
[0038] Mit Beendigung der Sucharbeit werden dann die Längen- und Positionsangaben und Angaben
zu den Übergangswerten des wiederzugebenden Satz entsprechend der Konvention, welche
bei der Erstellung der entsprechenden Einträge 12 in die Datenbank 11 maßgeblich waren,
erstellt, indem für die Satzteile, deren Index in der relevanten Kombination steht,
die Längen- und Positionsangabe sowie die jeweiligen Übergangswerte zwischengespeichert
werden. Eine solche Zwischenspeicherung ist für den wiederzugebenden Satz "In 100
Metem links abbiegen" in Fig.4 gezeigt, wobei durch die Bezeichnung W angedeutet ist,
daß es sich um die Position und die Übergangswerte der Segmente im wiederzugebenden
Satz und nicht um die in der Datenbank 11 gespeicherten Werte handelt. Für die Längenangaben
kann auf die Werte zurückgegriffen werden, die in den Datensätzen mit den Indizes
3 bis 6 bzw. 9 und 10 eingetragen sind, da durch den Umstand, daß, wenn der wiederzugebende
Satz oder ein Tell davon eine vollständige Entsprechung in den Suchkriterien gemäß
Fig. 2 gefunden hat, die Längenangabe in den entsprechenden Datensätzen der Datenbank
11 gemäß Fig. 2 mit dem Längenwert des Teils des wiederzugebenen Satzes übereinstimmt.
[0039] Nachdem die Kombinationen entsprechend der laufenden Nummern 1 bis 8 in Figur 3 gebildet
worden sind, wird eine Bewertung der Kombinationen durchgeführt, indem für jede dieser
Kombinationen ein Bewertungsmaß B mit Hilfe der Einträge 12 für die Segmente 10 oder
Suchkriterien in der Datenbank 11 ermittelt wird, die an der jeweiligen Kombination
beteiligt sind. Die Ermittlung des Bewertungsmaßes B erfolgt dabei gemäß der nachfolgenden
Formel:

wobei W
n ein Gewichtungsfaktor für den n-ten Eintrag 12, f
n,i ein funktionaler Zusammenhang des n-ten Eintrags 12, n ein Laufindex, der über die
einzelnen Einträge eines einem an einer Kombination beteiligten Segments zugeordneten
Datensatzes läuft, und i weiterer Laufindex ist, über alle Indizes der an der Kombination
beteiligten Datensätze oder Segmente läuft.
[0040] Wie leicht einzusehen ist, wird also für jeden in die Formel aufgenommenen Eintrag
n ein funktionaler Zusammenhang f
n,i(n) erstellt. Um eine Gewichtung der verschiedenen, in die Formel eingesetzten funktionalen
Zusammenhänge herstellen zu können, können einige oder auch alle funktionalen Zusammenhänge
mit einem Gewichtungsfaktor W
n versehen sein.
[0041] Wird beispielsweise für die Längeninformation L eines Segments 10 der funktionelle
Zusammenhang f
L,i(L) so gebildet, daß der Wert eins durch den Wert der Länge L geteilt wird, der dem
Eintrag (Länge) im jeweiligen Datensatz i entspricht, so wird jeweils ein Wert erhalten,
der für jeden Datensatz, dessen Index an einer Kombination beteiligt ist, kleiner
eins ist, sofern - wie hier angenommen - der Gewichtungsfaktor W
L für die Länge gleich eins ist. Wie leicht einzusehen ist, liefern längere Segmente
10 formelbedingt kleinere Werte f
Li(L). Diese kleineren Werte sind bevorzugt anzustreben, weil durch die längeren Segmente
eine schon vorhandene Satzmelodie besser ausgenutzt werden kann.
[0042] Um einen funktionellen Zusammenhang f
Pi(P) für die Positionsinformation P herzustellen, kann dieser beispielsweise so ausgestaltet
sein, daß die zwischengespeicherten Positionswerte Pw aus Fig. 4 mit den Positionswerten
P
A der entsprechenden Datensätze in der Datenbank so in Beziehung gesetzt werden, daß
bei einer Überstimmung in den Positionswerten der Wert Null vergeben wird (wenn P
W = P
A dann f
P,i(P) = 0) und bei fehlender Übereinstimmung beispielsweise der Wert eins (wenn Pw ≠
P
A) dann f
P,i(P) = 1) ausgegeben wird, wenn der Gewichtungsfaktor W
P eins ist. Andere Werte als eins lassen sich über den Gewichtungsfaktor W
P einstellen.
[0043] Der funktionelle Zusammenhang für die Übergangswerte f
Ü,i(Ü
vorn), f
Ü,i(Ü
hinten) kann anlog zum vorstehenden Absatz gebildet werden, indem die zwischengespeicherten
Übergangswerte Ü
vorn,W, Ü
hinten,W aus Fig. 4 mit den Übergangswerten Ü
vorn,D, Ü
hinten,D der entsprechenden Datensätze aus der Datenbank so in Beziehung gesetzt werden, daß
bei Übereinstimmungen eine Null und bei fehlender Übereinstimmung ein Wert größer
Null vergeben wird. Auch hier kann wieder ein entsprechender Gewichtungsfaktor W
Ü verwendet werden. Um eine Gleichgewichtung der Übergangswerte Ü mit den übrigen Faktoren
herzustellen, sollten die funktionellen Zusammenhänge für den vorderen und hinteren
Übergangswert zweckmäßigerweise jeweils mit einem Gewichtungsfaktor Wü von 0,5 versehen
werden. Für das beschriebene Ausführungsbeispielbeispiel ergibt sich somit folgende
Formel

[0044] In Fig 5 ist eine Tabelle gezeigt, die für jede der acht gefundenen Kombinationen
die Berechnung des Bewertungsmaßes B anhand der obigen Formel näher veranschaulicht.
In dieser Tabelle haben die Spaltenbezeichnungen folgende bedeutung:
- Ldf. Nr.
- entspricht der laufenden Nummer der Kombinationen gemäß Fig. 3,
[0045] Kombinationen entspricht den Kombinationen gemäß Fig. 3,
- Länge
- entspricht der Länge L des Suchkriteriums entsprechend Fig. 2,
- Ergebnis I
- entspricht dem funktionalen Zusammenhang fL(L) = 1/Länge,
- Position W
- entspricht Positionswerten P, die für den wiederzugebenden Satz zwischengespeichert
und in Fig. 4 gezeigt sind,
- Position A
- entspricht den datensatzbezogenen Positionseinträgen P in der Datenbank 11 gemäß Fig.
2,
- Ergebnis II
- zeigt das Ergebnis des funktionalen Zusammenhangs fP,i(P) zischen Position W und Position A,
- Vorne W
- entspricht den in Fig. 4 gezeigten vorderen Übergangswerten, die für den wiederzugebenden
Satz zwischengespeichert sind,
- Vorne A
- entspricht den datensatzbezogenen vorderen Übergangswerten in der Datenbank 11 gemäß
Fig. 2,
- WÜ (vorne)
- zeigt den Gewichtungsfaktor Wü für den vorderen Übergangswert,
- Ergebnis III
- zeigt das Ergebnis des funktionalen Zusammenhangs fÜ,i(Üvorn) zwischen vorne W und vorne A unter Berücksichtigung des Gewichtungsfaktors Wü,
- Hinten W
- entspricht den in Fig. 4 gezeigten hinteren Übergangswerten, die für den wiederzugebenden
Satz zwischengespeichert sind,
- Hinten A
- entspricht den datensatzbezogenen hinteren Übergangswerten in der Datenbank 11 gemäß
Fig. 2,
- WÜ (hinten)
- zeigt den Gewichtungsfaktor Wü für den hinteren Übergangswert,
- Ergebnis IV
- zeigt das Ergebnis des funktionalen Zusammenhangs fÜ,i(Ühinten) zwischen hinten W und hinten A unter Berücksichtigung des Gewichtungsfaktors Wü
- Summe
- Addition der Ergebnisse I bis IV
- B
- Addition der Summen je laufender Nummer
[0046] Deutlich ist der Tabelle gemäß Fig. 5 entnehmbar, daß sich für jede laufende Nummer
B-Werte ergeben, die zwischen 0,8 und 4,8 liegen. Außerdem ist der Tabelle gemäß Fig.
5 entnehmbar, daß auch doppelte B-Werte vorhanden sind. Da vorzugsweise nur solche
Audiofiles aus Datensätzen der Datenbank 11 zur Sprachwiedergabe kombiniert werden
sollen, deren Kombinationen entsprechend Fig. 3 nach einer Bewertung gemäß der obigen
Formel den niedrigsten B-Wert von allen Kombination haben, sind alle vorkommenden
B-Werte, die gemäß der Tabelle gemäß Fig. 5 größer als 0,8 sind, bedeutungslos. Diese
Bedeutungslosigkeit ist aber bei den Kombinationen der laufenden Nummern 1 und 5 gemäß
Fig. 5 nicht gegeben, da bei diesen Kombinationen die B-Werte bei 0,8 liegen und somit
die kleinsten B-Werte darstellen. Außerdem sind die zur Bildung der Kombinationen
gemäß der laufenden Nummern 1 und 5 verwendeten Datensätze 3 und 5 (gemäß Fig. 2)
gleich. Eine solche Situation tritt jedoch in der Praxis praktisch nicht ein, da die
Datenbank gemäß Fig. 2 vor ihrer endgültigen Festigstellung optimiert wird. Diese
Optimierung wird so durchgeführt, daß nach Erstellung derDatenbank die Datensätze
der einzelnen Segmente verglichen werden, um festzustellen, ob Datensätze vorhanden
sind, die in allen Einträgen übereinstimmen, die also beim beschriebenen Ausführungsbeispiel
gleiche Suchkriterien, Längenangaben, Positionsangaben und Übergangswerte aufweisen.
Kann dies festgesteltt werden, werden die doppelt vorhandenen Datensätze gelöscht.
Damit ist kein Qualitätsverlust verbunden, da die doppelt vorkommenden Datensätze
bezüglich ihrer Bewertung identisch sind.
[0047] Wird dieser Optimierungsschritt durchgeführt, werden die Datensätze mit den Indizes
3 und 5 als doppelt vorhanden gekennzeichnet und nur noch entsprechend einer weiteren
Konvention der Datensatz in der Datenbank belassen, der die kleinste Index-Nummer
hat. Das Herauslöschen des Datensatzes mit dem Index 5 führt dazu, daß in Fig. 4 keine
Kombinationen mehr auftreten, die die laufenden Nummern 5 und 6 haben. Folglich entfallen
auch in der Tabelle gemäß Fig. 5 die laufenden Nummern 5 und 6 weg, so daß für diese
Kombinationen keine B-Werte ermittelt werden und die Kombination 3/9 (laufende Nummer
1) als die Kombination mit dem kleinsten B-Wert festgestellt wird.
[0048] Aber selbst dann, wenn nach Ausführung von Optimierungschritten und der Bewertung
von Kombinationen gleiche B-Werte ermittelt werden, können Probleme dadurch verhindert
werden, daß mittels einer Festlegung bestimmt wird, daß beispielsweise in einem solchen
Fall nur die Kombination, welche zuerst gefunden wurde, verwendet wird.
[0049] Steht nach der Durchführung der Bewertung fest, welche Kombination den geringsten
B-Wert hat, werden anhand der beteiligten Indizes die entsprechenden Audiofiles zusammengesetzt
und ausgegeben. Hat sich herausgestellt, daß im vorstehend erörterten Ausführungsbeispiel
die Kombination 3/9 die Kombination mit dem kleinsten B-Wert ist, werden die entsprechenden
Audiofiles (file 3 und file 9) kombiniert und ausgegeben.
[0050] Der Vollständigkeit halber sei darauf hingewiesen, daß die Audiofiles nicht notwendig
in der Datenbank 11 gemäß Fig. 2 gespeichert sein müssen. Vielmehr ist ausreichend,
wenn in der Datenbank 11 entsprechende Verweise auf die an einem anderen Ort abgelegten
Audiofiles vorhanden sind.
Im folgenden soll nun eine andere Art der Suche erläutert werden:
[0051] Auch in diesem Beispiel wird von dem Wiedergabesatz "In 100 Metern links abbiegen"
ausgegangen. Wird dieser Satz als Textstring empfangen, wird zunächst geprüft, ob
zumindest der Anfang dieses Satzes mit einem Suchkriterien in der Tabelle gemäß Fig.
2 übereinstimmt. Bei dieser Prüfung wird die Tabelle gemäß Fig. 2 von hinten, d. h.
beginnend mit dem letzten Eintrag begonnen. Dies wäre vorliegend der Datensatz mit
dem Index 10. Während dieser Prüfung wird dann der Eintrag "in 100 Metern" gefunden,
der den Index 6 aufweist. Da der gefundene Eintrag "in 100 Metern" den Wiedergabesatz
nicht vollständig abdecken kann, wird der Teil, welcher vomSuchkriterium des eben
gefundenen Datensatzes nicht angedeckt wird, abgetrennt. Außerdem wird der der Datensatz
mit Index 6 zwischengespeichert.
[0052] Sodann wird geprüft, ob denn für den abgetrennten Teil des Wiedergabesatzes "links
abbiegen" wenigstens eine teilweise Entsprechung in den Suchkriterien gemäß der Tabelle
in Fig. 2 vorhanden ist. Auch bei dieser Suche wird die Tabelle gemäß Fig. 2 von unten
nach oben durchsucht. Bei dieser Suche wird-wie leicht einzusehen ist - sofort der
Eintrag "links abbiegen" gefunden, welcher den Index 10 besitzt. Sodann wird der eben
gefundene Datensatz mit Index 10 kopiert und zusammen mit dem Datensatz mit Index
6 zwischengespeichert. Wie oben schon erläutert wird dann der gefundene Satzteil aus
dem Suchstring abgetrennt und die Suche ggf. erneut gestartet. Da jetzt jedoch der
abgetrennte Teil keinen Inhalt mehr hat, bedeutet dies, daß die Kombination der Suchkriterien
mit den Indizes 6 und 10 eine Kombination ist, welche den wiederzugebenden Satz vollständig
erfaßt.
[0053] Tritt diese Situation ein, wird die Suche nach dem Teil des Wiedergabesatzes "links
abbiegen" fortgesetzt, wobei nicht am Ende der Tabelle gemäß Fig. 2 begonnen wird,
sondern nach der Stelle, an der die letzte Entsprechung (hier Datensatz mit dem Index
10) gefunden wurde. Dies führt dazu, daß dann der Eintrag mit dem Index 9 gefunden
wird. Nach dem Finden des Datensatzes mit Index 9 wird auch hier der mit Index 6 kopiert
und zusammen mit dem gefundenen Datensatz mit Index 9 als mögliche Zwischenlösung
zwischengespeichert. Sodann wird der gefundene Teil "links abbiegen" von Suchstring
abgetrennt und die Suche nach dem Rest begonnen. Da mit dem Abtrennen des Teils "links
abbiegen" der Suchstring keinen Inhalt mehr hat, wird die Indexkombination 6, 9 als
Kombination vermerkt wird, die den wiederzugebenden Satz vollständig erschöpft.
[0054] Diese vollständige Erschöpfung führt dazu, daß mit der Suche nach dem Teil des Wiedergabesatzes
"links abbiegen" fortgesetzt wird, wobei auch hier nicht am Ende der Tabelle gemäß
Fig. 2 begonnen wird, sondern nach der Stelle, an der der letzte Eintrag (hier der
Datensatz mit dem Index 9) gefunden wurde. Dies führt dazu, daß der Eintrag "links"
mit dem Index 8 gefunden wird, weil bei der Suche immer danach gesucht wird, ob der
Anfang des jeweiligen Suchstrings in den Suchkriterien enthalten ist.
[0055] Dann werden die Datensätze mit Index 6 und Index 8 als mögliche Teillösung zwischengespeichert.
[0056] Anschließend erfolgt wieder das Abtrennen des gefundenen Teils "links" und die Weitersuche
nach dem im Suchstring verbliebenen Teils "abbiegen". Diese Suche führt dann dazu,
daß der Eintrag mit dem Index 2 gefunden wird. Dann wird wieder die im letzten Schritt
als Teillösung zwischengespeicherte Kombination 6, 8 kopiert und zusammen mit dem
Datensatz mit Index 2 als weitere Teillösung zwischengespeichert. Wiederum wird dann
der gefundene Teil aus dem Suchstring abgetrennt. Da der Suchstring nun wiederum leer
ist, wird die Kombination der Datensätze mit den Indizes 6, 8, 2 als Kombination gespeichert,
welche den Wiedergabesatz vollständig wiedergibt. Dann wird zum vorherigen Schritt
zurückgekehrt und die Suche nach einer Entsprechung des Suchstrings "abbiegen" fortgesetzt,
wobei auch hier die Suche nach dem Eintrag begonnen wird, wo die letzte Entsprechung
(hier der Datensatz mit dem Index 2) gefunden wurde. Hierbei wird der Datensatz mit
dem Index 1 gefunden, was zu dem Resultat führt, daß die Kombination der Datensätze
mit den Indizes 6, 8, 1 als Kombination gespeichert wird, welche den Wiedergabesatz
vollständig wiedergibt.
[0057] Dann wird die Suche nach einer Entsprechung des Suchstrings "links abbiegen" fortgesetzt,
wobei auch hier die Suche nach dem Eintrag begonnen wird, wo die letzte Entsprechung
(hier der Datensatz mit dem Index 8) gefunden wurde. Dies führt in entsprechender
Anwendung der erläuterten Grundsätze zum Finden der folgenden Indexkombinationen 6/7/2,und
6/7/1.
[0058] Nach dem Finden der Kombination 6/7/1 wird dann die Suche mit dem Suchstring "In
100 Metem links abbiegen" fortgesetzt, wobei diese Suche nach dem zuletzt gefundenen
Index 6 einsetzt. Wird der gesammte Wiedergabesatz entsprechend der vorstehenden Grundsätze
analysiert, werden alle Kombinationen gefunden die in Fig. 3 unter den laufenden Nummern
1 bis 28 gezeigt sind. Dies führt - wie leicht einzusehen ist - zu einer entsprechenden
Ausdehnung der Tabelle gemäß Fig. 5.
[0059] Um die erforderlichen Such- und Rechenschritte zu begrenzen, ist zweckmäßigerweise
vorgesehen, daß, wenn der Wiedergabesatz entsprechend der vorstehenden Grundsätze
vollständig analysiert werden soll, diese Analyse abgebrochen wird, wenn beispielsweise
B-Werte ermittelt werden, die kleiner oder gleich einem vorgegebenen Wert, z. B. 0,9
sind. Dies führt nicht zu einem Qualitätsverlust, weil bei der Suche nach Entsprechungen
des jeweiligen Suchtrings zuerst immer lange Suchkriterien in der Datenbank 11 gefunden
werden.
[0060] Ferner kann vorgesehen sein, daß die Suche nach Kombinationen dann abgebrochen wird,
wenn eine bestimmte vorgebbare Anzahl von Kombinationen, beispielsweise 10 Kombinationen
gefunden wurde. Wie leicht einzusehen ist, wird durch diese Maßnahme der Speicherbedarf
und die erforderliche Rechenleistung reduziert. Besonders vorteilhaft ist diese Kombinationsbegrenzung
dann, wenn die Suche entsprechend der letztbenannten Methode durchgeführt wird. Dies
ist darauf zurückzuführen, daß bei dieser Suchmethode zuerst immer Iängere Segmente
gefunden werden. Dieses Finden der längeren Segmente bietet die Gewähr dafür, daß
in der Regel schon unter den ersten Kombinationen die beste Kombination erkannt wird
und somit kein Qualitätsverlust eintritt.
1. Verfahren zum Zusammensetzen von Ansagen zur Sprachausgabe aus Segmenten (10) zumindest
eines Originalsatzes, die als Audiofiles gespeichert sind, bei dem eine zur Ausgabe
bestimmte Ansage aus den als Audiofiles gespeicherten Segmenten (10) zusammengesetzt
wird, die anhand von Suchkriterien aus den gespeicherten Audiofiles ausgewählt werden,
dadurch gekennzeichnet, daß jedem Segment (10) zumindest eine seine phonetischen Eigenschaften im Originalsatz
kennzeichnende Größe (12) zugeordnet ist, und daß anhand der die phonetischen Eigenschaften
im Originalsatz kennzeichnenden Größen (12) der einzelnen Segmente (10) überprüft
wird, ob die den als Ansage auszugebenden Wiedergabesatz bildenden Segmente (10) entsprechend
ihrem natürlichen Sprachfluß zusammengesetzt sind.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß jedem Segment (10) mehrere seine phonetischen Eigenschaften im Originalsatz kennzeichnende
Größen (12) zugeordnet sind.
3. Verfahren nach Anspruch 1 oder 2,
dadurch gekennzeichnet, daß als die phonetischen Eigenschaften der Segmente (10) im jeweiligen Originalsatz kennzeichnenden
Größen (12) zumindest eine der folgenden Größen verwendet wird:
- Länge (L) des jeweiligen Segments (10),
- Position (P) des jeweiligen Segments (10) im Originalsatz,
- vorderer und/oder hinterer Übergangswert (Ü) des jeweiligen Segments (10) zum vorstehenden
bzw. nachfolgenden Segment (10) im Originalsatz.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß als Länge (L) des jeweiligen Segments (10) die Länge des jeweils zugeordneten Suchkriteriums
verwendet wird.
5. Verfahren nach Anspruch 3 oder 4, dadurch gekennzeichnet, daß daß als Übergangswerte (Ü) die letzten bzw. ersten Buchstaben, Silben oder Phoneme
des vorstehenden bzw. nachfolgenden Segments (10) im Originalsatz verwendet werden.
6. Verfahren nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, daß als weitere Größe (12) Angaben darüber vorgesehen sind, ob das jeweilige Segment
(10) des Originalsatzes aus einem Frage- oder Ausrufesatz stammt.
7. Verfahren nach einem der vorstehenden Ansprüche,
dadurch gekennzeichnet, daß für eine gefundene Kombination von Segmenten (10), die den als Ansage auszugebenden
Wiedergabesatz bildet, ein Bewertungsmaß (B) aus den die phonetischen Eigenschaften
im Originalsatz kennzeichnenden Größen (12) der einzelnen Segmente (10) gemäß der
nachfolgenden Formel berechnet wird:

wobei f
n,i(n) ein funktionaler Zusammenhang der n-ten Größe, i ein das Segment (10) bezeichnender
Index und W
n ein Gewichtungsfaktor für den funktionalen Zusammenhang der n-ten Größe ist.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß für jede gefundene Kombination von Segmenten (10), die den als Ansage auszugebenden
Wiedergabesatz bildet, ein Bewertungsmaß (B) berechnet wird, und daß aus den gefundenen
Kombinationen von Segmenten (10) diejenige als wiederzugebende Ansage ausgewählt wird,
deren Bewertungsmaß (B) anzeigt, daß die Segmente (10) der Kombination entsprechend
einem natürlichen Sprachfluß zusammengesetzt sind.
9. Verfahren nach Anspruch 7 oder 8,
dadurch gekennzeichnet, daß das Bewertungsmaß (B) aus den funktionalen Zusammenhängen f
n(n) zumindest der folgenden Größen Länge (L) und Position (P) sowie vorderer und hinterer
Übergangswert (Ü
vorn, Ü
hinten) des Segments (10) gemäß nachfolgender Formel berechnet wird:
10. Verfahren nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, daß der Wiedergabesatz in einem, den Suchkriterien entsprechenden Format vorliegt, wobei
vorzugsweise für die Suchkriterien und die übermittelten Wiedergabesätze alphanumerische
Zeichenketten verwendet werden.
11. Verfahren nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, daß die Suchkriterien in einer Datenbank (11) hierachisch angeordnet sind.
12. Verfahren nach einem der vorstehenden Ansprüche,
dadurch gekennzeichnet, daß
- zum Auswählen der als Audiofiles gespeicherten Segmente (10) für eine Ansage geprüft
wird, ob der als Ansage gewünschte Wiedergabesatz in seiner Gesamtheit mit einem in
einer Datenbank (11) zusammen mit einem zugeordneten Audiofile abgelegten Suchkriterium
übereinstimmt, wobei, wenn dies nicht der Fall ist, das Ende des jeweiligen Wiedergabesatzes
solange reduziert und dann auf Übereinstimmungen mit in der Datenbank (11) abgelegten
Suchkriterien überprüft wird, bis für den verbleibenden Teil des Wiedergabesatzes
eine oder mehrere Übereinstimmung gefunden wurden,
- für solche Teile des Wiedergabesatzes, die im einem vorhergehenden Schritt abgetrennt
wurden, die im letzen Absatz angegebene Überprüfung fortgesetzt wird,
- für jede Kombination von Segmenten (10), deren Suchkriterien vollständig mit dem
Wiedergabesatz übereinstimmen, überprüft wird, ob die den als Ansage auszugebenden
Wiedergabesatz bildenden Segmente (10) entsprechend ihrem natürlichen Sprachfluß zusammengesetzt
sind, und
- zur Wiedergabe einer gewünschten Ansage die Audiofiles der Segmente (10) verwendet
werden, deren Kombination dem natürlichen Sprachfluß am nächsten kommen.