EP 1058235 A2 20001206 - Reproduction method for voice controlled systems with text based speech synthesis

Title (en)

Reproduction method for voice controlled systems with text based speech synthesis

Title (de)

Wiedergabeverfahren für sprachgesteuerte Systeme mit text-basierter Sprachsynthese

Title (fr)

Procédé de reproduction pour systèmes contrôlés par la voix avec synthèse de la parole basée sur texte

Publication

EP 1058235 A2 20001206 (DE)

Application

EP 00108486 A 20000419

Priority

DE 19920501 A 19990505

Abstract (en)

[origin: US6546369B1] The invention specifies a simple reproduction method with improved pronunciation for voice-controlled systems with text-based speech synthesis even when the stored train of characters to be synthesized does not follow the general rules of speech reproduction. According to the invention, the method of "copying" the original spoken input text into the otherwise synthesized reproduction text, which is the current state of the art, is avoided, which will significantly increase the acceptance of the user of the voice-controlled system due to the process invented. More specifically, when there is actual spoken speech input that corresponds to a stored train of characters, the converted train of characters is compared to the speech input before reproduction of the train of characters described phonetically according to general rules and converted to a purely synthetic form. When the converted train of characters is found to deviate from the speech input by a value above a threshold value, at least one variation of the converted train of characters is created. This variation is then output instead of the converted train of characters as long as this variation deviates from the speech input by a value below the threshold value.

Abstract (de)

Erfindungsgemäß wird ein einfaches und ausspracheverbessertes Wiedergabeverfahren für sprachgesteuerte Systeme mit basierter Sprachsynthese angegeben, auch wenn die hinterlegte und zu synthetisierende Zeichenkette nicht den allgemeinen Regeln der Sprachwiedergabe folgt. Auch wird nach der Erfindung ein im Stand der Technik teilweises angewendetes "Hineinkopieren" des originalen Spracheingabetextes in den sonst synthetisierten Wiedergabetext vermeiden, wodurch durch das erfindungsgemäße Verfahren die Akzeptanz des Anwenders des sprachgesteuerten System wesentlich verbessert wird. Im einzelnen wird zunächst bei Vorliegen einer tatsächlich gesprochenen und mit einer gespeicherten Zeichenkette korrespondierenden Spracheingabe vor einer Wiedergabe der nach allgemeinen Regeln phonetisch beschriebenen und in eine rein synthetische Form gewandelten Zeichenkette die gewandelte Zeichenkette mit der Spracheingabe verglichen. Bei Feststellung einer oberhalb einer Schwelle liegenden Abweichung der gewandelten Zeichenkette von der Spracheingabe wird dann wenigstens eine Variante von der gewandelten Zeichenkette gebildet. Diese Variante wird dann, sofern diese bei einem Vergleich mit der Spracheingabe eine unterhalb der Schwelle liegende Abweichung aufweist, anstelle der gewandelten Zeichenkette ausgegeben.

IPC 1-7

G10L 13/06; G10L 13/08

IPC 8 full level

G10L 15/14 (2006.01); G10L 13/04 (2013.01); G10L 13/06 (2006.01); G10L 13/08 (2006.01)

CPC (source: EP US)

G10L 13/04 (2013.01 - EP US)

Designated contracting state (EPC)

AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

DOCDB simple family (publication)

US 6546369 B1 20030408; AT E253762 T1 20031115; DE 19920501 A1 20001109; DE 50004296 D1 20031211; EP 1058235 A2 20001206; EP 1058235 A3 20030205; EP 1058235 B1 20031105; JP 2000347681 A 20001215; JP 4602511 B2 20101222

DOCDB simple family (application)

US 56478700 A 20000505; AT 00108486 T 20000419; DE 19920501 A 19990505; DE 50004296 T 20000419; EP 00108486 A 20000419; JP 2000132902 A 20000427