Global Patent Index - EP 3144929 A1

EP 3144929 A1 20170322 - SYNTHETIC GENERATION OF A NATURALLY-SOUNDING SPEECH SIGNAL

Title (en)

SYNTHETIC GENERATION OF A NATURALLY-SOUNDING SPEECH SIGNAL

Title (de)

SYNTHETISCHE ERZEUGUNG EINES NATÜRLICH KLINGENDEN SPRACHSIGNALS

Title (fr)

GÉNÉRATION SYNTHÉTIQUE D'UN SIGNAL VOCALE AYANT UN SON NATUREL

Publication

EP 3144929 A1 20170322 (DE)

Application

EP 15185879 A 20150918

Priority

EP 15185879 A 20150918

Abstract (de)

Die Erfindung bezieht sich auf eine Lösung Sprachsynthese, nämlich auf die Erzeugung eines synthetischen Sprachsignals in einem automatisierten Ablauf. Zur Erzeugung eines möglichst natürlich klingenden synthetischen Sprachsignals wird vorgeschlagen, dass ein während der Sprachsynthese erzeugtes, noch nicht emotionsbehaftetes Sprachrohsignal mit einem Parametergemisch moduliert wird, welches Parameter mehrerer, mit Melodiemerkmalen, mit Dauermerkmalen, mit Stimmmerkmalen oder mit der Artikulationsgenauigkeit der Sprache korrespondierender Merkmalsgruppen umfasst, die entsprechend mindestens zwei vorgegebenen, mit voneinander verschiedenen der vorgenannten Merkmalsgruppen assoziierten Zielemotionen eingestellt werden. Das dazu vorgeschlagene System (1) besteht insbesondere aus einer Eingangsstufe (2) mit einer Phonemisierungskomponente (3), aus einem Emotionssimulator (4) und aus einer Ausgangsstufe (5) mit einer Syntheseeinheit (6). Die Eingangsstufe (2) ist zur Entgegennahme von Informationen über mindestens zwei Zielemotionen ausgebildet. Der Emotionssimulator (4) ist ausgebildet zur Auswertung dieser Informationen, zur Einstellung der Parametereigenschaften mindestens zweier verschiedener Sprachmerkmalsgruppen entsprechend den Zielemotionen, zum Mischen der eingestellten Parameter und zur Modulation des Sprachrohsignals mit dem Parametergemisch.

IPC 8 full level

G10L 13/033 (2013.01); G10L 13/047 (2013.01)

CPC (source: EP)

G10L 13/033 (2013.01)

Citation (applicant)

  • FELIX BURKHARDT: "Simulation emotionaler Sprechweise mit Sprachsynthesesystemen", 2001, SHAKER VERLAG
  • FELIX BURKHARDT; W. F. SENDLMEIER: "Verification of Acoustical Correlates of Emotional Speech using Formant-Synthesis", PROCEEDINGS ISCA WORKSHOP (ITRW) ON SPEECH AND EMOTION, 2000
  • T. DUTOIT; V. PAGEL; N. PIERRET; F. BATAILLE; O. VAN DER VREKEN: "The Mbrola project: Towards a set of high-quality speech synthesizers free of use for non-commercial purposes", PROC. ICSLP'96, PHILADELPHIA, vol. 3, 1996, pages 1393 - 1396, XP010237942, DOI: doi:10.1109/ICSLP.1996.607874
  • M. SCHRÖDER; J. TROUVAIN: "The German text-to-speech synthesis system mary: A tool for research, development and teaching", INTERNATIONAL JOURNAL OF SPEECH TECHNOLOGY, 2003, pages 365 - 377, XP019207412, DOI: doi:10.1023/A:1025708916924
  • FELIX BURKHARDT: "Emofilt: the Simulation of Emotional Speech by Prosody-Transformation", INTERSPEECH, 2005

Citation (search report)

  • [XI] US 6226614 B1 20010501 - MIZUNO OSAMU [JP], et al
  • [ID] FELIX BURKHARDT: "Emofilt: the Simulation of Emotional Speech by Prosody-Transformation", PROC. INTERSPEECH, 4 September 2005 (2005-09-04), pages 1 - 4, XP055225958, Retrieved from the Internet <URL:http://felix.syntheticspeech.de/publications/emofiltInterspeech05.pdf> [retrieved on 20151104]

Designated contracting state (EPC)

AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

Designated extension state (EPC)

BA ME

DOCDB simple family (publication)

EP 3144929 A1 20170322

DOCDB simple family (application)

EP 15185879 A 20150918