Automatische Umwandlung von Nachrichten in animierte Clips

Bei der Umwandlung von Text in Sprache wird die vorhandene „Text-to-Speech“ (TTS)-Technologie  des Diensteanbieters genutzt. Eine TTS-Engine erzeugt eine Audio-Datei. Bei der Erzeugung einer Audio-Datei wird der eingegebene Text in Phoneme umgesetzt. Diese Phoneme, ihre Dauer und weitere Informationen (Lautstärke usw.) sind die Grundlage für die Bildanimation.

Bei einer Sprachnachricht liegt die Audio-Datei schon vor. Hier wird die Nachricht von einer Spracherkennung analysiert, die ebenfalls die genutzten Phonemen erkennt und dokumentiert.

Unsere Technologie nutzt ein besonders aufwendiges Animations-Verfahren, um ein möglichst realistisches Ergebnis zu erhalten. Die Gesichtszüge werden durch besonders viele Parameter gebildet, so dass eine sehr differenzierte Bewegung entstehen kann. Durch weitere Prozesse entsteht eine praktisch synchrone und lebhafte Animation.

Unser Verfahren eignet sich zudem besonders gut für Fotos und ist so einfach anzuwenden, dass jeder Nutzer eines mobilen Endgerätes seine eigenen Bilder nutzen kann.

 




  Home - Impressum - Disclaimer