
29.08.2018 |
Im vergangenen Monat haben wir die Erweiterung der TENIOS Cloud Communications Plattform für die automatische Umwandlung von Text in Sprache – Text-to-Speech (TTS) – vorgestellt. Diese basiert auf der Technologie des Google Voice Assistant und unterstützt aktuell 38 verschiedene Stimmvarianten.
TENIOS erweitert ihre Voice-API für die Integration des Text-to-Speech (TTS) Services und macht diese für externe Anwendungen und Sprachdienste nutzbar.
Voice API von TENIOS
Mit der TENIOS Voice-API können Sie Ihren Kunden schnell und kostengünstig personalisierte Anruferlebnisse mit Benutzerkontext und Daten zur Verfügung stellen. Innovation, Rationalisierung und Skalierung mit flexiblen Sprachfunktionen – alles in einem zuverlässigen, hochwertigen Carrier-Netzwerk.
TTS goes Voice-API
Die Integration von TTS in die TENIOS Voice-API erfolgt über den Call-Control Block im Routingplan. Hierzu tragen Sie zunächst die Parameter wie URL (Ziel) der externen Anwendung sowie den internen Access-Key im API Routing-Control Block des TENIOS Portals ein:
Bei der Ausführung eines API Routing Control Blocks im Routingplan, wird eine POST-Anfrage von TENIOS an Ihren Server geschickt.
Ein Beispiel:
Für die Sprachausgabe bzw. die Verwendung von Text-to-Speech (TTS) wählen Sie die Variante „blockType“: „SAY“. Dieser übergibt per Voice-API den Befehl zur Sprachausgabe im benannten Routingplan.
Die nachfolgende Anfrage zeigt die zugrundeliegende Programmierung:
Die Variable blockType definiert das SAY-Format. In der Zeile text wird der Text eingegeben, der in Sprache umgewandelt werden soll. Die Variable voiceName gibt an, welche Stimme für die Sprachausgabe genutzt werden soll.
Die Variable useSsml zeigt an, ob Speech Synthesis Markup Language – kurz SSML – aktiviert ist. Definiert man die Variable als „true“, so besteht die Option die Sprachausgabe anzupassen: Mit Hilfe sogenannter SSML-Tags, ist es möglich Eigenschaften wie z.B. Lautstärke und Sprechgeschwindigkeit zu ändern oder Betonungen sowie Pausen hinzufügen.
<SSML> Integration
Dank der kontinuierlichen Weiterentwicklung von Googles Sprachsoftware – man schaue sich Google Duplex an -, klingen Sprachassistenten immer realistischer. Attribute wie Betonungen oder Sprechpausen tragen maßgeblich dazu bei, eine menschenähnliche Sprachausgabe zu erzeugen. An dieser Stelle kommt die auf XML basierende Auszeichnungssprache SSML zum Einsatz. Das folgende Beispiel zeigt den SAY-Block im TENIOS Kundenportal unter Einbindung des SSML-Tags <emphasis> zur Betonung des Wort TENIOS:
Der SSML-Tag <break>, der eine Sprechpause auslöst, lässt sich wie folgt einbinden:
Die Länge der Pause wird dabei entweder in „strength“ oder in „time“ definiert.
Eine Übersicht aller verfügbaren SSML-Tags finden Sie hier.
Die Integration von TTS Diensten über die TENIOS Voice-API kann für eine Vielzahl von Anwendungen wie Vorlesen von Texten über das Telefon, Zahlenkombinationen, dynamische Generierung von Ansagen bei Hotlines und Call Center Diensten, individuelle Begrüßungsansagen oder für die Einbindung von Sprachbots genutzt werden.
Nutzen Sie die Flexibilität und Skalierbarkeit der TENIOS Voice-API für Ihre Anwendungen. Testen Sie die TENIOS Sprachfunktionen jetzt 30 Tage lang völlig unverbindlich.