18.05.2018 |
Sätze, die mit „Alexa“ oder „Ok, Google“ beginnen, hört man in deutschen Wohnzimmern immer öfter: Laut einer Umfrage von Splendid-Research nutzt bereits mehr als jeder 3. Deutsche einen Sprachassistenten.
Wetterabfragen, das Anhören von Musik und das Schreiben von Nachrichten gehören dabei zu den häufigsten Anwendungen der Nutzer. Und die Möglichkeiten sind nahezu unbegrenzt. Ein wichtiger Aspekt in diesem Zusammenhang ist, dass die Sprachfunktionen der Smart Speaker kontinuierlich weiterentwickelt werden, um Spracherkennung und Sprachausgabe zu optimieren.
Sprachassistenten nehmen menschliche Züge an
In einem Praxistest von searchmetrics zeigte sich, dass insbesondere Google Home gegenüber einem Test im August 2017 deutlich dazu gelernt hat. So konnte der Sprachassistent nahezu alle per Spracheingabe empfangenen Fragen korrekt beantworten.
Außerdem auffällig – und um auf den eigentlichen Beitragstitel zurück zu kommen: Es wurde viermal häufiger eine menschliche bzw. lustige Antwort gegeben als im Test zuvor. Hieraus resultiert die Frage: Wie menschlich ist KI und merken wir es eigentlich, wenn wir mit einem Computer kommunizieren?
Erst in der vergangenen Woche hat Google mit der Veröffentlichung seiner Sprachsteuerung Google Duplex für großes Aufsehen gesorgt. Google präsentierte einen Service, der es digitalen Assistenten ermöglicht selbstständig Telefonate zu führen und beispielsweise Restaurantreservierungen zu tätigen. Und kaum jemand würde auf die Idee kommen, er spreche mit einer Maschine. Die täuschend echte Nachahmung der menschlichen Sprache geschieht dabei u.a. durch den gezielten Einbau von Pausen, Nachfragen oder Füllwörtern. Der Sprachcomputer suggeriert seinem Gesprächspartner er würde nachdenken und das Gehörte verarbeiten. Den kompletten Sprachdialog gibt es hier.
Das Zauberwort heißt Transparenz
So faszinierend Googles neueste Entwicklung auch sein mag, so zahlreich sind auch die Gegensprecher. Von ethischen Bedenken und Betrugspotenzial ist die Rede. Googles Antwort auf diese Themen: Transparenz. Duplex werde sich im Gespräch als KI identifizieren, um Nutzer nicht zu täuschen – so Google in einem Statement.
Fakt ist: Automatic Speech Recognition (ASR) und Text-to-Speech (TTS) wie Alexa und Google Assistant sie bereits nutzen, können den Alltag enorm vereinfachen. Und auch die Vorteile für den Einsatz in der Telefonie (z.B. in Form von Telefonansagen für Hotlines) sind unbestritten. Die Frage, die bleibt: Wie viel Mensch darf eine Maschine sein?