April 2026
Die Plattform unterstützt jetzt OpenAI, Claude, Gemini und Mistral direkt – mit DSGVO-konformen Optionen bei allen Anbietern
Modelle können pro Szenario oder für einzelne Dialogschritte festgelegt werden. So übernimmt jedes Modell genau die Aufgabe, für die es am besten geeignet ist – innerhalb derselben Konversation und ohne zusätzlichen Entwicklungsaufwand.
Für Unternehmen, die vollständige Kontrolle über Datenresidenz und Modelllogik benötigen, unterstützt die Plattform auch individuelle LLM-Deployments. Das bedeutet, dass Unternehmenskunden ihr eigenes privates LLM (beispielsweise eine intern gehostete Llama-Instanz) direkt an die Voice-Agent-Plattform anbinden und als nativen Anbieter behandeln können. Das ist besonders relevant, wenn regulatorische Anforderungen, branchenspezifische Terminologie oder Bedingungen öffentlicher Ausschreibungen ein Modell auf gemeinsam genutzter Infrastruktur ausschließen.
Leistung in der Praxis
Geschwindigkeit oder Genauigkeit – beides geht selten gleichzeitig
LLMs bringen immer einen Zielkonflikt mit sich: schnelle Antworten oder tiefere Verarbeitung. Leichte Modelle reagieren in rund 600 Millisekunden. Leistungsstärkere Modelle brauchen bis zu 2 Sekunden – das führt hörbar zu Pausen im Gespräch.
Sowohl Geschwindigkeit als auch Genauigkeit sind wichtig – entscheidend ist der Anwendungsfall. Gerade bei Voice-Anwendungen muss die Antwort schnell genug kommen, damit das Gespräch natürlich wirkt. Gleichzeitig braucht es genug Genauigkeit, um auch schwierige Eingaben wie Namen oder Fachbegriffe korrekt zu verstehen.
Es reicht nicht, Eingaben nur zu erkennen. Systeme müssen auch verstehen, was gemeint ist – und in welchem Kontext. Im Chat ist Zeit weniger kritisch als im Voice-Bereich. Hier kann der Fokus stärker auf Verständnis und Antwortqualität liegen, statt nur auf Geschwindigkeit. Entscheidend ist die Balance: schnell genug reagieren – und gleichzeitig präzise und sinnvoll antworten.
Flexibilität
Sie entscheiden, welches Modell welche Aufgabe übernimmt
Modelle können entweder für ganze Abläufe oder für einzelne Schritte festgelegt werden. So kann ein Modell die Konversation führen, während ein anderes gezielt Daten verarbeitet.
„Viele Unternehmen arbeiten intern bereits mit bestimmten LLMs und sind daran gewöhnt.
Deshalb zwingen wir niemanden, auf andere Modelle umzusteigen. Sie können einfach weiter mit dem arbeiten, was bei Ihnen bereits funktioniert.
Und wer eigene Modelle betreibt – etwa mit unternehmensspezifischen Daten – kann dieses Potenzial jetzt auch direkt in Voice-Anwendungen nutzen.“ – Alexander Mishin, Voice Agent Product Owner
Alles läuft in einer visuellen Low-Code/No-Code-Oberfläche, die sowohl Kunden als auch interne Teams nutzen können. Abläufe lassen sich dort direkt erstellen, testen und anpassen – ohne Entwickler.
So können Teams jeden Schritt einer Interaktion laufend verbessern und selbst entscheiden, wie sie Geschwindigkeit, Genauigkeit und Compliance ausbalancieren. Die Abhängigkeit von einem einzelnen Anbieter entfällt. Die Plattform lässt sich flexibel an reale Anwendungsfälle anpassen – auch dann, wenn innerhalb einer Konversation unterschiedliche Aufgaben unterschiedliche Modelle erfordern.
DSGVO-Konformität
Alle Modelle sind klar als DSGVO-konform oder nicht konform gekennzeichnet. Ein integrierter Filter stellt standardmäßig Modelle mit europäischem Hosting für europäische Anwendungsfälle in den Vordergrund.
Gleichzeitig bleibt die Plattform flexibel. Wenn keine strengen Vorgaben zur Datenhaltung bestehen, können auch nicht DSGVO-konforme Modelle gezielt eingesetzt werden – etwa für spezielle Funktionen oder höhere Leistungsfähigkeit. So lässt sich je nach Anforderung zwischen Qualität, Geschwindigkeit und Funktionsumfang abwägen.
LLM-Nutzung ist inklusive
LLM-basierte Funktionen sind jetzt Teil des Standardangebots
Für die Nutzung integrierter Modelle fallen keine zusätzlichen Kosten an. KI-Funktionen können genutzt werden, ohne separate Modellkosten verwalten zu müssen.
Für spezifische Anforderungen bleiben individuelle LLM-Integrationen weiterhin als Zusatzprojekt möglich. Unterschiedliche Modelle können je nach Anwendungsfall kombiniert werden, um Geschwindigkeit und Antwortqualität gezielt auszubalancieren.
