Deutsche Nachrichtenveranstaltungen finden statt

ElevenLabs CEO Mati Staniszewski über Darth Vader, Wettbewerb und die Verhinderung von Missbrauch

Mati-Staniszewski-elevenlabs-interview

(SeaPRwire) –   Wie teilt sich das Verhältnis zwischen Ihren Privat- und Unternehmenskunden auf?

Heute liegt es nahe bei 60/40, 50/50. Zuvor war es auf der Unternehmensseite niedriger. Anfang 2024 lag es bei 90/10. Vieles davon wächst auf der Unternehmensseite, besonders jetzt, da wir mit einigen Unternehmen wie Deutsche Telekom oder Epic Games zusammenarbeiten und tiefer mit ihnen kooperieren.

ElevenLabs entwickelt sowohl konversationelle KI-Chatbots als auch kreative Tools, die Audio basierend auf Prompts generieren. Welches entwickelt sich schneller?

Konversationelle KI. Der Anteil des Self-Service, der konversationelle KI nutzt, sind hauptsächlich Entwickler. Es gibt einen interessanten Impuls aus sehr traditionellen Bereichen, ebenfalls in dieses konversationelle Segment vorzudringen. Epic Games ist ein großartiges Beispiel. Das war wahrscheinlich eine der größten Implementierungen, die wir je durchgeführt haben, um in Fortnite ein Erlebnis zu schaffen, bei dem jeder mit Darth Vader interagieren konnte. Das geschah in Partnerschaft mit dem Nachlass von James Earl Jones. Aber Millionen von Spielern hatten Darth Vader live, mit dem man spontan spielen konnte. Das war traditionell nicht möglich, von statischen, vorgenerierten Zeilen zu einem dynamischen Charakter überzugehen. Das war enorm. Jetzt sehen wir, dass der Bereich des Kundensupports sich dank konversationeller KI in Richtung einer riesigen Disruption bewegt.

Wie können Sie den großen Akteuren vorausbleiben? 

Ich denke, wir haben einige der besten Leute. Und mit Text-zu-Sprache [und] mit dieser Sprach-zu-Text-Technologie ist die nächste große Herausforderung, die jeder zu lösen versucht, die Frage, ob man ein Omni-Modell trainieren kann – also eine Kombination aus einem LLM [Large Language Model] und Sprache, das eine viel bessere Konversation erzeugen kann, während es gleichzeitig sicherstellt, dass es nicht nur emotional und schnell, sondern auch stabil ist. Wir haben intern einen Prototyp, der das größte Projekt ist, das wir später in diesem Jahr erstellen wollen. Aber das Ziel für konversationelle KI als Produkt und für die Forschung, die dieses Produkt antreiben wird, ist es, den Turing-Test für eine Konversation mit einem KI-Agenten effektiv zu bestehen. Damit man das Gefühl hat, es ist eine echte Konversation. Das ist der Nordstern. 

Ich dachte, wir hätten den Turing-Test-Benchmark bereits bestanden

Reine Sprachinteraktionen wie der Kundensupport bestehen wahrscheinlich den Turing-Test, und ich denke, wir waren hoffentlich einer der ersten, die dies mit einigen der Dinge, die wir tun, erreicht haben. Aber ich denke, es ging um emotionales Kontextbewusstsein und [es gibt eine] höhere Intelligenzschwelle in einer Konversation.

Wie gehen Sie mit Menschen um, die Ihre Technologie missbrauchen? 

Wir haben Sicherheitsvorkehrungen getroffen. Eine davon ist Transparenz oder Herkunft, sodass jeder Inhalt bis zum Konto zurückverfolgt werden kann. Zweitens ist da die Moderationsseite, bei der wir sowohl Text als auch Stimme moderieren. Wir moderieren also auf Betrug und Scams, wir moderieren auf Kindersicherheit. Auf der Stimmenseite moderieren wir, um zu überprüfen, dass sie nicht missbraucht werden. Der letzte Punkt ist, wie wir die Technologie den Menschen nahebringen können, damit sie wissen, dass sie mit KI interagieren. [Es gibt] einen Klassifikator, damit Menschen Audioinhalte hochladen und Informationen darüber erhalten können, ob es KI ist oder nicht. Wir arbeiten mit Oxford, Berkeley, Reality Defender und KI-Sicherheitsinstituten in den USA und Großbritannien zusammen, um anderen Organisationen einen Klassifikator zur Verfügung zu stellen. Der sehr große Punkt ist, wie wir die gesamte Technologie guten Akteuren zur Verfügung stellen und gleichzeitig schlechte Akteure verhindern können. Das ist dieses Gleichgewicht.

Der Artikel wird von einem Drittanbieter bereitgestellt. SeaPRwire (https://www.seaprwire.com/) gibt diesbezüglich keine Zusicherungen oder Darstellungen ab.

Branchen: Top-Story, Tagesnachrichten

SeaPRwire liefert Echtzeit-Pressemitteilungsverteilung für Unternehmen und Institutionen und erreicht mehr als 6.500 Medienshops, 86.000 Redakteure und Journalisten sowie 3,5 Millionen professionelle Desktops in 90 Ländern. SeaPRwire unterstützt die Verteilung von Pressemitteilungen in Englisch, Koreanisch, Japanisch, Arabisch, Vereinfachtem Chinesisch, Traditionellem Chinesisch, Vietnamesisch, Thailändisch, Indonesisch, Malaiisch, Deutsch, Russisch, Französisch, Spanisch, Portugiesisch und anderen Sprachen.