Sprichst du mit mir? Azure AI erweckt mit Custom Neural Voice beliebte Figuren zum Leben

4. Februar 2021

Virtueller Bugs Bunny mit Custom Neural Voice

In den Lieblingscartoon eintauchen und mit den Figuren sprechen? Im AT&T Experience Store in Dallas, USA ist das möglich. Hier begrüßt ein virtueller Bugs Bunny die Besucher*innen und bittet sie um Hilfe bei der Suche nach goldenen Karotten, die im ganzen Gebäude versteckt sind.

Diese Unterhaltungen in Echtzeit macht Microsoft Custom Neural Voice möglich, eine neuronale Text-to-Speech-Funktion innerhalb von Speech, einem Azure Cognitive Service.

Höchste Transparenz bei synthetischen Stimmen

Eine Unterhaltung mit einem Cartoon-Helden wie Bugs Bunny mag sich durch Custom Neural Voice real anfühlen, aber jeder weiß, dass sie es nicht ist – denn Bugs Bunny ist eine fiktive Figur. Das ist eine wichtige Abgrenzung, die Microsoft bei jeder Anwendung der Technologie bewahren möchte. Das ist auch ein wesentlicher Grund dafür, dass Custom Neural Voice nur mit Einschränkungen verfügbar ist: interessierte Kund*innen bewerben sich und werden von Microsoft autorisiert, um die Technologie nutzen zu können.

Viele Anwendungen für Custom Neural Voice stellen einen fiktiven Charakter dar. Manche Kund*innen wünschen jedoch, dass die Stimme eine reale Person repräsentiert, beispielsweise eine Autorin, die ihr eigenes Buch liest. Selbst in diesen Fällen ist es wichtig, dass die Zuhörenden wissen, dass die Stimme synthetisch erzeugt ist. Aus diesem Grund nimmt Microsoft eine Offenlegungspflicht in Verträge auf. Damit ist es für die Benutzer*innen stets erkennbar, wenn sie mit einer synthetischen Stimme interagieren.

Der Zugang zu Custom Neural Voice beinhaltet technische Kontrollmechanismen, um den Missbrauch des Dienstes zu verhindern. Diese stützen sich auf eine Reihe von Studien sowie Richtlinien, die im Austausch mit der Synchronsprecher*innen-Branche und Ethiker*innen aufgestellt wurden.

Ein Bekenntnis zu verantwortungsvoller KI

Für Microsoft ist es ein Grundpfeiler bei der Entwicklung von künstlicher Intelligenz, dass sie verantwortungsvoll gestaltet und eingesetzt wird. Um dies zu erreichen, haben wir Prinzipien für verantwortungsvolle KI aufgestellt.

Zum Schutz vor einem Missbrauch der Technologie werden Folgenabschätzungen durchgeführt, um potenzielle Risiken zu ermitteln. Sobald die Risiken identifiziert sind, entwickeln wir Funktionen und Prozesse, um sie zu bewältigen.

Im Fall von Custom Neural Voice umfassen solche Schutzmaßnahmen den Prozess der Autorisierung jedes potenziellen Anwendungsfalls, einen Verhaltenskodex und die Sprecher*innen-Verifizierung, bei der die Stimmen von Sprecher*innen mit Trainings-Audiodateien verglichen werden. Microsoft verlangt zudem vertraglich von Kund*innen, dass sie die Zustimmung der Sprecher*innen vor der Nutzung einholen.

Custom Neural Voice könnte eine intensivere Interaktion mit künstlicher Intelligenz ermöglichen – zum Beispiel in den Bereichen Unterhaltung, Information oder Bildung. Denn wir sind überzeugt: Wenn wir Technologie verantwortungsvoll entwickeln und einsetzen, kann sie uns ungeahnte Türen öffnen.

Mehr Details zu konkreten Anwendungsbeispielen und dem Team hinter der Custom Neural Voice-Technologie gibt es in diesem englischsprachigen Blogbeitrag. Auch spannend: Unser Kollege Thomas Langkabel erklärt in seinem Beitrag die Bausteine für einen verantwortungsvollen Einsatz von künstlicher Intelligenz. Und wie die US-amerikanische Versicherung Progressive ihren sprechenden Chatbot Flo einsetzt, haben wir hier zusammengefasst.

Ein Beitrag von Pina Meisel
Communications Manager Artificial Intelligence & Innovation

Sprichst du mit mir? Azure AI erweckt mit Custom Neural Voice beliebte Figuren zum Leben

Höchste Transparenz bei synthetischen Stimmen

Ein Bekenntnis zu verantwortungsvoller KI

Weitere Infos zu diesem Thema