In den Lieblingscartoon eintauchen und mit den Figuren sprechen? Im AT&T Experience Store in Dallas, USA ist das möglich. Hier begrüßt ein virtueller Bugs Bunny die BesucherInnen und bittet sie um Hilfe bei der Suche nach goldenen Karotten, die im ganzen Gebäude versteckt sind.
Diese Unterhaltungen in Echtzeit macht Microsoft Custom Neural Voice möglich, eine neuronale Text-to-Speech-Funktion innerhalb von Speech, einem Azure Cognitive Service.
Höchste Transparenz bei synthetischen Stimmen
Eine Unterhaltung mit einem Cartoon-Helden wie Bugs Bunny mag sich durch Custom Neural Voice real anfühlen, aber jeder weiß, dass sie es nicht ist – denn Bugs Bunny ist eine fiktive Figur. Das ist eine wichtige Abgrenzung, die Microsoft bei jeder Anwendung der Technologie bewahren möchte. Das ist auch ein wesentlicher Grund dafür, dass Custom Neural Voice nur mit Einschränkungen verfügbar ist: interessierte KundInnen bewerben sich und werden von Microsoft autorisiert, um die Technologie nutzen zu können.
Viele Anwendungen für Custom Neural Voice stellen einen fiktiven Charakter dar. Manche KundInnen wünschen jedoch, dass die Stimme eine reale Person repräsentiert, beispielsweise eine Autorin, die ihr eigenes Buch liest. Selbst in diesen Fällen ist es wichtig, dass die Zuhörenden wissen, dass die Stimme synthetisch erzeugt ist. Aus diesem Grund nimmt Microsoft eine Offenlegungspflicht in Verträge auf. Damit ist es für die BenutzerInnen stets erkennbar, wenn sie mit einer synthetischen Stimme interagieren.
Der Zugang zu Custom Neural Voice beinhaltet technische Kontrollmechanismen, um den Missbrauch des Dienstes zu verhindern. Diese stützen sich auf eine Reihe von Studien sowie Richtlinien, die im Austausch mit der SynchronsprecherInnen-Branche und EthikerInnen aufgestellt wurden.
Ein Bekenntnis zu verantwortungsvoller KI
Für Microsoft ist es ein Grundpfeiler bei der Entwicklung von künstlicher Intelligenz, dass sie verantwortungsvoll gestaltet und eingesetzt wird. Um dies zu erreichen, haben wir Prinzipien für verantwortungsvolle KI aufgestellt.
Zum Schutz vor einem Missbrauch der Technologie werden Folgenabschätzungen durchgeführt, um potenzielle Risiken zu ermitteln. Sobald die Risiken identifiziert sind, entwickeln wir Funktionen und Prozesse, um sie zu bewältigen.
Im Fall von Custom Neural Voice umfassen solche Schutzmaßnahmen den Prozess der Autorisierung jedes potenziellen Anwendungsfalls, einen Verhaltenskodex und die SprecherInnen-Verifizierung, bei der die Stimmen von SprecherInnen mit Trainings-Audiodateien verglichen werden. Microsoft verlangt zudem vertraglich von KundInnen, dass sie die Zustimmung der SprecherInnen vor der Nutzung einholen.
Custom Neural Voice könnte eine intensivere Interaktion mit künstlicher Intelligenz ermöglichen – zum Beispiel in den Bereichen Unterhaltung, Information oder Bildung. Denn wir sind überzeugt: Wenn wir Technologie verantwortungsvoll entwickeln und einsetzen, kann sie uns ungeahnte Türen öffnen.
Mehr Details zu konkreten Anwendungsbeispielen und dem Team hinter der Custom Neural Voice-Technologie gibt es in diesem englischsprachigen Blogbeitrag. Auch spannend: Unser Kollege Thomas Langkabel erklärt in seinem Beitrag die Bausteine für einen verantwortungsvollen Einsatz von künstlicher Intelligenz. Und wie die US-amerikanische Versicherung Progressive ihren sprechenden Chatbot Flo einsetzt, haben wir hier zusammengefasst.