Sprichst du mit mir? Azure AI erweckt mit Custom Neural Voice beliebte Figuren zum Leben

Virtueller Bugs Bunny mit Custom Neural Voice

In den Lieblingscartoon eintauchen und mit den Figuren sprechen? Im AT&T Experience Store in Dallas, USA ist das möglich. Hier begrüßt ein virtueller Bugs Bunny die Besucher*innen und bittet sie um Hilfe bei der Suche nach goldenen Karotten, die im ganzen Gebäude versteckt sind.

Diese Unterhaltungen in Echtzeit macht Microsoft Custom Neural Voice möglich, eine neuronale Text-to-Speech-Funktion innerhalb von Speech, einem Azure Cognitive Service.

Höchste Transparenz bei synthetischen Stimmen

Eine Unterhaltung mit einem Cartoon-Helden wie Bugs Bunny mag sich durch Custom Neural Voice real anfühlen, aber jeder weiß, dass sie es nicht ist – denn Bugs Bunny ist eine fiktive Figur. Das ist eine wichtige Abgrenzung, die Microsoft bei jeder Anwendung der Technologie bewahren möchte. Das ist auch ein wesentlicher Grund dafür, dass Custom Neural Voice nur mit Einschränkungen verfügbar ist: interessierte Kund*innen bewerben sich und werden von Microsoft autorisiert, um die Technologie nutzen zu können.

Smartphone mit virtuellem Bugs Bunny

Viele Anwendungen für Custom Neural Voice stellen einen fiktiven Charakter dar. Manche Kund*innen wünschen jedoch, dass die Stimme eine reale Person repräsentiert, beispielsweise eine Autorin, die ihr eigenes Buch liest. Selbst in diesen Fällen ist es wichtig, dass die Zuhörenden wissen, dass die Stimme synthetisch erzeugt ist. Aus diesem Grund nimmt Microsoft eine Offenlegungspflicht in Verträge auf. Damit ist es für die Benutzer*innen stets erkennbar, wenn sie mit einer synthetischen Stimme interagieren.

Der Zugang zu Custom Neural Voice beinhaltet technische Kontrollmechanismen, um den Missbrauch des Dienstes zu verhindern. Diese stützen sich auf eine Reihe von Studien sowie Richtlinien, die im Austausch mit der Synchronsprecher*innen-Branche und Ethiker*innen aufgestellt wurden.

Ein Bekenntnis zu verantwortungsvoller KI

Für Microsoft ist es ein Grundpfeiler bei der Entwicklung von künstlicher Intelligenz, dass sie verantwortungsvoll gestaltet und eingesetzt wird. Um dies zu erreichen, haben wir Prinzipien für verantwortungsvolle KI aufgestellt.

Zum Schutz vor einem Missbrauch der Technologie werden Folgenabschätzungen durchgeführt, um potenzielle Risiken zu ermitteln. Sobald die Risiken identifiziert sind, entwickeln wir Funktionen und Prozesse, um sie zu bewältigen.

Im Fall von Custom Neural Voice umfassen solche Schutzmaßnahmen den Prozess der Autorisierung jedes potenziellen Anwendungsfalls, einen Verhaltenskodex und die Sprecher*innen-Verifizierung, bei der die Stimmen von Sprecher*innen mit Trainings-Audiodateien verglichen werden. Microsoft verlangt zudem vertraglich von Kund*innen, dass sie die Zustimmung der Sprecher*innen vor der Nutzung einholen.

Custom Neural Voice könnte eine intensivere Interaktion mit künstlicher Intelligenz ermöglichen – zum Beispiel in den Bereichen Unterhaltung, Information oder Bildung. Denn wir sind überzeugt: Wenn wir Technologie verantwortungsvoll entwickeln und einsetzen, kann sie uns ungeahnte Türen öffnen.

Mehr Details zu konkreten Anwendungsbeispielen und dem Team hinter der Custom Neural Voice-Technologie gibt es in diesem englischsprachigen Blogbeitrag. Auch spannend: Unser Kollege Thomas Langkabel erklärt in seinem Beitrag die Bausteine für einen verantwortungsvollen Einsatz von künstlicher Intelligenz. Und wie die US-amerikanische Versicherung Progressive ihren sprechenden Chatbot Flo einsetzt, haben wir hier zusammengefasst.

 


Ein Beitrag von Pina Meisel
Communications Manager Artificial Intelligence & Innovation

Pina Meisel als Portrait-Bild

Tags: , ,

Weitere Infos zu diesem Thema

29. September 2023
Das war die #futurework23 – Festival zur Zukunft der Arbeit im Rückblick

Die #futurework23, das größte deutsche Festival zum Thema Zukunft der Arbeit, brachte dieses Jahr zum fünften Mal Visionär*innen, Unternehmensleiter*innen und Fachleute zusammen. In zahlreichen Panel-Talks und Workshops bot das Event eine Plattform für wegweisende Ideen und innovative Lösungen – vereint unter dem Leitthema der künstlichen Intelligenz (KI) und wie sie uns in der Arbeitswelt auf vielfältige Weise beeinflusst.

21. September 2023
Microsoft Copilot, Ihr täglicher KI-Begleiter

Heute gehen wir den nächsten Schritt, um unsere KI-Funktionen in einem einzigen Erlebnis zu vereinen, das wir Microsoft Copilot nennen, Ihren täglichen KI-Begleiter. Copilot kombiniert auf einzigartige Weise den Kontext und die Intelligenz des Internets, Ihre Arbeitsdaten und das, was Sie gerade auf Ihrem PC tun, um Ihnen bessere Unterstützung zu bieten – wobei Ihre Privatsphäre und Sicherheit an erster Stelle stehen.

14. September 2023
Chatten mit Bing: Der persönliche Assistent für Tagesausflüge und Reisen

Bing Chat kann nicht nur im Arbeitsalltag, beim Lernen oder Recherchieren unterstützen, sondern auch bei der Freizeitplanung eine große Hilfe sein. Im dritten Teil unserer Blogserie haben wir erneut mit Bing gechattet und diesmal mithilfe des KI-Tools einen Tagesausflug nach München geplant.

12. September 2023
Arbeitsgruppe des Bündnis für Bildung (BfB) stellt „Leitfaden für Schülergeräte“ vor

Gemeinsam mit einer Arbeitsgruppe des „Bündnis für Bildung“ (BfB) haben Microsoft Deutschland und weitere Partner einen „Leitfaden für Schülergeräte“ entwickelt. Die Broschüre enthält praktische Hinweise und Tipps zu Finanzierung, Beschaffung, Einsatz und Support digitaler Endgeräte in Schulen und Bildungseinrichtungen. Dabei setzt der Leitfaden am aktuellen „DigitalPakt Schule“ des Bundesministeriums für Bildung und Forschung an, der primär den Aufbau und die Leistungssteigerung von digitalen Netzwerkinfrastrukturen in Schulen finanzieren soll.

6. September 2023
Chatten mit Bing: 4 Tipps für mehr Produktivität und Kreativität im Arbeitsalltag

Bing Chat – das KI-gesteuerte, multifunktionale Tool kann als persönlicher Assistent das (Arbeits-)Leben erleichtern und sogar unsere Produktivität und Kreativität steigern. Erste Grundlagen von Bing Chat haben wir bereits im ersten Teil unserer Blogserie vorgestellt. Nun widmen wir uns dem beruflichen Einsatz von Bing Chat und stellen spezifische Anwendungsfälle, Bedienhinweise und Best Practices vor.