Zum Hauptinhalt springen
Zu Hauptinhalt springen
News Center

Künstliche Intelligenz in den Medien

KI ist aus der Medienbranche nicht mehr wegzudenken

„Das Thema ist da und wird nicht mehr weggehen“ – das habe ich vor kurzem in einem Interview mit dem Branchenmagazin journalist über den Einsatz künstlicher Intelligenz in Journalismus und Medien gesagt. Die Technologie ist bereit und der Wille, sie in den Medien anzuwenden, ist da. Jetzt braucht es nur noch Mut und Entschlossenheit, sie auch zu nutzen. Wir zeigen Beispiele, wo intelligente Systeme bereits erfolgreich eingesetzt werden.

Mehr als die Hälfte der Führungskräfte in Medienunternehmen, so ein Ergebnis des Digital News Report der University of Oxford und des Reuters Institute, sieht künstliche Intelligenz (KI) als einen der wichtigsten Innovationstreiber im Journalismus (Link zum neuesten Report). Die Medienbranche, so stellten Analyst*innen von PwC sogar schon im Jahr 2018 fest, habe die Chancen künstlicher Intelligenz längst erkannt und setze sie etwa bereits zum automatisierten Verfassen von Artikeln, dem Aufspüren gefälschter Inhalte in Texten oder Videos, zum Indizieren von Video-Streams sowie bei der Individualisierung von Inhalten ein.

RTL Deutschland: Personalisierung durch synthetisch erzeugte Stimmen

Besonders die Möglichkeiten, individualisierte Inhalte herzustellen, sind vielversprechend. Eine wichtige Technologie werden synthetisierte Stimmen sein, die verblüffend echt klingen.

In den Personalisierungsstrategien des Kölner Privatsenders RTL werden Text-to-Speech-Technologien zu einer zentralen Säule. Hier lesen heute schon die hauseigenen Moderator*innen Inken Wriedt und Maik Meuser auf Wunsch aktuelle Nachrichten aus den Internet-Angeboten von RTL und ntv vor. Möglich ist das durch die Stimmen der beiden Moderator*innen, die über die Text-to-Speech-Engine von Microsoft auf Basis künstlicher Intelligenz nachmodelliert wurden. So sind aus nur vier Stunden gesprochenem Text lebensechte, natürlich klingende Versionen der Stimmen entstanden, die vom menschlichen Original kaum mehr zu unterscheiden sind. Künftig werden solche Custom Neural Voices sowohl in redaktionellen Prozessen genutzt und sich zunehmend auch in innovativen, digitalen Produkten wiederfinden. Individuelle News Briefings, denen eine persönliche Begrüßung der Nutzer*innen vorausgeht, ermöglichen dann neue Mediennutzungserlebnisse mit ihren vertrauten Stimmen.

Dieses Projekt, das im Rahmen einer umfassenden Partnerschaft für technologische Innovationen in den Bereichen Medien und Bildung von Bertelsmann und Microsoft entstanden ist, setzt auf unsere hohen ethischen Standards für den verantwortungsvollen Umgang mit künstlicher Intelligenz. So werden synthetische Stimmen beim für das Publikum deutlich gekennzeichnet.

Verantwortungsvoller Umgang mit KI-Technologien
Sprachtechnologien können darüber hinaus einen hohen Beitrag zur Inklusion und medialer Teilhabe leisten, etwa für Menschen Sehbeeinträchtigungen. Aber sie beinhalten grundsätzlich auch das Potenzial, ethisch nicht verantwortungsvoll oder gar klar missbräuchlich eingesetzt zu werden und Menschen zu täuschen. Microsoft hat deshalb die Nutzung dieser Technologien eingeschränkt und bereits bestehende, mehrschichtige Kontrollsysteme weiter ergänzt. So ist es zum Beispiel zwingend notwendig, dass die Original-Sprecher*innen an dem Training ihrer synthetischen Stimmen aktiv beteiligt sind. Auch inhaltlich gibt es klare Richtlinien. Ausgeschlossen von der Synthetisierung mittels KI sind beispielsweise Inhalte, welche die Meinungsbildung manipulativ beeinflussen könnten. So stellt Microsoft sicher, dass die Technologie verantwortungsvoll genutzt und nicht unangemessen eingesetzt werden kann.

Synthetisch hergestellte, manipulierte Medieninhalte wie Deepfake-Videos stellen eine Gefahr für den Journalismus und die Demokratie dar. Beim Erkennen solcher Deep Fakes, die täuschend echt erscheinen, aber Aussagen meist prominenter Sprecher*innen verfälschen, kann KI ebenfalls helfen: Der Video Authenticator von Microsoft analysiert Bilder und Videos und ordnet mit einer prozentualen Wahrscheinlichkeit ein, ob dieses Material bearbeitet wurde.

Anfang 2022 haben wir gemeinsam mit Medien-, Social Media und Technologieunternehmen wie der BBC und CBC/Radio-Canada sowie Twitter, Adobe, Arm, Intel und Truepic die Coalition for Content Provenance and Authenticity gegründet, die Standards für die Erkennung der Herkunft und Authentifizierung von Inhalten entwickelt. Ziel dieses Bündnisses ist es, das Vertrauen in zuverlässige, digitale Inhalte aufrecht zu erhalten, in dem die Ursprungsquellen von Inhalten verifiziert und mögliche Veränderungen transparent gemacht werden.

Vielfältiger KI-Einsatz in den Medien: von Recherchen bis Datenjournalismus

Aufgrund ihrer herausragenden Fähigkeit, Muster und Abweichungen in großen Datenmengen zu erkennen, eignet sich künstliche Intelligenz auch hervorragend für Recherchen: Analysen der sozialen Medien etwa geben Anhaltspunkte über aktuell diskutierte und damit für das Publikum relevante Themen. KI kann auch unstrukturierte Daten nach Auffälligkeiten durchsuchen und bildet damit die Basis für immer wichtiger werdende, datenjournalistische Aktivitäten, die Journalist*innen völlig neue Themen und Darstellungsmöglichkeiten eröffnet. Im investigativen Journalismus können KI-basierte Technologien nicht nur eine umfassende Recherche in riesigen, unstrukturierten Datensätzen unterstützen, sondern auch semantische Verknüpfungen und Beziehungen herstellen und Journalist*innen dadurch helfen, schneller an den Kern einer Geschichte zu kommen. Schließlich leistet KI auch wertvolle Beiträge für die Vernetzung von Expert*innen und dem Aufbereiten von Wissen – sowohl im eigenen Unternehmen als auch über die eigenen Grenzen hinweg. Wer also bei der Recherche nach Fachleuten auf KI setzt, hat die Chance, wesentlich schneller fündig zu werden als mit klassischen Methoden.

Schreibt KI demnächst auch Artikel?

Die Qualität von Texten, die von einer KI erstellt werden, wird immer besser. Das liegt an der Datenbasis, über die Algorithmen trainiert werden. Eins der mächtigsten KI-Sprachmodelle ist GPT-3 von OpenAI, das mit rund 175 Milliarden Datenpunkten trainiert wurde. Damit lassen sich beeindruckende Texte produzieren, die beim Lesen wie Werke von Menschen erscheinen.

Solche Texte werden zwar in absehbarer Zeit nicht im Feuilleton oder als Leitartikel erscheinen, aber das ist auch gar nicht ihr Zweck. Für die Berichterstattung über lokale Sportereignisse oder aktuelle Börsenkurse sind solche Texte dagegen sehr sinnvoll, denn sie helfen dabei, aus umfangreichen Daten Artikel zu generieren, die sich viel besser lesen lassen als lange Tabellen. KI kann uns bei Texten helfen, die nicht primär von ihrer Sprachgewalt leben, sondern von den richtigen Zahlen und Fakten. Journalist*innen werden dadurch von repetitiven Aufgaben entlastet und bekommen Freiräume, um sich auf echtes kreatives Schaffen zu fokussieren.

GPT-3 ist als sichere und skalierbare Unternehmenslösung als Teil des Azure Open AI Service verfügbar.

BBC sagt Beeb!

Die British Broadcast Corporation BBC gilt als eine der ehrwürdigsten Rundfunkanstalten der Welt: Seit genau 100 Jahren ist sie die vertrauenswürdige Stimme der Nachrichten im Vereinigten Königreich. Seit 2020 unterstützt auch ein Sprach-Bot diese Vertrauensstellung: Als innovatives Medienunternehmen hat die BBC mit Beeb einen eigenen Sprachassistenten entwickelt, der nicht nur die englische Hochsprache, sondern dazu zahlreiche regionale Akzente versteht und spricht. Beep wurde mit dem Azure Bot Service von Microsoft erstellt und nutzt neben der Direct Line Speech des Services auch die Spracherkennungstechnologien der Azure Cognitive Services.

Für die Zukunft plant die BBC nicht nur die Ausweitung der sprachlichen Möglichkeiten für ein internationaleres Publikum, sondern auch funktionale Erweiterungen für die sprachgesteuerte Navigation durch das umfangreiche Video-, Text- und Audioportfolio des Senders, das zum Beispiel allein mehr als 5.000 Podcast-Titel mit einer Vielzahl von Episoden umfasst – ganz zu schweigen von den vielen Nachrichtensendungen, Wetterberichten, Komödien oder Dramen. Heute basiert der Medienkonsum auf Vorschlägen und Empfehlungen. Der Weg hin zu echter sprachlicher Konversation in der Mediennutzung kann die Interaktion mit Nutzer*innen auf ein neues Level heben.

Die ganze Geschichte über Beep gibt es hier.

NBA erleben: Datengestützte App für Fans

Die US-amerikanische Basketballliga NBA hat sich vor zwei Jahren aufgemacht, um ihren Fans in der ganzen Welt ein völlig neues und sehr persönliches Fan-Erlebnis zu bieten: Die zum Saisonstart 2022 vorgestellte, neue NBA-App auf Basis von Microsoft Azure ist der Ort, an dem die Fans in das Geschehen der Liga eintauchen können – mit ihren individuellen Vorlieben und Wünschen. Angesichts der rund 2,1 Milliarden Menschen weltweit, die sich auf Liga-, Team- und Spieler-Accounts verteilen, ist das keine kleine Aufgabe. Es gibt Fans auf jedem Kontinent, in jeder Zeitzone und in jeder Sprache, und jede*r mag ein bestimmtes Team, einen bestimmten Spieler oder einen bestimmten Aspekt des Spiels lieber als andere.

Eine solche Vielfalt abzubilden, ist eine der Spezialitäten der Microsoft-Cloud, in der zunächst Nutzungsdaten erhoben und verarbeitet werden, um mit fortschrittlicher KI und maschinellem Lernen differenzierte, hyperpersonalisierte Fanerlebnisse möglich zu machen.

Schon die Live-Übertragung eines einzigen Spiels erfordert einen enormen Aufwand. Dazu kommen weitere Inhalte, die mit unterschiedlicher Geschwindigkeit und kreativem Aufwand erstellt werden. In vielen Clips steckt echtes Handwerk – sie werden vertont, überprüft, bearbeitet und fertiggestellt. Hinzu kommen personalisierte Inhalte, die in Echtzeit bereitgestellt werden – etwa individuelle Highlight-Clips der Lieblingsspieler eines Fans.

Und das ist erst der erste Schritt: Mit Blick auf die Zukunft werden Funktionen wie Augmented Reality, Virtual Reality und andere Technologien für Quantensprünge in der offiziellen App der NBA sorgen. Damit wird es für die Fans möglich sein, etwa verschiedene Kamerawinkel oder Kommentator*innen zu wählen oder Animationen des Spiels in Echtzeit und aus der Ich-Perspektive zu sehen.

Die vollständige Kundenreferenz zum Einsatz von Microsoft Azure in der NBA findet ihr hier.

Intelligente Lesetipps vom größten Buchverlag der Welt

Der New Yorker Buchverlag Penguin Random House wollte wissen, was seine Kund*innen am liebsten lesen, um im besten Fall mit seiner eigenen Titelliste vor den nächsten Trend zu kommen. Für solche Analysen setzt der Verlag der Bertelsmann Gruppe auf die Daten- und Analysefunktionen von Azure Analysis Services, Azure Cognitive Search und Microsoft Power BI.

Was vergleichsweise überschaubar klingt, ist in Wirklichkeit eine komplexe Aufgabe, bei der riesige Datenmengen verarbeitet werden müssen. So hat zum Beispiel jedes Buch eine eigene internationale Standardbuchnummer (ISBN), die aber von Land zu Land unterschiedlich ist. Das allein erhöht die Datenmenge beträchtlich.

Penguin Random House trägt mit seinen rund 1,2 Millionen Titeln nicht unerheblich zu diesen Daten bei, die zudem aufgrund historisch gewachsener Legacy-Anwendungen und unterschiedlichen Arten von Berichten aus zahlreichen Quellen extrahiert werden müssen. So dauerte es früher relativ lange, Verkäufe, Bestände und Point-of-Sale-Daten zu verfolgen, um daraus neue Buchprojekte planen zu können.

Mit Azure Cognitive Search und Azure Analysis Services kann das Unternehmen das nun wesentlich schneller erledigen: Das neue System wertet riesige Datensätze aus – fast drei Milliarden Datenzeilen mit 55 Gigabyte Speicherplatz – und gleicht diese Daten mit Verkaufszahlen über Standorte und Tochtergesellschaften hinweg ab. Statt Daten zu sammeln und aufzubereiten, können die Mitarbeitenden nun mit diesen Daten ihr Programm vorausschauend planen.

Die Kundenreferenz von Penguin Random House gibt es hier.

Reuters Recommendations: Weil nichts älter ist als die Nachricht von gestern

Reuters gilt nicht zuletzt aufgrund seiner mehr als 160-jährigen Historie als eine der renommiertesten Nachrichtenagenturen der Welt. Aber der gute Ruf allein reicht noch nicht für die Zukunftsplanung, er muss auch durch exzellenten Service ergänzt werden. Deshalb nutzt die Londoner Nachrichtenagentur Azure Machine Learning für die Entwicklung eines Video-Empfehlungssystems, das Nachrichtenartikel mit Videos auf der Website von Reuters abgleicht. Der Bestand an Videos wächst bei Reuters jeden Tag so stark an, dass er manuell nicht zu bewältigen ist. So blieben täglich Hunderte von Videos ungesichtet und konnten auch nicht von Medienunternehmen weiterverwertet werden. Über den automatisierten Abgleich hat Reuters diese Möglichkeiten nun deutlich verbessert und damit gleichzeitig neue Umsatzmöglichkeiten für seine Videoinhalte geschaffen.

Die vollständige Kundenreferenz zu Reuters findet ihr hier

KI wird in der Medienbranche nicht mehr weggehen – das zeigt die Fülle an Einsatzszenarien und konkreten Anwendungsbeispielen unserer Kunden. Dennoch stehen wir hier immer noch am Beginn einer faszinierenden Entwicklung, deren Verlauf wir auch in Zukunft neugierig und aktiv begleiten werden.


Ein Beitrag von Holger Meinzer
Director Industry Relations Media & Telco