Seit kurzem ist DALL·E 2 aus der geschlossenen in eine offene Beta-Phase getreten und damit für alle zugänglich, die mit der künstlichen Intelligenz von OpenAI individuell gefertigte Bilder erstellen möchten. Microsoft ist seit 2019 Partner der Non-Profit-Organisation OpenAI, die sich mit der Erforschung und dem Einsatz von künstlicher Intelligenz (KI) beschäftigt. Auf der Ignite 2022 hat Microsoft angekündigt, DALL·E 2 in seinen Azure OpenAI Service zu integrieren.
Das Internet ist seit wenigen Wochen voll mit unwirklich erscheinenden und hyperrealen Bildern, die aussehen, „als würden die Menschen plötzlich ihre kühnsten Gedanken und Träume“ ausdrücken können, wie es ein Tester beschreibt. All diese Bilder haben eines gemeinsam: Sie wurden von einer künstlichen Intelligenz gestaltet – auf der Basis menschlichen Inputs.
Einer der KI-Bildgeneratoren, die das können, ist DALL∙E 2, ein von OpenAI entwickeltes System. DALL∙E 2 erstellt Bilder und Kunst auf der Grundlage von Beschreibungen, die Menschen in alltäglicher Sprache über eine einfache Kommandozeile eingeben – etwa: „Ein gelbes Fahrrad lehnt an einem Baum auf einem Gemälde im Stil von van Gogh“. Trainiert wurde DALL∙E 2 auf einem Azure-Supercomputer, den Microsoft exklusiv für OpenAI entworfen hat.
Natürliche Sprache in einzigartige Bilder verwandeln
Microsoft hat auf der Ignite, seiner größten Tech-Konferenz des Jahres, bekanntgegeben, dass DALL∙E 2 auf Einladung künftig auch im Azure OpenAI Service verfügbar sein wird. Damit können ausgewählte Azure-Kunden individuelle Bilder aus Text oder aus Bildern generieren, die sie in den Bildgenerator hochgeladen haben. Jedes von DALL∙E 2 erstellte Bild ist ein Unikat, da die KI niemals zwei identische Bilder aus einer Eingabe erzeugt.
Mit der Integration von DALL∙E 2 erweitert Microsoft die Bandbreite an Einsatzszenarien für Azure OpenAI, ausgestattet mit den Sicherheits-, Compliance- und KI-Leitplanken von Azure: Nutzer*innen können über den Service textliche Inhalte, Bilder und Code erstellen, um ihre Ideen zum Leben zu erwecken – und das alles etwa durch die Eingabe von einfachem Text.
Wenn DALL∙E 2 persönlich wird
Erste Beispiele für den Einsatz des KI-Bildgenerators auf Azure gibt es bereits: So möchte der Kölner Privatsender RTL Deutschland künftig DALL∙E 2 im Azure OpenAI Service nutzen, um den Kund*innen seines Streaming-Dienstes RTL+ individualisierte Vorschaubilder auf Basis ihrer Interessen zu zeigen. RTL+ bietet On-Demand-Zugang zu Millionen von Videos, Musikalben, Podcasts, Hörbüchern und E-Magazinen. Über die Bilder möchte der Streaming-Dienst die Aufmerksamkeit der Konsument*innen wecken, die sich oft anhand von visuellen Hinweisen für einen Titel entscheiden. Die möglichst individuelle Gestaltung dieser Bilder spielt daher für RTL eine zentrale Rolle. So könnte es zum Beispiel demnächst schon möglich sein, mit DALL∙E 2 einen Liebesfilm über eine Sportreporterin und eine Profifußballerin für ausgewiesene Sportfans anders zu bebildern als für Liebhaber*innen romantischer Komödien.
Mehr zur Ignite-Ankündigung zu DALL∙E 2 und den Einsatz-Möglichkeiten gibt es hier im Blogbeitrag meines Kollegen John Roach.
Funktionen für einen verantwortungsvollen Umgang mit DALL∙E 2
DALL∙E 2 in Azure OpenAI entspricht nicht in jeder Hinsicht der frei verfügbaren Beta-Version: OpenAI hat dafür sexuelle und gewaltverherrlichende Inhalte aus den Trainingsdaten entfernt. Zudem setzt das Azure AI-Team einen Filter bei der Eingabe ein, der die Einhaltung von inhaltlichen Richtlinien überprüft. Aus dem Output wiederum entfernt das System künstlich erzeugte Bilder, die nicht jugendfreie, gewaltverherrlichende oder auf andere Art unangemessene Inhalte enthalten. Diese Maßnahmen tragen dazu bei, einen verantwortungsvollen Einsatz von DALL∙E 2 auf der Azure-Plattform zu ermöglichen.
Mehr über die weiteren Ankündigungen zur Microsoft Ignite 2022 gibt es in der Pressemitteilung.
Ein Beitrag von Bosse Kubach
Communications Manager Innovation