„Was ist das?“ Azure AI beschreibt Bilder jetzt genauso gut wie ein Mensch

Drei Getreidehalme werden von der Sonne angestrahlt

Bildbeschreibungen sind wichtig, damit Bilder auch für Menschen mit Sehbehinderung zugänglich sind. Azure AI erzeugt diese Beschreibungen selbstständig und oft sogar detaillierter, als ein Mensch das könnte.

„Ein Bild sagt mehr als 1.000 Worte“, lautet ein bekanntes Sprichwort. Für Menschen mit Sehbehinderungen gilt genau das Gegenteil: Worte machen das Bild überhaupt erst erkennbar. Für Bilder im Internet oder in PowerPoint-Präsentationen gibt es daher die sinnvolle Möglichkeit, über sogenannte Alt- und Title-Texte Informationen zum Inhalt von Bildern in Worten auszudrücken und damit Menschen einzubeziehen, die Bilder nicht visuell erfassen können.

Microsoft Produkte und Services sollen allen Menschen zugänglich sein. Unsere Forscher*innen haben daher ein neues System mit künstlicher Intelligenz (KI) entwickelt, das automatisch Beschreibungen für Bilder erzeugt. Und nicht nur das: Sie sind in vielen Fällen sogar genauer als ein von Menschen formulierter Text.

Integration in bestehende Microsoft Dienste und Seeing AI

Das Feature steht über die Azure Cognitives Services zur Verfügung, die Teil der KI-Plattform von Azure sind. Es wird noch im Laufe dieses Jahres in Word und Outlook (Windows und OSX) sowie für PowerPoint (Windows, OSX und Web) integriert.

Die verbesserte Bildbeschreibungsfunktion kommt zukünftig auch in Microsofts Kamera-App Seeing AI zum Einsatz. Dort wird die Funktion verwendet, um den Nutzer*innen der Apps Fotos zu beschreiben.

Mehr über die Herausforderungen bei der Entwicklung und weitere Einblicke dazu im Blogbeitrag meines Kollegen John Roach.

Weitere lesenswerte Beiträge


Ein Beitrag von Pina Meisel
Communications Manager AI & Innovation

Pina Meisel als Portrait-Bild

Tags: , , ,

Weitere Infos zu diesem Thema

25. Januar 2022
Edith Wittmann übernimmt Global Partner Solutions Organisation (GPS) bei Microsoft Deutschland

Edith Wittmann (43) wird die neue Leitung der Global Partner Solutions Organisation (GPS) bei Microsoft Deutschland. Edith Wittmann ist in dieser Rolle ab 1. Februar 2022 für das Microsoft-Partnernetzwerk in Deutschland mit mehr als 30.000 Partnern verantwortlich. Als Mitglied der Geschäftsleitung berichtet sie in ihrer neuen Funktion an die Vorsitzende der Geschäftsleitung, Marianne Janik.

20. Januar 2022
Developer Stories: Scott Hanselman, Lehrer und Motivator für C# und .NET

Er entspricht so gar nicht dem Klischee des Computer-Nerds: Scott Hanselman studierte Software-Engineering und schrieb selbstverständlich jede Menge Code. Doch wer ihm zuhört, merkt schnell: Eigentlich ist er vielmehr ein Lehrer, was auch früher sein Beruf war. Warum Scott seine Hauptaufgabe darin sieht, Begeisterung zu vermitteln und andere beim Programmieren erfolgreich zu machen, berichtet er in unserer Developer Stories-Reihe.

20. Januar 2022
Offene Lernbüros statt starrer Stundenpläne

Für die erste Folge unserer neuen Blogserie „Zukunft Bildung: Aus der Praxis für die Praxis“ haben wir mit Jan-Martin Klinge darüber gesprochen, warum ein „Back to Normal“ nach dem Lockdown für seine Schule keine Option war.