„Was ist das?“ Azure AI beschreibt Bilder jetzt genauso gut wie ein Mensch

Drei Getreidehalme werden von der Sonne angestrahlt

Bildbeschreibungen sind wichtig, damit Bilder auch für Menschen mit Sehbehinderung zugänglich sind. Azure AI erzeugt diese Beschreibungen selbstständig und oft sogar detaillierter, als ein Mensch das könnte.

„Ein Bild sagt mehr als 1.000 Worte“, lautet ein bekanntes Sprichwort. Für Menschen mit Sehbehinderungen gilt genau das Gegenteil: Worte machen das Bild überhaupt erst erkennbar. Für Bilder im Internet oder in PowerPoint-Präsentationen gibt es daher die sinnvolle Möglichkeit, über sogenannte Alt- und Title-Texte Informationen zum Inhalt von Bildern in Worten auszudrücken und damit Menschen einzubeziehen, die Bilder nicht visuell erfassen können.

Microsoft Produkte und Services sollen allen Menschen zugänglich sein. Unsere Forscher*innen haben daher ein neues System mit künstlicher Intelligenz (KI) entwickelt, das automatisch Beschreibungen für Bilder erzeugt. Und nicht nur das: Sie sind in vielen Fällen sogar genauer als ein von Menschen formulierter Text.

Integration in bestehende Microsoft Dienste und Seeing AI

Das Feature steht über die Azure Cognitives Services zur Verfügung, die Teil der KI-Plattform von Azure sind. Es wird noch im Laufe dieses Jahres in Word und Outlook (Windows und OSX) sowie für PowerPoint (Windows, OSX und Web) integriert.

Die verbesserte Bildbeschreibungsfunktion kommt zukünftig auch in Microsofts Kamera-App Seeing AI zum Einsatz. Dort wird die Funktion verwendet, um den Nutzer*innen der Apps Fotos zu beschreiben.

Mehr über die Herausforderungen bei der Entwicklung und weitere Einblicke dazu im Blogbeitrag meines Kollegen John Roach.

Weitere lesenswerte Beiträge


Ein Beitrag von Pina Meisel
Communications Manager AI & Innovation

Pina Meisel als Portrait-Bild

Tags: , , ,

Weitere Infos zu diesem Thema

25. Mai 2023
Business Campus Digital: Neue Microsoft-Lernpfade zu Hybrid Work und KI im Mittelstand

Mit einem neuen Lernangebot rund um Hybrid Work und künstliche Intelligenz unterstützt Microsoft den Aufbau neuer Kompetenzen für eine moderne Arbeitswelt. Das Angebot ist Teil des Business Campus Digital und steht seit dem 1. März 2023 Unternehmen zur Verfügung. Ab sofort ist es nun auch kostenfrei für Einzelnutzer*innen zugänglich.

23. Mai 2023
Microsoft Build 2023: Intelligente Tools für die Zukunft der Software-Entwicklung

Der Einsatz künstlicher Intelligenz (KI) steht im Mittelpunkt der diesjährigen Microsoft Build. Die Developer-Konferenz umfasst neben Keynotes, unter anderem von Microsoft-CEO Satya Nadella und CTO Kevin Scott, auch 250 Breakout-Sessions, Labs und Demos. Daneben bietet die deutsche Lokalausgabe am 22. Juni Interessierten die Möglichkeit, live vor Ort im Münchner „The Hive“ – Microsofts intelligentem Raum für hybride Events – in den Austausch zu gehen.