Zum Hauptinhalt springen

Mit allen Sinnen: Neue Azure Cognitive Services

Azure Cognitive Services sind kognitive APIs für die Entwicklung intelligenter Apps. Die Schnittstellen versetzen Maschinen in die Lage, zu sehen, zu hören und – wenigstens ein bisschen – auch zu fühlen, also ihre Umgebung kognitiv zu erfassen und in maschinenlesbare Daten umzuwandeln. Aktuell gibt es mehr als 30 dieser Dienste in den Bereichen Entscheidungsfindung, Spracherkennung und -eingabe sowie Bildanalyse und Websuche. Jetzt hat Microsoft vier neue Dienste vorgestellt. Eine Übersicht.

MarktforscherInnen von IDC zufolge werden bis 2022 drei von vier Unternehmen Lösungen auf Basis von künstlicher Intelligenz (AI) einsetzen. Sie erhoffen sich von AI vor allem Unterstützung bei der Verbesserung der Betriebseffizienz und ihrer Kundenservices. Unsere Vision ist es, Unternehmen jeder Größe und aller Branchen in die Lage zu versetzen, AI einfach und umfassend zu nutzen. Um dies zu unterstützen, ergänzen wir die mehr als 30 vorhandenen Cognitive Services um die folgenden:

Neue Text- und Sprachfunktionen für Azure AI

Die Funktion Text Analytics for Health ermöglicht es ForscherInnen und Unternehmen aus dem Gesundheitswesen, unstrukturierte medizinische Daten für fundierte Erkenntnisse zu nutzen. Microsoft hat als Reaktion auf die Corona-Krise und in Zusammenarbeit mit dem Allen Institute of AI eine kostenlose Sammlung von mehr als 47.000 wissenschaftlichen Dokumenten erstellt, das COVID-19-Open-Research-Dataset. Zudem bietet Microsoft für die kognitive Suche eine neu entwickelte COVID-19-Suchmaschine, die ForscherInnen dabei unterstützt, neue Erkenntnisse aus der Erforschung und Bekämpfung des Corona-Virus zu gewinnen.

Durch die Fortschritte, die wir bei der Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) gemacht haben, können wir eine neue Opinion-Mining-Funktion für die Textanalyse anbieten. Sie erkennt Stimmungen in Texten und ermöglicht so zum Beispiel genauere Analysen von Kundenstimmen in Social Media.

Der ab sofort verfügbare Form Recognizer ist in der Lage, unstrukturierte Daten zu erkennen, die zum Beispiel in Formularen mit Tabellen, Objekten und anderen Elementen enthalten sind. Normalerweise brauchen Unternehmen für diese Art von Daten eine manuelle Klassifizierung.

Allgemein verfügbar sind ab sofort auch die Custom Commands. Damit können EntwicklerInnen kundenspezifische Sprachfunktionen in Anwendungen integrieren, die gesprochene Sprache verarbeiten („Speech to Text“) und verstehen („Language Understanding“). Über Voice Response und Text to Speech können die Anwendungen außerdem auch mit ihren NutzerInnen kommunizieren – und das mit wenig Programmieraufwand („Low Code“).

Neural Text to Speech erweitert die sprachlichen Fähigkeiten der Cognitive Services um 15 neue natürlich klingende Stimmen, die auf modernen Modellen für die neuronale Sprachsynthese basieren: Salma auf Arabisch (Ägypten), Zariyah auf Arabisch (Saudi-Arabien), Alba auf Katalanisch (Spanien), Christel auf Dänisch (Dänemark), Neerja auf Englisch (Indien), Swara auf Hindi (Indien), Colette auf Niederländisch (Niederlande), Zofia auf Polnisch (Polen), Fernanda auf Portugiesisch (Portugal), Dariya auf Russisch (Russland), Hillevi auf Schwedisch (Schweden), Achara auf Thailändisch (Thailand), HiuGaai auf Chinesisch (kantonesisch, traditionell) und HsiaoYu auf Chinesisch (taiwanesischer Mandarin).

Ausführliche Informationen und erste Kundenerfahrungen mit den neuen Cognitive Services von Azure AI lesen Sie in dem Blog-Beitrag „Azure AI: Build mission-critical AI apps with new Cognitive Services capabilities“ von Eric Boyd, Corporate Vice President für Azure AI.

Weitere Informationen:

  • Blogpost zu Text Analytics for health (engl.)
  • Demo der COVID-19-Suchmaschine. Versucht es zum Beispiel mal mit der Suche nach “Ibuprofen”
  • Demo des Form Recognizer
  • Blogpost zu den Custom Commands (engl.)
  • Demo der Custom Commands