Azure Databricks: Intelligente Analysen auf der Basis von Apache Spark

Azure Databricks: Intelligente Analysen auf der Basis von Apache Spark

Die Fähigkeiten von Maschinen mit künstlicher Intelligenz, gepaart mit der nahezu unbegrenzt verfügbaren Rechenpower aus der Cloud: Das eröffnet uns heute die Möglichkeit, aus der exponentiell wachsenden Menge an Daten bahnbrechende Erkenntnisse zu gewinnen, die wir für die großen Innovationen unserer Zeit brauchen. Wir verfolgen hier das Ziel, Unternehmen und Organisationen zu befähigen, diese Möglichkeiten für sich gewinnbringend zu nutzen.

Mit der allgemeinen Verfügbarkeit von Azure Databricks bietet Microsoft nun eine schnelle, einfach zu nutzende und kollaborative Analyseplattform auf Basis von Apache Spark und optimiert für Microsoft Azure an.

Schnelle, einfache und kollaborative Analyseplattform

In den vergangenen fünf Jahren hat sich Apache Spark zu einer der wichtigsten Open-Source-Plattformen für die Analyse großer Datenmengen über maschinelles Lernen und künstliche Intelligenz entwickelt. Azure Databricks wurde in enger Zusammenarbeit mit Databricks entwickelt, deren Gründer das Spark-Forschungsprojekt an der UC Berkeley initierten, damit unsere Kunden ihre Innovationen beschleunigen und ihre Prozesse für die Entwicklung von Big Data- und KI-Lösungen vereinfachen können. Dafür verantwortlich sind drei wichtige Eigenschaften

1. Die Produktivität bei der Entwicklung von Big Data-Anwendungen steigt deutlich. Die Databricks-Notizbücher unterstützen die Zusammenarbeit von Teams aus Datenspezialisten unter Verwendung gängiger Sprachen wie R, Python, Scala oder SQL. Sie helfen bei der Erstellung leistungsstarker Modelle für Machine Learning, indem sie alle verfügbaren Daten nutzen, nicht nur Beispieldatensätze. Die native Integration mit Azure-Services schließlich vereinfacht die Erstellung von Ende-zu-Ende-Lösungen.

2. Kunden können weltweit ihre Analyse-Lösungen ohne Einschränkungen skalieren, indem sie ihre großen Datenmengen in einem vollständig verwalteten, nativen Cloud-Service vorhalten, der sich automatisch und ohne größere Kosten an ihre Bedürfnisse anpasst. Azure Databricks ist nicht nur schneller als vanilla Spark, sondern vereinfacht auch den Aufbau von Batch- und Streaming-Data-Pipelines sowie den Einsatz von maschinellen Lernmodellen beliebiger Größe.
Kunden wie der deutsche Energieversorger E.ON beschleunigen so ihre Analyseprozesse und Innovationen: „Jeden Tag analysieren wir fast ein Terabyte an Windkraftanlagendaten, um unsere Datenmodelle zu optimieren“, erklärt Sam Julian, Produktmanager der Datendienste bei E.ON. „Früher brauchten wir dafür mehrere Stunden. Mit Azure Databricks dauert das nur noch ein paar Minuten. Damit gewinnen wir nicht nur Zeit, sondern auch eine ganze Reihe neuer Anwendungsmöglichkeiten.”

3. Sicherheit und Compliance: Azure Databricks schützt Kundendaten durch unternehmensweite Service Level Agreements (SLAs), vereinfachte Sicherheit sowie identitäts- und rollenbasierte Zugriffskontrollen mit der Integration von Azure Active Directory.

In dem Blogpost „Azure Databricks, industry-leading analytics platform powered by Apache Spark“ von Rohan Kumar, Corporate Vice President, Azure Data, und Ali Ghodsi, CEO von Databricks, finden Sie noch weitere ausführliche Informationen über die Vorteile von Azure Databricks und Microsoft Azure im Einsatz mit Big Data und künstlicher Intelligenz.

Weitere Informationen:


Ein Beitrag von Jürgen Wirtgen,
Data & AI Lead bei Microsoft Deutschland

Juergen Wirtgen - Data Platform Lead bei Microsoft Detuschland

Tags: , ,

Weitere Infos zu diesem Thema

25. Mai 2023
Business Campus Digital: Neue Microsoft-Lernpfade zu Hybrid Work und KI im Mittelstand

Mit einem neuen Lernangebot rund um Hybrid Work und künstliche Intelligenz unterstützt Microsoft den Aufbau neuer Kompetenzen für eine moderne Arbeitswelt. Das Angebot ist Teil des Business Campus Digital und steht seit dem 1. März 2023 Unternehmen zur Verfügung. Ab sofort ist es nun auch kostenfrei für Einzelnutzer*innen zugänglich.