Microsoft erklärt: Was ist Data Mining? Definition & Funktionen

Was ist Data Mining

Was ist Data Mining? Wofür wird es eingesetzt und was ist der Unterschied zu Predictive Analytics? In diesem Artikel findest du eine einfache Definition und wichtige Infos rund um Data Mining.

Data Mining beschreibt den Prozess der Ermittlung aussagefähiger Informationen aus großen Datensätzen. Data Mining nutzt mathematische Analysen zur Aufdeckung von Mustern und Trends in Daten. Üblicherweise können diese Muster nicht durch das traditionelle Durchsuchen von Daten ermittelt werden, da die Beziehungen zu komplex sind oder zu viele Daten vorliegen.

Diese Muster und Trends können gesammelt und als Data Mining-Modell definiert werden. Mining-Modelle können auf spezifische Szenarien angewendet werden. Dazu zählen beispielsweise:

Vorhersagen: Schätzen von Verkäufen oder Vorhersagen von Server Ausfallzeiten

Risiko und Wahrscheinlichkeit: Auswählen der besten Kunden für gezielte Postsendungen oder das Zuweisen von Wahrscheinlichkeiten zu Diagnosen oder anderen Ergebnissen

Empfehlungen: Ermitteln der Produkte, die wahrscheinlich miteinander verbunden werden sowie Erstellen von Empfehlungen

Suchen nach Sequenzen: Analysieren der Kundenauswahl in einem Einkaufswagen und Vorhersagen der nächsten wahrscheinlichen Ereignisse

Gruppierung: Trennen von Kunden oder Ereignissen in Cluster verwandter Elemente, Analysieren und Vorhersagen von Affinitäten

Die Erstellung eines Miningmodells ist Teil eines größeren Prozesses, der sich von der Fragestellung im Hinblick auf die Daten und die Erstellung eines Modells zur Beantwortung dieser Fragen bis hin zur Implementierung des Modells in einer Arbeitsumgebung erstreckt.

Beim Data Mining werden auch neuronale Netze eingesetzt, die den Funktionen des menschlichen Gehirns ähneln und über viele Datendurchläufe bestehende Strukturen oder Muster erlernen.

Daher ist Data Mining eng verwandt mit maschinellem Lernen (auch Machine Learning genannt). Also mit Anwendungen und Methoden, bei denen Computerprogramme selbstständig neues Wissen erwerben. Während aber beim Data Mining der Fokus auf dem Finden neuer Muster liegt, die bereits in den bestehenden Daten vorliegen, geht es beim maschinellen Lernen darum, neue Berechnungsfunktionen aus vorhandenen Daten abzuleiten.

Thomas Frahler, Business Lead Internet of Things bei Microsoft Deutschland, erklärt im Video in Kürze, worum es bei Data Mining geht.

Was ist der Unterschied zwischen Data Mining und Predictive Analytics?

Die Begriffe Data Mining und Predictive Analytics werden häufig synonym gebraucht. Tatsächlich spielen Methoden und Werkzeuge des Data Mining eine wesentliche Rolle in Predictive-Analytics-Lösungen. Es geht aber noch über Data Mining hinaus und nutzt weitere Methoden wie Machine Learning, Elemente der Spieltheorie oder Simulationsverfahren. Predictive Analytics nutzt zudem Text-Mining, auf Algorithmen basierende Analyseverfahren, um aus nicht strukturierten Textdaten (Artikeln, Blogs, Tweets, Facebook-Posts etc.) Strukturen herauszufinden.

Data Mining, Predictive Analytics und Microsoft SQL Server

Microsoft SQL Server, ein relationales Datenbankmanagementsystem von Microsoft, ist seit der Veröffentlichung im Jahr 2000 führend bei Predictive Analytics und stellt in Analysis Services Data Mining bereit.

Die Kombination von Integration Services, Reporting Services und SQL Server Data Mining stellt eine integrierte Plattform für Predictive Analytics mit Datenbereinigung und -vorbereitung, Machine Learning und Berichterstellung bereit.

Indem die in Analysis Services enthaltenen Data Mining-Algorithmen auf Daten angewendet werden, können Trends vorhergesagt, Muster identifiziert, Regeln und Empfehlungen aufgestellt, die Abfolge von Ereignissen in komplexen Datasets analysiert und neue Einblicke gewonnen werden. Wie das praktisch aussieht zeigt dieses Beispiel von Vapiano.

Weitere Beiträge in der „Microsoft erklärt“-Reihe:

Microsoft erklärt: Was ist künstliche Intelligenz? Definition & Funktionen von KI

Microsoft erklärt: Was ist Machine Learning? Definition & Funktionen von ML

Microsoft erklärt: Was ist Deep Learning? Definition & Funktionen von DL

Microsoft erklärt: Was ist Cloud Computing? Definition & Funktionen

*Beitragsbild: Pietro Jeng on Unsplash

 


Ein Beitrag von Johanna Ronsdorf
Trainee Business Communications AI & Innovation / Data Applications & Infrastructure

Foto von Johanna Ronsdorf, Trainee Business Communications AI & Innovation / Data Applications & Infrastructure

 

Tags: , , ,

Weitere Infos zu diesem Thema