Kategorie: Daten

Data Mining

Die Metapher Data-Mining beschreibt den Analyseschritt innerhalb des Prozesses der Wissensentdeckung in Datenbanken (englisch: Knowledge Discovery in Databases, KDD). Das Bild des Daten-Bergbaus ist insofern verzerrt, als Intention nicht die Gewinnung von Daten, sondern von Informationen und Wissen ist. Mittels mathematischer und statistischer Verfahren sollen neue Querverbindungen in verfügbaren Datenbeständen erkannt werden. Ziel ist die Identifikation von Trends, Mustern und verborgenen Zusammenhängen.

Möglichkeiten und Herangehensweise

Die Chancen für Data-Mining liegen in der heutigen Informationsflut: Transaktionen, Prozesse und Sensoren generieren schier unvorstellbare Mengen an Daten in Unternehmen. Big Data steht als Schlagwort für Bestrebungen, diesen Datenschatz zu monetarisieren. Hier setzen die Methoden des Data-Minings an.

Zu den frühen Einsatzszenarien zählt die Warenkorbanalyse: Bestimmte Kombinationen von Waren eines Supermarktes, etwa Windeln und Bier, werden besonders häufig gemeinsam gekauft. Daraus sind Schlüsse für die optimale Platzierung dieser Produkte im Markt ableitbar. Ein Erfolgsbeispiel für die Anwendung von Data-Mining ist die Identifikation von Kreditkartenbetrug. Hierzu werden die Transaktionsdaten auf Auffälligkeiten untersucht. Neben Marketing und Finanzbranche ist das Internet ein wichtiges Einsatzfeld.

Abgesehen vom regelbasierten Auffinden von Zusammenhängen mittels Assoziationsanalyse existieren weitere Ansätze des Data-Minings. Sie lassen sich zwei Gruppen von Aufgabenstellungen zuordnen:
– Beobachtungsprobleme: Clusteranalyse und Ausreißererkennung
– Prognoseprobleme: Klassifikation, Regressionsanalyse

Haben Sie Fragen? Fragen Sie uns! Hier klicken

Risiken und Probleme

Naturgemäß hängt die Brauchbarkeit von Ergebnissen des Data-Minings von der Qualität der Ausgangsdaten ab. Außerdem sind die statistischen Verfahren mit der erforderlichen Sorgfalt anzuwenden. Sie haben Grenzen, und es gilt, die Repräsentativität von Resultaten zu hinterfragen. Schlussfolgerungen bedürfen der Interpretation.

Speziell im europäischen Raum sind rechtliche Aspekte des Datenschutzes zu beachten. Erwähnenswert ist insbesondere das Gebot der Zweckbindung: Die Erhebung und Nutzung personenbezogener Daten hat stets für einen konkreten, klar umrissenen Anwendungsfall zu erfolgen. Für anderweitige Verwendung bedarf es einer gesonderten Einwilligung. Bei Anonymisierung und Pseudonymisierung darf die Identifizierung Einzelner nicht möglich sein.

Weitere Informationen und Links
– Data-Mining – Anwendungsfelder und -beispiele
– Data-Mining und Datenschutz
– „Risiko – Relvanz“ , Prof. Dr. Gunter Dueck
– „Data Mining for Terrorists“, Bruce Schneier