Data Mining
Data Mining (engl.) – Datenanalyse (dt.) / Datenschürfen (dt.)
Theoretischer Ansatz
Unter Data Mining versteht man die Analyse und Auswertung von Daten mittels statistischer Verfahren und Techniken, die es erlauben aus sehr großen Datenmengen sichtbare oder verborgene Strukturen, Zusammenhänge, Muster und Trends heraus zu filtern.
Die Literatur setzt für aussagefähige Erkenntnisse durch Data Mining häufig große bis sehr große Datenmengen voraus, jedoch können auch bereits wenige Daten für den Analysten interessante Muster aufweisen.
Im Deutschen sind zwei Übersetzungen gebräuchlich:„Datenanalyse“ und „Datenschürfen“, wobei erstere, meiner Ansicht nach, stichhaltiger die Bedeutung des Terminus erläutert.
Wurden früher zur Analyse von Datenmengen speziell ausgebildete Statistiker herangezogen, setzt an dieser Stelle heutzutage das Data Mining an. Es ergänzt die statistischen Verfahren um neue Analysemethoden, die einen Großteil der Untersuchungsprozesse automatisieren und beschleunigen. (www.data-mining.deminingmining.htm)
Data Mining bezeichnet nicht nur ein bestimmtes Analyseverfahren, mit dem Unternehmen relevantes Wissen aus Datenbanken extrahieren können, sondern eine ganze Reihe von nützlichen Analyse- und Steuerungsinstrumenten, sowie Technologien die sich aus statistischen Modellen und Verfahren der künstlichen Intelligenz zusammensetzen.
Das 5 Phasen-Modell
Zur visuellen Veranschaulichung einer Datenanalyse, folgt an dieser Stelle das 5 Phasen-Modell:
-
Datenselektion (Auswahl geeigneter Datenmengen)
-
Datenvorverarbeitung (Skalierung der Daten)
-
Datentransformation (Umwandlung in adäquate Datenformate)
-
Data Mining (Suche nach Mustern)
-
Interpretation / Evaluation (Ergebnisinterpretation und Auswertung)
Quelle: www.wi.hs-wismar.de/~cleve/vorl/dm2160207807/fdm.pdf
Innerhalb dieser fünf Phasen des Data Mining werden Wissen und Informationen aus Rohdaten extrahiert. Zu erläutern ist in diesem Zusammenhang, dass Daten sobald sie mit einer Bedeutung gekoppelt sind als Informationen verstanden werden. Informationen in Verbindung mit der Fähigkeit diese zu nutzen, bezeichnet man als Wissen (www.wi.hs-wismar.de/~cleve/vorl/dm2160207807/fdm.pdf).
Im Anschluss an die Auswahl der zu untersuchenden Daten (Zieldaten), werden diese sinnvoll skaliert, um Vergleichbarkeit zu ermöglichen. Diese nun "bereinigten Daten" werden in adäquate Datenformate umgewandelt, z.B. durch Abgleichung der Codierungen. Erst dann ist das reine Data Mining möglich, wodurch die angesprochenen Muster heraus gefiltert werden können. Werden diese Muster interprtiert, erhält man das gewünschte Wissen.
Praktischer Ansatz
Aufgrund des sich wandelnden Marketingdenkens dahingehend, dass der Kunde und sein individueller Kundenwert immer mehr in das Aktionsfeld der Manager rücken, und aufgrund der technischen Entwicklung, verfügen Unternehmen heute über ausgereifte Datenbanken mit detaillierten Informationen über ihre Kunden und deren Interessen.
Waren den Unternehmen früher zum Beispiel lediglich die Adressen der Kunden bekannt, liegen ihnen mittlerweile geschlechterspezifische Informationen über Kaufgewohnheiten vor, welche wiederum verschiedene Altersgruppen berücksichtigen können. Dies haben Unternehmen unter anderem dem Einsatz von Payback-Karten durch Kunden zu verdanken.
Es sind jedoch bei Weitem nicht immer alle Kaufdaten relevant. Beschränken kann man sich beispielsweise auf kumulierte Höhen, das spezifische Sortimentskaufverhalten in Verbindung mit der Anzahl der gekauften Produkte oder der kundenspezifische Kaufrhythmus.
An dieser Stelle sei das amüsante Beispiel genannt, dass eine Analyse des Kaufverhaltens ergeben hat, dass derjenige der Windeln kauft auch sehr häufig Bier kauft, aber nicht umgekehrt (www.wi.hs-wismar.de/~cleve/vorl/dm2160207807/fdm.pdf).
Auf Grundlage der auf diese Art und Weise gewonnenen Daten, können im Anschluss daran Geschäftsstrategien gezielt auf potentielle Kunden ausgerichtet werden.
So kann Data Mining beispielsweise zur Prognose des lebenslangen Beitrages eines einzelnen Kunden für das Unternehmen (Customer-Lifetime-Value) beitragen. Dadurch werden Hinweise auf die Qualität des aktuellen Produktportfolios gegeben. Sinkt der durchschnittliche Customer-Lifetime-Value, so wurden gegebenenfalls nicht ausreichend Interessenten durch eine Kampagne angesprochen (www.data-mining.de/miningstufen.htm).
Risiko
Die Anwendung des Data Mining weist jedoch auch eine wesentliche, negative Eigenschaft auf:Der Kunde wird durch die Aufzeichnung seines Kaufverhaltens gläsern und berechenbar.
Aufgrund solcher Erkenntnisse werden einzelne Unternehmen sehr kritisch von Datenschützern beobachtet, welche überprüfen ob die Regelungen des Bundesdatenschutzgesetzes eingehalten werden.
Quellen:
www.digitaldistrict.de (Zugegriffen am 10.12.2007)
www.database-marketing.de (Zugegriffen am 10.12.2007)
www.wikipedia.de (Zugegriffen am 18.12.2007)
www.wi.hs-wismar.de/~cleve/vorl/dm2160207807/fdm.pdf (Zugegriffen am 18.12.2007)
www.data-mining.de (Zugegriffen am 18.12.2007)
- Bereich:
