Blick in die Zukunft per Data Mining

Blick in die Zukunft per Data Mining

Artikel erschienen in IT Magazine 2001/13

Voraussetzungen für den Erfolg

Die Hauptvoraussetzung für erfolgreiches Data Mining ist eine genügend grosse Datenbasis. Je mehr relevante Datenfelder - in Statistikterminologie Variablen genannt - der einzelne Datensatz hat, desto eher können unbekannte Muster entdeckt werden. Und je mehr Datensätze vorliegen, desto geringer fallen Schätzfehler und Varianten aus.



Ebenso wichtig ist die Qualität der Daten. Hier hapert es bei vielen Quellen, die ja ursprünglich nicht für Data-Mining-Zwecke angelegt wurden: Eingekaufte demografische Daten sind oft unvollständig, Webkunden füllen das Anmeldeformular nur teilweise aus, Abrechnungsdaten stammen aus verschiedenen ERP-Systemen mit unterschiedlichen Feldern, vorhandene Angaben sind nicht aktuell. Intelligente Algorithmen können zwar nicht vorhandene Angaben interpolieren, was das Ergebnis jedoch verfälscht. Werden unvollständige Datensätze ganz weggelassen, verkleinert sich die Datenbasis - ein Dilemma. Die Selektion der Daten zu Beginn des Data-Mining-Prozesses ist ein ganz entscheidender Schritt.



Die riesigen Datenmengen - ein typisches Data Warehouse geht in den Terabyte-Bereich - setzen eine leistungsfähige IT-Infrastruktur mit viel Prozessorleistung und Storage-Kapazität voraus. Technologien wie Multiprozessor-Server und Clustering kommen Data-Mining-Anwendungen sehr entgegen. Auf der anderen Seite bringt Data Mining dem Unternehmen nur dann wirklich etwas, wenn sich die Techniken nicht nur von Statistik-Genies, sondern auch von Marketingexperten und Executives einsetzen lassen. Erst die Kombination von hochskalierbarer Hardware und Datenbanksoftware mit anwenderorientierten Tools und anschaulicher Visualisierung macht Data Mining auf breiter Ebene überhaupt möglich.



In spezialisierter Form gibt es Data Mining seit Jahrzehnten. Energielieferanten zum Beispiel nutzten statistische Techniken, um mit überraschender Genauigkeit den Ausfall von Generatoren vorauszusagen. In den neunziger Jahren setzten sich Data-Mining-Techniken vermehrt in der Geschäftswelt durch: Aufgrund der Verhaltensmuster finden Versicherungen, Kreditkartenunternehmen und Krankenkassen heraus, ob Kunden bei der Anmeldung lügen oder geneigt sind, sich in illegale Aktivitäten zu stürzen.




Reporting, OLAP und Data Mining

Im Umfeld von Data Mining fallen oft auch Begriffe wie OLAP, Reporting, Data Visualization und Analytical Applications. Dabei handelt es sich um unterschiedliche Techniken, die jedoch ineinander greifen und sich teilweise gegenseitig bedingen. Der generelle Unterschied: Während Techniken wie OLAP und Reporting ausschliesslich Resultate aus der Vergangenheit liefern, ermöglicht Data Mining einen gewissen Blick in die Zukunft. Analytische Anwendungen und Präsentationstechniken wie Reporting und Visualisierung dienen der Vermittlung und Interpretation der erlangten Ergebnisse.




Neuen Kommentar erfassen

Anti-Spam-Frage Aus welcher Stadt stammten die Bremer Stadtmusikanten?
Antwort
Name
E-Mail
GOLD SPONSOREN
SPONSOREN & PARTNER