Als Predictive Analytics wird eine Sammlung statistischer Methoden bezeichnet, die vor allem im Business-Bereich eingesetzt werden. Diese Methoden dienen nicht nur der Überprüfung von Hypothesen, sondern insbesondere der Vorhersage von Trends und Ereignissen.
Vorhersagen basierend auf Zusammenhängen
Predictive Analytics sind insbesondere im Finanz- und Geschäftsbereich relevant, aber auch im medizinischen und kriminologischen Bereich. Der Begriff „Vorhersage“ ist nicht streng auf die Zukunft bezogen. Eine Vorhersage kann auch in Bezug auf Daten aus der Vergangenheit erstellt werden, um die Güte des Modells zu testen.
Ein beliebtes Beispiel stammt aus dem Kreditbereich: Ein Kreditanwärter weist bestimmte Merkmale auf (Kontoschwankungen, Bildungshintergrund, Beruf u. a.), die möglicherweise auf seine Kreditwürdigkeit schließen lassen. Diese Merkmale weisen für gewöhnlich allerdings nicht absolut auf die Neigung zum Default (Zahlungsverzug) hin. Dies erschwert das Treffen einer Entscheidung. Predictive Analytics werden dazu genutzt, signifikante Zusammenhänge zwischen den Eigenschaften eines Kreditanwärters und seiner Neigung zum Default herauszufinden. Neue Kreditanwärter können diese Eigenschaften ebenfalls aufweisen. Das bereits erstellte Modell dient dann als Grundlage für die Vorhersage der Default-Wahrscheinlichkeit des Anwärters.
Auch im Bereich der Web Analytics spielen Predictive Analytics eine Rolle. Basierend auf bereits vorhandenen Daten können Angebotseigenschaften mit Produktkäufen, Subscriptions, Klickzahlen oder KPIs assoziiert werden. Basierend auf derartigen Modellen können für verschiedene Veränderungen Zahlen vorhergesagt werden.
Methoden aus der Statistik, dem Data Mining und Machine Learning
Um signifikante Zusammenhänge zwecks Vorhersage herauszufinden, werden Methoden aus dem weiten Feld der Statistik eingesetzt. Dabei kommen neben allgemeiner Statistik insbesondere Methoden aus dem Data Mining und Machine Learning zum Einsatz. Die beiden letztgenannten Felder sind in Bezug auf ihre Methoden nahezu nicht von der Statistik zu trennen, unterscheiden sich aber in Bezug auf ihre Zielsetzung. Das Data Mining dient der Identifikation von Strukturen in unstrukturierten Daten, während das Machine Learning explizit der Vorhersage dient.
Mit modernen Technologien wie Machine Learning werden die Vorhersagen immer detaillierter und zuverlässiger. Außerdem ermöglicht maschinelles Lernen einen hohen Grad an Automation, der dazu dient, dass Prognosen schon innerhalb von kurzen Zeiträumen angefertigt werden können.
Die gerade in der Statistik prävalente Regression ist das am häufigsten eingesetzte Mittel der Predictive Analytics. Selbst das oben genannte Beispiel kann je nach Situation allerdings die Möglichkeiten der ansonsten vielseitig einsetzbaren Regression überschreiten. Decision Trees, neuronale Netze, zeitabhängige Verfahren und andere in ihrer Beliebtheit steigende Methoden erlauben eine feinere Modellierung des Problems.