Historische versus Monte-Carlo Simulation

Nein – das ist kein Duell. Aber den Vergleich zwischen beiden Ansätzen möchten wir nicht scheuen. Und auch zugeben, dass die historische Simulation in vielen Fällen ausreichend und einfach in Excel umzusetzen ist. 

Gehen wir direkt auf die historische Simulation über. Diese bezieht ihre Daten nicht über mathematische Funktionen (darauf gehen wir gleich noch eingehender ein), sondern wie der Name schon sagt, über die tatsächlichen, in der Vergangenheit manifestierten Vorkommnisse. Unserer Tradition folgend, wollen wir auch hier nicht auf ein Beispiel verzichten. Um dem Ganzen eine gewisse Würze und Übersichtlichkeit zu verleihen, wollen wir es auf ein ganz einfaches Beispiel beschränken.

 

Stellen wir uns vor, dass wir mit Strom betriebene Wecker produzieren (ja, diese einfachen Geräte gibt es immer noch) und uns im Rahmen der Qualitätssicherung drei defekte Geräte zurückgeschickt wurden. Eines wurde nach einem halben Betriebsjahr, das andere nach drei und das letzte nach acht Betriebsjahren defekt. Es sei unterstellt, dass alle drei Wecker vergleichbaren Bedingungen (hinsichtlich Handhabung, Produktionsdatum, Inbetriebsetzung, Stromversorgung, Schutzvorrichtungen im Gebäuden, äusserlichen Wetterbedingungen) ausgesetzt waren und daher die Defekte sich glaubhaft nur aufgrund der Produktionsbedingungen erklären lassen. Der zuständige Produktionsmanager möchte nun wissen, ob er davon ausgehen muss, dass bei allen Weckern in einem Drittel der Fälle diese vor Ablauf der Gewährleistungspflicht – nach zwei Jahren – ausfallen werden.


Nun zugegebenermassen ist das Ganze sehr überspitzt, da nach acht Jahren genügend Rückmeldungen eingegangen sein sollten, um darüber Auskunft zu geben. Aber stellen Sie sich vor, dass es sich um eine spezielle Vorrichtung handelt, welche nur in geringer Stückzahl produziert und verkauft wird. Schon sähe das Ganze realistischer aus. Aber zurück zu unseren Weckern und des Pudels Kern: eine historische Simulation setzt als erstes voraus, dass Daten vorhanden sein müssen. In unserem Fall müsste erst einmal gewartet werden, bis er der erste Datensatz eingeht. Gewiss, die Praxis kann sich nicht daran orientieren. Daher behelfen sich Unternehmen mit entsprechenden Datenzukäufen bei anderen Unternehmen, um den Datenbestand aufzufüllen und somit rasch am Markt reagieren zu können.


Liegen die Daten nun vor, kann in Excel mit der einfachen Formel «=Zufallsbereich(1:#Anzahl Daten)» über n Zeilen eine Simulation angestossen werden und dann über die Formel «=Index(«Ursprungsdaten», errechnete Zufallszahl)» das Ergebnis gelesen und in ein Histogramm überführt werden. Dazu kann direkt auf Excel zurückgegriffen oder mit einem kleinen Trick auf die mit MC FLO mitgelieferte Datei «MC_FLO_FIRST.xlsx» abgestützt werden.

Historische Simulation

Bei einer Datenausprägung – wie hier die Ausfallrate einer Maschine – ist der historische Simulationsansatz von keinem Nutzen. Egal ob Sie nun 1'000 oder 1 Mio. Iterationen durchführen. Im Mittel sollte die Ausfallrate in unserem Fall bei 1/3 unter zwei Jahren liegen. Einen Mehrwert erhalten Sie dann, wenn Sie mehrere Maschinen mit unterschiedlichen Ausfallraten je Maschine kombinieren. Durch die Kombination der möglichen Ausfallraten können Sie dann etwa die Kosten bei Gewährleistungsfällen durch den historischen Simulationsansatz bestimmen ohne auf mathematische Formeln zurückgreifen zu müssen. Dabei ist zu berücksichtigen, dass bei der historischen Simulation nur auf bereits realisierte Daten abgestützt werden kann. Oder anders ausgedrückt: die historische Simulation geht davon aus, dass die Zukunft vollumfänglich durch die Daten der Vergangenheit beschrieben werden kann.

 

Leider kann nicht mit Verlass gesagt werden, welcher Datenbestand als ausreichend erachtet werden kann. Ein hohe Anzahl Daten stellt sicher, dass auch Ausreisser in die Daten Eingang finden und der sogenannte Standardfehler reduziert wird. Mit dem Rückgriff auf einen grossen Fundus an Daten besteht indes das Risiko, dass vielleicht auch auf zu veraltete Daten zurückgegriffen wird, welche für die Zukunft keine Relevanz mehr haben. Auch kann nicht ausgeschlossen werden, dass falsche Daten, etwa aufgrund einer unsachgemässen Messung, in den Datenbestand eingeflossen sind.

 

Der grosse Vorteil der historischen Simulation ist jedoch, dass keine Verteilungsannahmen getroffen werden müssen und die Berechnung einfach und schnell vonstattengeht. Die Einfachheit und die geringe Methodenkenntnis, welche eine historische Simulation voraussetzen, haben dessen Erfolg begründet.

 

Konzeptionell fährt die Monte-Carlo Simulationen einen anderen Ansatz. Vielmehr ist die Frage relevant, wie die Zukunft sich verhalten kann (wenngleich auch Monte-Carlo Simulationen nicht die Zukunft voraussagen können). Daher ist der Rückgriff auf historische Daten nur als Behelfsansatz zu interpretieren. Das ist insbesondere bei sozioökonomischen Fragestellungen der Fall. Historische Daten können – und werden auch in der Praxis – dazu herangezogen, eine möglichst geeignete Verteilungsfunktion zu bestimmen. Und hier kommt Excel mit der Möglichkeit, mathematische Funktionen ohne grosses Zutun verständlich zu machen, ins Spiel. Aus einer Vielzahl von Verteilungsfunktionen kann eine geeignete durch die in MC FLO implementierte Schätzfunktion bestimmt werden. Hierbei reicht oftmals bereits ein Datensatz von ca. 100-200 Beobachtungen aus. Zur Hilfe kommt ein berühmter Satz aus der Statistik (Gliwenko-Cantelli): Die (durch Simulation) gewonnene empirische Verteilungsfunktion nähert sich an die tatsächliche Verteilungsfunktion. Oder anders ausgedrückt: Wenn Sie mit etwa 200 Datensätzen eine Gleichverteilung erkennen können, dann wird das Bild der Verteilung auch mit 1 Mio. Datensätzen nicht anders aussehen. Wenn Sie nun wissen, dass die Daten einer Gleichverteilung folgen können, warum sollten Sie dann die historische Simulation noch heranziehen?


Und auf unser Beispiel mit den Weckern umgemünzt? Stellen wir uns vor, dass die durchschnittliche Lebensdauer bei 5 Jahren oder 1'825 Tagen liegt. Wie viele Geräte werden innerhalb der Gewährleistungsfrist von 2 Jahre ausfallen? Wenn angenommen wird, dass die Geräte einer Exponentialverteilung folgen, dann kann dies mathematisch sehr einfach beantwortet werden. Wir ziehen die Simulation vor. Anbei das Resultat, mit dem magischen Strich von MC FLO herausgeschält. Nach ca. 730 Tagen werden 33% der Geräte ausgefallen sein (der Wert von x mit 731 Tagen korrespondiert mit dem Wert der kumulierten Verteilungsfunktion beim Wert von 0.33).

Monte Carlo Simulation

Die Monte-Carlo Simulation berechnet somit mehrmals Werte anhand einer vorgegebenen Verteilungsfunktion. Die Ergebnisse werden sich daher von den tatsächlichen beobachteten Werten unterscheiden. Die Vorteile liegen auf der Hand. So können Sie auch komplizierte Modelle mit mehreren Dutzenden Variablen schnell und sicher in Excel umsetzen, ohne auf umfangreiches Datenmaterial zurückgreifen zu müssen. Die mathematischen Funktionen – korrekt in Excel umgesetzt – bürgen zudem dafür, dass keine «Datenfehler» in den Berechnungen Eingang finden. Der Preis dafür ist, dass das Verständnis über ein «Modell» mehr in den Vordergrund rückt. Beiden Simulationsverfahren ist jedoch eines gemeinsam, denn es gilt der Grundsatz: garbage in, garbage out. Wohl bekomms!

Kommentar schreiben

Kommentare: 0