Historische versus Monte-Carlo Simulation

Nein – das ist kein Duell. Aber den Vergleich zwischen beiden Ansätzen möchten wir nicht scheuen. Und auch zugeben, dass die historische Simulation in vielen Fällen ausreichend und einfach in Excel umzusetzen ist. 

Gehen wir direkt auf die historische Simulation über. Diese bezieht ihre Daten nicht über mathematische Funktionen (darauf gehen wir gleich noch eingehender ein), sondern wie der Name schon sagt, über die tatsächlichen, in der Vergangenheit manifestierten Vorkommnisse. Unserer Tradition folgend, wollen wir auch hier nicht auf ein Beispiel verzichten. Um dem Ganzen eine gewisse Würze und Übersichtlichkeit zu verleihen, wollen wir es auf ein ganz einfaches Beispiel beschränken.

 

Stellen wir uns vor, dass wir mit Strom betriebene Wecker produzieren (ja, diese einfachen Geräte gibt es immer noch) und uns im Rahmen der Qualitätssicherung drei defekte Geräte zurückgeschickt wurden. Eines wurde nach einem halben Betriebsjahr, das andere nach drei und das letzte nach sieben Betriebsjahren defekt. Es sei unterstellt, dass alle drei Wecker vergleichbaren Bedingungen (hinsichtlich Handhabung, Produktionsdatum, Inbetriebsetzung, Stromversorgung, Schutzvorrichtungen im Gebäuden, äusserlichen Wetterbedingungen) ausgesetzt waren und daher die Defekte sich glaubhaft nur aufgrund der Produktionsbedingungen erklären lassen. Der zuständige Produktionsmanager möchte nun wissen, ob er davon ausgehen muss, dass bei allen Weckern in einem Drittel der Fälle diese vor Ablauf der Gewährleistungspflicht – nach zwei Jahren – ausfallen werden.


Nun zugegebenermassen ist das Ganze sehr überspitzt, da nach sieben Jahren genügend Rückmeldungen eingegangen sein sollten, um darüber Auskunft zu geben. Aber stellen Sie sich vor, dass es sich um eine spezielle Vorrichtung handelt, welche nur in geringer Stückzahl produziert und verkauft wird. Schon sähe das Ganze realistischer aus. Aber zurück zu unseren Weckern und des Pudels Kern: eine historische Simulation setzt als erstes voraus, dass Daten vorhanden sein müssen.


Liegen die Daten nun vor, kann in Excel mit der einfachen Formel «=Zufallsbereich(1:#Anzahl Daten)» über n Zeilen eine Simulation angestossen werden und dann über die Formel «=Index(«Ursprungsdaten», errechnete Zufallszahl)» das Ergebnis gelesen und in ein Histogramm überführt werden. Dazu kann direkt auf Excel zurückgegriffen oder mit einem kleinen Trick auf die mit MC FLO mitgelieferte Datei «MC_FLO_FIRST.xlsx» abgestützt werden.

Historische Simulation

Bei einer Datenausprägung – wie hier die Ausfallrate einer Maschine – ist der historische Simulationsansatz von geringem Nutzen. Egal ob Sie nun 1'000 oder 1 Mio. Iterationen durchführen. Im Mittel sollte die Ausfallrate in unserem Fall bei 1/3 unter zwei Jahren liegen. Einen Mehrwert erhalten Sie dann, wenn Sie mehrere Maschinen mit unterschiedlichen Ausfallraten je Maschine kombinieren. Dabei ist zu berücksichtigen, dass bei der historischen Simulation nur auf bereits realisierte Daten abgestützt werden kann. Oder anders ausgedrückt: die historische Simulation geht davon aus, dass die Zukunft vollumfänglich durch die Daten der Vergangenheit beschrieben werden kann. So ist in unserem Beispiel davon auszugehen, dass kein Wecker länger als sieben Jahre in Betrieb ist.

 

Leider kann nicht mit Verlass gesagt werden, welcher Datenbestand als ausreichend für eine historische Simulation erachtet werden kann. Ein hohe Anzahl Daten stellt sicher, dass auch Ausreisser in die Daten Eingang finden und der sogenannte Standardfehler reduziert wird. Mit dem Rückgriff auf einen grossen Fundus an Daten besteht indes das Risiko, dass vielleicht auch auf zu veraltete Daten zurückgegriffen wird, welche für die Zukunft keine Relevanz mehr haben. Auch kann nicht ausgeschlossen werden, dass falsche Daten, etwa aufgrund einer unsachgemässen Messung, in den Datenbestand eingeflossen sind.

 

Der grosse Vorteil der historischen Simulation ist jedoch, dass keine Verteilungsannahmen getroffen werden müssen und die Berechnung einfach und schnell vonstattengeht. Die Einfachheit und die geringe Methodenkenntnis, welche eine historische Simulation voraussetzen, haben dessen Erfolg begründet. In der Finanzwelt hat die historische Simulation, insbesondere bei der Renditeberechnung eines Portfolios, grossen Zulauf.

 

Konzeptionell fährt die Monte-Carlo Simulationen einen anderen Ansatz. Vielmehr ist die Frage relevant, wie die Zukunft sich verhalten kann. Daher ist der Rückgriff auf historische Daten nur als Behelfsansatz zu interpretieren. Das ist insbesondere bei sozioökonomischen Fragestellungen der Fall. Historische Daten können – und werden auch in der Praxis – dazu herangezogen, eine möglichst geeignete Verteilungsfunktion zu bestimmen. Und hier kommen Excel und MC FLO mit der Möglichkeit, mathematische Funktionen ohne grosses Zutun verständlich zu machen, ins Spiel. Aus einer Vielzahl von Verteilungsfunktionen kann eine geeignete durch die in MC FLO implementierte Schätzfunktion bestimmt werden. Hierbei reicht oftmals bereits ein Datensatz mit ca. 100-200 Beobachtungen aus. Zur Hilfe kommt ein berühmter Satz aus der Statistik (Gliwenko-Cantelli): Die (durch Simulation) gewonnene empirische Verteilungsfunktion nähert sich an die tatsächliche Verteilungsfunktion. Oder anders ausgedrückt: Wenn Sie mit etwa 200 Datensätzen eine Exponentialverteilung erkennen können, dann wird das Bild der Verteilung auch mit 1 Mio. Datensätzen nicht anders aussehen. Wenn Sie nun wissen, dass die Daten einer Exponentialverteilung folgen können, warum sollten Sie dann noch die historische Simulation heranziehen?


Und auf unser Beispiel mit den Weckern umgemünzt? Stellen wir uns vor, dass die durchschnittliche Lebensdauer bei 5 Jahren oder 1'825 Tagen liegt. Wie viele Geräte werden innerhalb der Gewährleistungsfrist von 2 Jahre ausfallen? Wenn angenommen wird, dass die Geräte einer Exponentialverteilung folgen, dann kann dies mathematisch sehr einfach beantwortet werden. Wir ziehen die Simulation vor. Anbei das Resultat, mit dem magischen Strich von MC FLO herausgeschält. Nach ca. 730 Tagen werden 33% der Geräte ausgefallen sein (der Wert von x mit 731 Tagen korrespondiert mit dem Wert der kumulierten Verteilungsfunktion beim Wert von 0.33, im vollständigen Simulationsmodus von MC FLO können Sie die Daten exakt herauslesen).

Monte Carlo Simulation

Die Monte-Carlo Simulation berechnet dabei verschiedene Möglichkeiten anhand einer vorgegebenen Verteilungsfunktion. Dies erfolgt hoch automatisiert. Die Ergebnisse werden sich im Regelfall von den tatsächlichen beobachteten Werten unterscheiden. Die Vorteile liegen jedoch auf der Hand. So können Sie auch komplizierte Modelle mit mehreren Dutzenden Variablen schnell und sicher in Excel umsetzen, ohne auf umfangreiches Datenmaterial zurückgreifen zu müssen. Die mathematischen Funktionen – korrekt in Excel umgesetzt – bürgen zudem dafür, dass keine «Datenfehler» in den Berechnungen Eingang finden. Auch werden Ausreisser und mögliche Korrelationen zwischen den Variablen besser in den Berechnungen berücksichtigt. Der Preis dafür ist, dass das Verständnis über ein «Modell» und über Verteilungen mehr in den Vordergrund rückt.

 

Beiden Simulationsverfahren ist jedoch eines gemeinsam, denn es gilt der Grundsatz: garbage in, garbage out. Wohl bekomms!

Kommentar schreiben

Kommentare: 0