Kombination von Prognosen

PollyVote nutzt die Kombination von Prognosen, um die Genauigkeit von Vorhersagen zu erhöhen. Konkret kombiniert PollyVote Prognosen unterschiedlicher Komponentenmethoden, welche wiederum auf unterschiedlichen Daten beruhen. Die eigentliche Kombination der Vorhersagen erfolgt dabei in zwei Schritten:
  1. Die Prognosen werden innerhalb der jeweiligen Komponentenmethode durch Berechnung des Mittelwerts kombiniert.
  2. Die daraus resultierenden Prognosen werden dann über die verfügbaren Komponentenmethoden, erneut durch Berechnung des Mittelwerts, kombiniert.

Mit anderen Worten: PollyVote weist zunächst allen Prognosen innerhalb einer Komponentenmethode das gleiche Gewicht zu. Im zweiten Schritt fließt wiederum jeder Komponentenmethode mit dem gleichen Gewicht in die finale PollyVote-Prognose ein. Dabei handelt es sich um exakt das gleiche Verfahren, dass bereits seit 2004 zur Vorhersage der U.S. Präsidentschaftswahlen (Graefe et al., 2014a; 2014b), und im Jahr 2013 auch zum ersten Mal für die Bundestagswahl (Graefe, 2015), eingesetzt wurde.

Die Idee hinter diesem Ansatz ist es, sicher zu stellen, dass jede Komponentenmethode den gleichen Einfluss auf die finale PollyVote-Prognose hat, unabhängig davon, ob innerhalb einer Komponente viele oder nur wenige einzelne Prognosen zur Verfügung stehen. Für die Vorhersage der nationalen Stimmenanteile stehen beispielsweise nur ein Prognosemarkt, jedoch eine Vielzahl von ökonometrischen Modellen, zur Verfügung. Würde man also schlichtweg den Mittelwert über alle verfügbaren individuellen Prognosen berechnen, würde dies dazu führen, dass die Methode der ökonometrischen Modelle über-, und Prognosemärkte untergewichtet würden. Ziel war es, dies mit dem Ziel einer höheren Prognosengenauigkeit zu vermeiden. Ein weiterer Vorteil ist, dass der gewählte Ansatz erlaubt, die Prognosen der unterschiedlichen Komponentenmethoden auf einfache Art und Weise zu vergleichen.

Das Prinzip der Kombination von Prognosen

Das Prinzip der Kombination von Prognosen ist ein etabliertes Verfahren aus der Prognosenforschung, um den Vorhersagefehler zu reduzieren. Das Forschungsinteresse zu kombinierten Vorhersagen ist seit der Publikation des häufig zitierten Artikels von Bates and Granger (1969) stark angestiegen. Seit der Veröffentlichung dieser Studie vor knapp einem halben Jahrhundert haben hunderte Studien den Wert der Kombination von Prognosen für unterschiedliche Anwendungsgebiete demonstriert.

Warum die Kombination von Prognosen funktioniert

Ein Grund ist, dass durch die Kombination unterschiedlicher Prognosen, welche auf unterschiedlichen Daten beruhen, mehr Informationen in die Vorhersage einfließen können. Darüber hinaus ist es so, dass jede einzelne Prognose beeinflusst ist durch die Auswahl der zugrunde liegenden Daten sowie der angewandten Methode. Daraus können systematische Fehler resultieren. Durch die Kombination von Vorhersagen werden die systematischen (und zufälligen) Fehler, welche einzelnen Prognosen anhaften, ausgeglichen.

Optimale Gewichtung der Prognosen

Seit gezeigt wurde, dass die Kombination von Prognosen den Vorhersagefehler reduziert, haben sich Wissenschaftler mit der Frage beschäftigt, wie die einzelnen Prognosen miteinander kombiniert werden sollten, um den Vorhersagefehler zu minimieren. Ein Überblick über mehr als 200 publizierte Studien kam dabei zum Ergebnis, dass die Gewichtung der Komponenten kaum einen Einfluss auf die Prognosegenauigkeit hat. Oftmals ist es sogar so, dass der einfache Mittelwert über alle verfügbaren Prognosen genauere Vorhersagen liefert, als komplexe statistische Verfahren, welche das Ziel haben, die „optimale“ Gewichtung auf Basis historischer Daten zu schätzen (Clemen, 1989). Diese Ergebnisse haben sich in empirischen Studien immer wieder bestätigt (Graefe et al., 2015).

Ein Grund für die Leistungsfähigkeit des einfachen Mittelwerts liegt an der Tatsache, dass die Genauigkeit einzelner Prognosemethoden bzw. -modelle über die Zeit oft stark variiert, und von externen Effekten beeinflusst wird. Eine Analyse der Prognosegenauigkeit sechs ökonometrischer Modelle über die 10 U.S.-Wahlen von 1976 bis 2012 kam beispielsweise zum dem Ergebnis, dass ein negativer Zusammenhang zwischen der historischen Genauigkeit eines Modells, und dessen Vorhersagegenauigkeit für künftige Wahlen. Mit anderen Worten, Modelle die für bestimmte Wahlen besonders gut funktionierten, lieferten für darauf folgende Wahlen oftmals mit die ungenauesten Prognosen. Der Grund ist einfach: jede Wahl findet unter bestimmten, ganz eigenen, Bedingungen statt. Deshalb funktionieren Methoden oder Modelle, welche in der Vergangenheit gut funktioniert haben, nicht notwendigerweise auch in der Zukunft. Unter solchen Bedingungen ist demnach natürlich auch die Gewichtung einzelner Prognosen auf Basis deren historischer Genauigkeit nur von geringem Wert.

Ein anderer, eher technischer, Grund, lässt sich auf Schätzfehler in der Ermittlung der optimalen Gewichte durch statistische Verfahren zurückführen. Allgemein lässt sich sagen, dass der einfache Mittelwert genauere Prognosen liefert, wenn zwei Bedingungen erfüllt sind:

  1. Die Kombination beruht auf einer großen Anzahl von einzelnen Prognosen
  2. Die „optimalen“ Gewichte sind nahe am Gleichgewicht.

Unter solchen Bedingungen hat jede einzelne Prognose nur wenig Gewicht, und der einfache Mittelwert vermeidet etwaige Fehler, welche bei der statistischen Schätzung der Gewichte auftreten (Graefe et al., 2015).

Bedingungen für die Kombination von Prognosen

Die Kombination von Prognosen ist sinnvoll, wann immer mehr als eine Prognose zur Verfügung steht. Besonders wertvoll aber ist das Verfahren, wenn:

  1. Viele Prognosen zur Verfügung stehen, welche mit Hilfe von etablierten Prognosemethoden erstellt wurden.
  2. Die einzelnen Prognosen auf unterschiedlichen Methoden und Daten beruhen.
  3. Unklar ist, welche Prognose die genaueste Vorhersage liefert.

Das Problem der Wahlvorhersagen erfüllt diese Bedingungen. Erstens, es existieren eine Reihe von etablierten Methoden, um Wahlen vorherzusagen. Zweitens, diese Methoden nutzen unterschiedliche Daten. Und, drittens, es ist üblicherweise nicht möglich, vor der Wahl abzuschätzen, welche Methode die besten Vorhersagen liefert (Graefe et al., 2014a).

LITERATUR