Modellkunde #1: Welche Daten stecken im Modell?
Wahlvorhersagen sind wie Würstchen: Viele mögen sie, aber keiner weiß so wirklich genau, was eigentlich drin ist. In unserer kleinen Serie "Modellkunde" wollen wir das ändern. In diesem und weiteren Beiträgen sezieren wir unser Modell Stück für Stück. Los geht es mit den grundlegenden Zutaten - den Daten und Informationen, die ins Modell einfließen.
Wahlvorhersagen sind wie Würstchen: Viele mögen sie, aber keiner weiß so wirklich genau, was eigentlich drin ist. Das wollen wir ändern.
Zutat 1: Historische Informationen
Wir nutzen prinzipiell zwei unterschiedliche Informationsquellen. Zum einen greifen wir auf Wahlergebnisse und weitere Charakteristiken bei vergangenen Wahlen seit 1949 zurück. Dazu gehören das Abschneiden von Parteien, historische Umfragedaten und Informationen darüber, ob eine Partei den oder die Kanzlerin stellte. Diese Informationen haben sich in der Vergangenheit als nützlich erwiesen, um Parteianteile bei künftigen Wahlen vorherzusagen. Schlussendlich nutzen wir drei Indikatoren, die uns helfen eine frühzeitige, erste Einschätzung des Wahlergebnisses zu erhalten. Dabei handelt es sich um das Abschneiden von Parteien bei vergangenen Wahlen, historische Umfragedaten (mittlere Zustimmung in Umfragen 230 bis 200 Tage vor der Wahl) und die Information darüber, ob eine Partei den Kanzler oder die Kanzlerin stellte. Diese Informationen haben wir für alle Wahlen seit 1953 erhoben. Die Rohdaten dazu haben wir hier online gestellt.
Wir nutzen drei Indikatoren, die uns helfen eine frühzeitige, erste Einschätzung des Wahlergebnisses zu erhalten: erstens das Abschneiden von Parteien bei vergangenen Wahlen, zweitens historische Umfragedaten (mittlere Zustimmung in Umfragen 230 bis 200 Tage vor der Wahl) und drittens die Information darüber, ob eine Partei den Kanzler oder die Kanzlerin stellte.
Zutat 2: Aktuelle Umfragen
Zum anderen nutzen wir aktuell veröffentlichte Umfragedaten, die von der Plattform wahlrecht.de zur Verfügung gestellt werden. Sobald dort eine neue Umfrage veröffentlicht wird, wird automatisch eine neue Vorhersage berechnet, die alle bisher veröffentlichten Umfragen im Jahr vor der Wahl bis zur aktuellsten Umfrage berücksichtigt.
Umfragen vor der Wahl können danebenliegen. Deshalb kombinieren wir die historischen Daten mit den aktuellen Umfragedaten.
Je näher der Wahltag rückt, desto mehr Gewicht haben veröffentlichte Umfragen für unsere Vorhersagen (dazu später mehr). Allerdings hat sich bei vergangenen Bundestagswahlen gezeigt, dass Umfragen vor der Wahl manchmal danebenliegen können. Deshalb kombinieren wir die historischen Daten mit den aktuellen Umfragedaten.
Und was ist mit anderen Informationen?
Prinzipiell gibt es natürlich noch viele weitere Datenquellen, die einem helfen können den Wahlausgang vorherzusagen. Wir haben uns vor allem viele weitere historischen Informationen angesehen - z.B. weitere Merkmale von Parteien oder die wirtschaftliche Entwicklung. Auf Basis unserer Berechnungen glauben wir aber, dass uns diese Faktoren nicht mehr entscheidend dabei helfen, eine bessere Vorhersage abgeben zu können.
Beliebte andere Vorhersagemodelle nutzen exotischere Datenquellen aus, z.B. Quoten auf Wettmärkten oder Trends auf Social-Media-Plattformen. Bei solchen Daten fehlen aber häufig die Erfahrungswerte - schließlich sind sie erst seit kürzerem verfügbar.
Ich kann Ihnen bereits sagen, wie die Wahl ausgeht!
Wollen Sie das nicht auch in Ihrem Modell berücksichtigen?
Das klingt natürlich sehr verlockend. Tatsächlich gibt es eine weitere Klasse von Vorhersagemodellen, die auf Erwartungen von Wählerinnen und Wählern zum Wahlausgang aufbauen. Wir halten diese Modelle für vielversprechend, aber leider gibt es noch zu wenige Daten im Kontext der Bundestagswahlen, um solche Informationen in unser dynamisches Modell aufzunehmen. Wir freuen uns aber, von Ihren Erwartungen zu hören! Schreiben Sie uns doch eine Nachricht - oder noch einfacher: Nehmen Sie an unserem Wahltippspiel teil.