Podsumowanie prognozy II tury wyborów prezydenckich
17 lipca 2020
Wybory wygrał Andrzej Duda, a nie Rafał Trzaskowski, jak przewidywaliśmy w naszej prognozie, dlatego warto napisać kilka słów wyjaśnienia.
Jak powstają prognozy Stanu Polityki
Dokładnie opisaliśmy to wiele miesięcy temu pod tym linkiem. W skrócie prognoza powstaje automatycznie na bazie sondaży CATI przeważonych pod względem trafności w poprzednich latach. W przypadku II tury zastosowaliśmy wagi na podstawie trafności sondaży z pierwszej tury wyborów, im mniejszy błąd danej firmy przed pierwszą turą tym waga takiego sondażu większa. Dodatkowo do prognozy opartej na sondażach CATI dodawaliśmy 0,9 p.p. na rzecz Rafała Trzaskowskiego ze względu na prognozowany wpływ głosów z zagranicy (ostatecznie wpływ tych głosów wyniósł 0,98 p.p. na rzecz kandydata KO). Wpływu tego nie uwzględniały (bo nie mogły) sondaże realizowane w Polsce. Przed II turą sondaże, które najdokładniej wskazywały wynik przed pierwszą odsłoną głosowania, pokazywały wygraną Rafała Trzaskowskiego. Wynik taki przewidywały sondaże m.in. Kantar MB i IBRIS a pozostałe, wskazujące minimalną wygraną PAD, po uwzględnieniu głosów z zagranicy pokazywały remis lub tylko minimalna przewagę Prezydenta. Co ważne nie realizowaliśmy naszego sondażu IBSP przed II turą (który okazał się dokładniejszy przed pierwszą turą niż badanie exit poll).
Sondaż Kantar MB dla Fakty TVN (drugi pod względem trafności przed I turą)
RT 50,30% PAD 49,70% (po uwzględnieniu zagranicy RT 50,75% PAD 49,25%)
Sondaż IBRIS dla Onet (trzeci pod względem trafności przed I turą)
RT 50,91% PAD 49,09% (po uwzględnieniu zagranicy RT 51,36% PAD 48,64%)
Sondaż Ipsos dla OKO.press (dziesiąty pod względem trafności przed I turą)
RT 48,45% PAD 51,55% (po uwzględnieniu zagranicy RT 48,90% PAD 51,10% )
Prognoza wyniku II tury
10.07.2020
Trzaskowski
Duda
Czy zamierzamy zmienić tę metodę? Zdecydowanie nie. Możemy zastanawiać się, dlaczego najtrafniejsze sondaże przed I turą wskazały teraz najgorsze wyniki lub co wydarzyło się pomiędzy piątkiem a niedzielą, co wpłynęło na ostateczny wynik (tę drugą kwestię opiszemy innym razem), możemy też zastanawiać się, czy realizacja sondażu IBSP przed II turą dałaby nam inną wiedzę. Cała prognoza powstaje bez jakiegokolwiek naszego udziału, wpływu i “intuicji”, oparta jest i zawsze będzie oparta na bazie dostępnych danych. Dzięki temu prognoza StanPolityki.pl najtrafniej wskazała wynik wyborów parlamentarnych i na równi z Polityka Insight wyniki I tury wyborów prezydenckich. Podsumowując trzy ostatnie wybory do PE, Sejmu oraz wybory prezydenckie prognozy StanPolityki.pl okazały się najdokładniejsze wśród wszystkich prognoz publikowanych przed tymi wyborami (najmniejszy średni błąd łączny), co można zobaczyć i porównać na sprawdzamysondaze.pl.
Z czego wynikało 80% szans na wygraną Rafała Trzaskowskiego?
80% oznaczało, że po wprowadzeniu danych do systemu przy wylosowaniu 1000 wyników opartych na bazie tych sondaży w 800 przypadkach wygrywał Rafał Trzaskowski, a w 200 wygrywał Andrzej Duda (różnice wynikają z dopuszczalnych błędów statystycznych w sondażach). Z tego też wynikały przedziały poparcia dla kandydatów. Dla Rafała Trzaskowskiego był to przedział 48,49% – 52,82%, a dla Andrzeja Dudy przedział 47,18% – 51,51%. Jak widać, końcowe wyniki zmieściły się w tych przedziałach.
A. Duda – maksymalny i minimalny wynik wyborczy w II turze
- Max
- Min
R. Trzaskowski – maksymalny i minimalny wynik wyborczy w II turze
- Max
- Min
Czy ten sposób pokazywania szans na wygraną lub szans na inny efekt zamierzamy zmienić? Tak. Ta forma okazał się nieczytelna i wprowadzała w błąd, procenty oznaczały efekty symulacji, a nie procent prawdopodobieństwa. W przyszłości zamierzamy stosować Twierdzenie Bayesa. Pozwoli nam to dokładniej szacować prawdopodobieństwo jakiegoś wydarzenia. Nie zmienia to jednak faktu, że nawet stosując Twierdzenie Bayesa przed II turą, dalej Rafał Trzaskowski miałby większe szanse na wygraną na bazie dostępnych danych i sondaży.
Prognoza na województwa
Tutaj wiadomości pozytywnych jest zdecydowanie dużo więcej. Porównując naszą prognozę z ostatecznym wynikiem widać zbieżność danych i pewną przewidywalność zachowania wyborców. Przewidzieliśmy, w których województwach wygra Rafał Trzaskowski a w których Andrzej Duda, a różnice na poziomie województw nie przekraczały w większości województw 2 p.p.
Prognoza na powiaty
Tutaj także nasza prognoza i wynik wyborów okazała się bardzo podobne. Przewidzieliśmy, że Rafał Trzaskowski wygra w 166 powiatach, ostatecznie wygrał w 144. W przypadku Opola i Sopotu udało nam się przewidzieć wynik wyborów z dokładności do 2 liczby po przecinku. W przypadku 78 powiatów różnica pomiędzy prognozą a wynikiem wyniosła nie więcej niż 1 p.p. co napawa nas dużym optymizmem w szczególności, jeśli chodzi o prognozowanie wyników w okręgach wyborczych i podział mandatów. Trzeba pamiętać, że prognoza oparta była wyłącznie o ogólnopolskie badania oraz dane historyczne z poprzednich wyborów, a także przewidywane przepływy. Jeśli znacie kogoś, kto robi to lepiej i dokładniej niż my, dajcie znać, chętnie czegoś więcej się nauczymy.
Frekwencja
Największe różnice zauważyliśmy przy prognozowaniu frekwencji na powiaty.
Prognozowana przez nas frekwencja na poziomie 66% w rzeczywistości okazała się o 2,18 p.p. wyższa, co widać na poniższych mapach. Co ważne rozkład tej frekwencji okazał się bardziej rozłożony na mniejsze powiaty, co ostatecznie przełożyło się na wynik. Warto pamiętać, że prognozowaliśmy wynik Rafała Trzaskowskiego na 10 191 796 głosów (ostatecznie otrzymał 10 018 263 głosów). Wynik Andrzeja Dudy prognozowaliśmy na 9 830 761 głosów (ostatecznie dostał ich 10 440 648). Warto zauważyć, że większa niż prognozowaliśmy frekwencja, to 659 854 dodatkowych głosów, co skłoniłoby do tezy, że w ostatnich dniach przed II tura przybyło nowych wyborców, których nie wychwyciły sondaże.
Dlaczego większość obstawiała wygraną Andrzeja Dudy?
Odpowiedź jest prosta. Wynikało to z przeświadczenia, a nie z danych. Badania potwierdzają, że więcej osób wierzyło w sukces obecnego Prezydenta, a nie w wygraną Rafała Trzaskowskiego. Dlaczego pomyliły się sondaże? To już pytanie do czołowych firm badawczych. Jedna z hipotez mówi o wyborcach Andrzeja Dudy, którzy ukrywali się za odpowiedzią “nie wiem/trudno powiedzieć” tym samym ukrywając swoje zadeklarowane już poparcie.