sobota 31. října 2020

Průzkumy rozumu navzdory

Volební průzkumy jsou jedním z mála statistických výstupu, který si získává poměrně silnou pozornost. Napadá mě přirovnání k tabulce fotbalové nebo hokejové ligy. Člověk hledá svůj oblíbený tým, počítá body a vyhlíží další zápas. Možná za popularitou průzkumů volebních preferencí stojí spíše sportovní nadšení než opravdový zájem o politiku a ideová východiska jednotlivých stran. Možná je má domněnka správná, možná ne, nicméně volební preference sleduje kdekdo, ať už statistikám rozumí více či méně. A já mezi tyto lidi patřím. A jako nadšeného fanouška mě štve, když se v médiích řídí jen jedním průzkumem. Dívám se třeba na Otázky Václava Moravce nebo DVTV, kde zpovídají předsedu menší stany ohledně jejich šancí dostat se do Sněmovny, když v průzkumech nemají ani pět procent. A já si říkám: "vždyť v posledním jich měli skoro sedm!" Média u nás bohužel nepřebírají v zahraničí zcela běžný postup průměrování dostupných průzkumů z poslední doby. Třeba na serveru Real Clear Politics se před volbami dočteme, jaký je průměrný zisk jednotlivých kandidátů celonárodně i v jednotlivých státech, kdo má jak velký náskok, kolik volitelů by kdo podle posledních průzkumů dostal, zda se průzkumu zúčastnili registrovaní nebo jen pravděpodobní voliči, kolik jich bylo apod. Výsledný přehled je tak daleko bohatší a zároveň lépe vypovídající než cokoliv, co nám nabízí česká média. 

Ukázka přehledu z Real Clear Politics: stát Pennsylvanie, Biden vs. Trump 2020 (zdroj)
Dělat si obrázek jen podle průzkumu jedné agentury není dobrý nápad, protože každá má jiné postupy dotazování potenciálních voličů a kvůli tomu jsou výsledky každé agentury nějakým způsobem zavádějící. A protože se u nás i přesto stále diskutují jen jednotlivé průzkumy, rozhodl jsem se, že si aspoň pro sebe takové srovnání čili polls of polls udělám. Kdo nechce číst dále, nechť scrolluje trochu níže, kde je tabulka aktuálních výsledků. Určitě bych měl ovšem vysvětlit, jak jsem k ní dospěl. Začnu charakterizací průzkumů agentur, které jsem do svého souhrnu zařadil. Ještě předtím ale k ujasnění několika pojmů. Zaprvé stranické preference ukazují aktuální podporu politických stran a kandidátů, ovšem bez odečtení těch, kteří žádnou preferenci nemají. Neodečteme-li nevoliče a nerozhodnuté, bude to působit, že mají strany o něco méně. Někteří horlivý, avšak ne příliš přemýšliví novináři v minulosti tuto skutečnost nechápali. Před volbami 2006 tak třeba mylně tvrdili, že jsou lidovci pod hranicí zvolitelnosti (zdroj). K prezentování je proto vhodnější volební model. Ten ukazuje, jak by dopadly volby, kdyby se konaly v době dotazování respondentů. Nejsou v nich tedy nevoliči ani zcela nerozhodnutí. Zejména kvůli nerozhodnutým se volební modely od reálných výsledků voleb o něco liší. Volební model může zohlednit i nerozhodnost dotazovaného, který preferuje více než jednu stranu. Zadruhé prosím o pochopení rozdílu mezi procenty a procentními body. Má-li strana A v modelu 20 % a strana B 18 %, nevede strana A o dvě procenta, ale o dva procentní body! Lze také říct, že vede o 11 %, ale komu by se to chtělo počítat? Zaměňování procentních bodů za procentní rozdíl je běžné jak u politiků, tak u novinářů (např. odkaz). Vyhněme se prosím této chybě. Anglické zdroje již používají jen zkráceně body, tedy points. To je možná nejlepší přístup.
  • CVVM: Centrum pro výzkum veřejného mínění spadá pod Sociologický ústav Akademie věd ČR. Můžeme tak říci, že je to v mém výčtu jediný veřejný zdroj průzkumů. Ostatní jsou soukromé nebo neziskové agentury. CVVM dotazuje kolem 900 potenciálních voličů. Obvyklý počet je u průzkumů spíše nad 1000, samo o sobě to ale není problémem. Důležité je, jak výsledky naplňují populační kvóty, či jak se na ně převáží. Mají-li třeba mezi zúčastněnými menší procento lidí z Ústeckého kraje, než je tam reálné procento voličů, zvýznamní ve výsledcích tuto skupinu, tedy pokud váží výsledky podle krajů. Primární je ale snaha "vpustit" do modelu jen ty, kteří populačním kvótám odpovídají, aby se nemuselo ex post vážit. CVVM také zohledňuje pravděpodobnost, že se dotázaný voleb zúčastní (zdroj). Volební průzkumy realizuje osobním dotazováním respondentů, což je v současnosti problém, protože chodit od domu k domu a vybavovat se tam s lidmi je COVIDův vlhký sen. Asi proto CVVM už od září žádný volební model nepublikoval, třebaže tak dříve činil s měsíční periodou. S touto metodou sběru dat se také váže možné vychýlení výsledků. Přinejmenším dříve platilo, že v pracovních hodinách doma osobně zastihnete spíše levicové voliče ČSSD a KSČM. Třebaže byly výsledky pečlivě zvoleny tak, aby odpovídaly české populaci, dařilo se podle nich těmto stranám lépe než u modelů jiných agentur. S tím, jak voliči ČSSD i KSČM přesedlali, se tento bias rozprostřel mezi více stran a není už tolik patrný. Bylo tu ale ještě jedno výrazné zkreslení. Před volbami z roku 2006 únorový průzkum CVVM předpověděl Straně zelených osmiprocentní zisk (zdroj). Ještě měsíc předtím měla přitom jen 3 % (zdroj). Strana zelených se následně do Sněmovny skutečně dostala, a to se ziskem 6,29 % (zdroj). Je tak pravděpodobné, že právě únorový průzkum CVVM jim tento u Strany zelených zatím ojedinělý úspěch zařídil, protože průzkumové prolomení hranice 5 % může mít pro stranu pozitivní psychologický efekt (zdroj).
  • Median: Median má v modelování volebních preferencí dlouholeté zkušenosti a v jejich výsledcích neshledávám žádné patrné vychýlení. Pro srovnávání je nevýhodou, že volební modely nevydává pravidelně. Někdy je to každý měsíc, jindy si člověk musí pár měsíců počkat. Je to celkem pochopitelné. S blížícími se volbami poptávka po průzkumech roste. Median osobně táže přes 1000 respondentů a odpovědi zadává do počítače/tabletu (metoda CAPI), takže jsou ihned dostupné k analýze bez nutnosti přepisu. Nezastižené respondenty dotazuje online (CAWI) (zdroj). To se hodí právě v současné COVIDové krizi. Výběr respondentů by měl odpovídat české populaci, a to podle kritérií kraje, věku, pohlaví, vzdělání a velikosti obce. Je také dobré dodat, že při doptávání se na další zvažované strany Median používá uzavřenou otázku, tedy poskytne výčet všech stran. Třeba CVVM i při otázce na další strany ponechává otázku otevřenou  bez výčtu stran.
  • STEM: Volební modely od STEMu vychází obvykle jednou za dva měsíce, poslední je ale ze září 2020. Je to nejspíše dáno tím, že respondenty dotazuje osobně. To je při tisících nově nakažených denně krajně nezodpovědné, a tak si na další průzkum od STEMu asi ještě chvíli počkáme. Průzkumů se účastní přes 1000 lidí (zdroj). STEM obvykle poukazuje na to, že je neziskovou organizací, a je tedy nezávislý na jakékoliv politické síle.
  • IPSOS: V poslední době se do průzkumového šílenství zapojila i agentura IPSOS. Výzkumy zpracovává na zakázku koalice SPOLU. A světě div se, ta z nich vychází lépe než u jiných agentur! Má v nich obvykle o dva body více, než v jiných průzkumech, což se dá vždy hodit na statistickou chybu. IPSOS využívá svého online panelu, ze kterého vybere účastníky podle pohlaví, věku, vzdělání, kraje a velikosti sídla. Je jich přes 1000 (zdroj).
  • KANTAR CZ: Průzkumy od Kantaru se těší velké společenské odezvě, protože je zveřejňuje Česká televize, se kterou má Kantar smlouvu. Stále více se tomu divím. Kantar totiž oproti jiným agenturám extrémně nadhodnocuje výsledky Pirátů a STAN, což působí velmi neseriózně. Jak jsem uváděl, každá agentura provádí průzkumy trochu jinak a je jasné, že také jinak vyjdou, nicméně tady už jsme za hranicí statistické chyby. Koalici zmíněných stran za únor 2021 přidala oproti jiným agenturám 9 bodů! Zvažuji proto, že Kantar se svého souhrnu vyřadím. Nemyslím si ale, že je toto vychýlení záměrné. Pochybení bude na straně výzkumné metody. Je možné, že za ním stojí způsob dotazování. Tazatelé respondentům volají a jejich odpovědi přepisují do počítače (CATI). Můžeme spekulovat o tom, kdo má častěji telefon u sebe a že se tak do výběru dostane např. méně seniorů z domovů důchodců oproti těm čilejším a technologicky zdatnějším. Jak jsem naznačil u CVVM, záleží také na tom, v jakou denní dobu je průzkum prováděn. Zaměstnaní lidé během pracovní doby zvonící telefon spíše zvednou než důchodci či nezaměstnaní. Vždyť může jít o klienta! Pravda, i tím se Kantar zabýval a měnil dny i hodiny telefonování. Kantar také počítá s vysokou volební účastí, kterou voliči Pirátů rádi deklarují. Když ale přijde na to odpojit se od počítače a fyzicky dorazit do volební místnosti, tak je to jiná. Takto bych mohl spekulovat dlouho. Po pravdě nevím, čím to je, ale to vychýlení je opravdu značné. Možná také není správně nastavená reprezentativnost vzorku dotazovaných, kteří jsou vybíráni podle pohlaví, věku, kraje, vzdělání a místa bydliště (zdroj). I TNS Aisa, "předchůdce" (zdroj) Kantaru se často těžce seknul, když třeba měsíc před volbami 2013 "trošku" netrefil reálné preference ANO 2011 (jako mnozí) i SPOZ.
  • SANEP: Tahle agentura nemá právě nejlepší pověst, alespoň co se volebních modelů týče. Její závěry obvykle prezentují zejména dezinformační Parlamentní listy a v minulosti bylo patrné nadhodnocení SPD i Trikolóry. Bylo to asi dáno tím, že SANEP čerpá z vlastního panelu respondentů, do kterého se může online přihlásit kdokoliv. Je tedy možné, že tato agentura přitáhne převážně určitý typ voličů. Podle SANEPu je ze zúčastněných proveden kvótní výběr odpovídající rozložení populace ČR (zdroj). Chybí ale informace o tom, podle jakých kategorií jsou kvóty sestaveny. Do výčtu preferencí se tak nakonec dostanou necelé 2000 voličů. Navzdory pochybnostem do svého výčtu řadím i závěry této agentury zejména z jednoho důvodu. Zavedené "seriózní" agentury v nějaké míře odpuzují radikální protestní voliče. Ti s nimi zkrátka odmítají spolupracovat, ať už ze vzdoru či kvůli studu. Zato SANEPu, MÉDEA RESEARCH nebo PHOENIX RESEARCH se svěří moc rádi. Protože poslední dvě zmíněné agentury  také prezentované zejména v Parlamentních listech  už jsou v podpoře SPD a Trikolóry příliš okaté, zařazuji jen SANEP, který tak trochu reprezentuje všechny tři a pomáhá snížit možné opomenutí radikálnějších stran. Neochota odpovídat zavedeným agenturám možná u nás není až tak silná, ale nějaké podhodnocení SPD z minulých let tu patrné je a třeba v listopadu a prosinci 2019 předpovědi podpory Trikolóry lítaly mezi 0,5 % a 7 %, což je dost.
Podle průzkumu ne (meme dle seriálu Little Britain)

Manipulovat výsledkem průzkumu je pochopitelně možné v rámci výzkumné metody, ale upřímně si nemyslím, že by k tomu u výše jmenovaných docházelo. Jsou ale i jiné způsoby, jak do výsledků průzkumu promítnout preference vlastní či zadavatelovy. Zmíním jen ten nejzjevnější  barvičky. Politické strany a hnutí si samy volí nějaké barvy, média je pak prezentují pod jinými, obvykle vycházeje z tiskových zpráv zmíněných agentur. Rozpory nastávají zejména u stran, které mají barvy shodné s jinými. Tak třeba SPD a Trikolóra si po vzoru TOP 09 přisvojily státní barvy České republiky. Agentury se s tímto problémem vyrovnávají vskutku kreativně. U TOP 09 za krátko upustily od přechodů bílé, červené a modré a přešly na fialovou. Někdy však sloupec procentního zisku této strany zbarví do "liberální" růžové. SPD, která se prezentuje především modrou, dostane obvykle temně modrou, temně rudou nebo hnědou  tedy barvu běžně připisovanou fašistům. Podobně je tomu u Trikolóry, která se sama nejčastěji barví do běla. Nejde o žádné zásadní projevy manipulace a lze snadno argumentovat, že tak seriózní agentury korigují stranickou propagandu neodpovídající skutečnému začlenění do politického spektra.

Já ve svém souhrnu nemaluju. Vlastní postoje trochu promítám do sestavených koalic. Než totiž koalice stran ODS, TOP 09 a KDU-ČSL oznámily název Spolu, potřeboval jsem je nějak stručně označit. To samé platí doposud u koalice Pirátů a STAN. První uvedené jsem proto označil jako KP  konzervativní pravice, druhé LP  liberální pravice. Není a ani nemůže to být hodnotově neutrální zkratka. Je to zároveň můj korektiv ideového vymezování, které probíhá zejména ze strany ODS a SPD vůči Pirátům. Snaží se totiž o vytvoření dojmu, že jde o ostře levicovou stranu. Pirátství může mít určitě levicový přesah. U těch našich je patrné, že si ho trochu před lety "vypůjčily" od Strany zelených spolu s jejími voliči. Sotva však může být levicová strana ta, která chce díry v rozpočtu látat především transparentním zadáváním zakázek a potlačením korupce a vyhýbá se zásadnímu zvýšení daní. V literatuře se pirátské hnutí někdy označuje za cyber-libertariánství (zdroj), což podle mě sedí nejlépe. Ale o tom třeba jindy.

A teď konečně slíbený souhrn. Když si projedete celou tabulku, najdete další popisky, vysvětlivky a výsledky jednotlivých průzkumů. Třeba doplnit, že nedělám průměr jen průzkumů z posledního měsíce. Na to jich u nás nevychází ve stejném období dostatek. Průměruju tedy poslední průzkumy jednotlivých agentur, pokud nejsou starší než dva měsíce. Tak co, odpovídá to současné sociální realitě ČR?


Za dobu, co tenhle příspěvek připravuji, už mě přestihli jiní. Server "Seznam zprávy" nedávno začal také zveřejňovat průměr posledních volebních průzkumů (odkaz). Rozdíl je v tom, že neberou v potaz průzkumy od agentury Sanep, a to nejspíš z výše zmíněných důvodů. Tak zohledňují i starší průzkumy, ovšem dávají jim nižší váhu. Na volebním výsledku budou nakonec nejdůležitější rozdělené poslanecké mandáty. Přepočet aktuálních průzkumů na mandáty provádí web Mandaty.cz (odkaz). Rozhodně doporučuji! A aby měli přehled i lidé nemluvící česky, polls of polls v jednotlivých zemích Evropy provádí také server Politico (odkaz).

Žádné komentáře:

Okomentovat