Domov databázy Použitie algoritmov na predpovedanie volieb: chat s nakresleným linzerom

Použitie algoritmov na predpovedanie volieb: chat s nakresleným linzerom

Anonim

Drew sa predstaví na samite Big Data Innovation Summit 30. a 31. januára v Las Vegas: http://analytics.theiegroup.com/bigdata-lasvegas, spolu s rečníkmi Obamu pre Ameriku, Best Buy, LinkedIn, New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs a mnoho ďalších.


Odkaz na registráciu: http://bit.ly/Zs3wms


Tento rozhovor uskutočnil George Hill a uverejnil ho v časopise Big Data Innovation Magazine.


Aká bola reakcia na vaše predpovede?


Väčšina reakcií sa zamerala na rozdiel v presnosti medzi tými z nás, ktorí študovali prieskumy verejnej mienky, a na predpovede populárnych odborníkov a komentátorov na „črevo“. V deň volieb všetci analytici, ako som ja, Nate Silver (blog New York Times FiveThirtyEight), Simon Jackman (Stanfordská univerzita a Huffington Post) a Sam Wang (Princeton Volebné konzorcium), všetci umiestnili šance Obamu na opätovné zvolenie na viac ako 90% a správne predvídali 332 volebných hlasov pre Obamu ako najpravdepodobnejší výsledok. Medzitým odborníci ako Karl Rove, George Will a Steve Forbes povedali, že Romney vyhrá - a v niektorých prípadoch ľahko. To viedlo k hovoreniu o „víťazstve pre quants“, ktoré, ako dúfam, prinesie budúce voľby.


Ako hodnotíte algoritmus použitý vo vašich predpovediach?


Môj prognostický model odhadoval výsledky štátneho hlasovania a záverečné volebné hlasovanie každý deň kampane, ktorý sa začal v júni. Chcel som, aby hodnotenie týchto predpovedí bolo čo najspravodlivejšie a najobjektívnejšie - a ak by sa mýlili, nenechal by som nijaký priestor na krútenie. Asi mesiac pred voľbami som teda zverejnil na svojej webovej stránke súbor ôsmich hodnotiacich kritérií, ktoré by som použil, keď budú výsledky známe. Ako sa ukázalo, model fungoval dokonale. Počas leta predpovedalo, že Obama vyhrá všetky svoje štáty z roku 2008 mínus Indiana a Severná Karolína, a sotva sa vymanil z tejto predpovede, aj keď podpora pre Obamu vzrastla v septembri nahor, potom sa ponorila po prvej prezidentskej diskusii.


Množstvo údajov, ktoré v tejto kampani používali nezávislí analytici aj tímy kampaní, bolo obrovské, aké dôsledky to má na využívanie údajov v roku 2016?


Kampaň v roku 2012 preukázala, že je možné spravovať, dôverovať a úspešne aplikovať viacero rôznych kvantitatívnych informácií na rôzne účely. My outsideri sme boli schopní predvídať výsledok volieb ďaleko vopred. V kampaniach sa zaznamenali obrovské pokroky v cielení voličov, sledovaní názorov, získavaní finančných prostriedkov a účasti voličov. Teraz, keď vieme, že tieto metódy môžu fungovať, myslím, že sa už nevracia. Očakávam, že novinári a komentátori kampaní v roku 2016 vezmú agregáciu prieskumu oveľa vážnejšie. Aj keď sa zdá, že Obama a demokrati v súčasnosti majú výhodu v technológii kampaní, bol by som prekvapený, keby republikáni rýchlo dohonili.


Myslíte si, že úspech tejto kampane založenej na údajoch znamenal, že manažéri kampaní teraz musia byť analytikom aj stratégom?


Manažéri kampaní nemusia byť sami analytikmi, ale mali by si viac uvedomovať, ako môžu byť údaje a technológie využité vo svoj prospech. Kampane vždy využívali prieskumné prieskumy na formulovanie stratégie a meranie sentimentu voličov. Teraz je však k dispozícii celý rad ďalších výkonných nástrojov: webové stránky sociálnych sietí, databázy voličov, mobilné smartfóny a e-mailový marketing. A to je navyše k nedávnemu pokroku v metodológiách prieskumu verejnej mienky a štatistickému modelovaniu mien. V politike americkej kampane sa práve teraz odohráva veľa inovácií.


Podarilo sa vám predpovedať výsledky volieb 6 mesiacov vopred. Čo si myslíte, že je realistický maximálny časový rámec na presné predpovedanie výsledku pomocou analytických techník?


Asi štyri alebo päť mesiacov je už tak ďaleko, ako nám veda umožňuje ísť hneď teraz; a to dokonca trochu tlačí. Predtým prieskumy verejnej mienky nie sú dostatočne informatívne o konečnom výsledku: príliš veľa ľudí je nerozhodnutých alebo nezačali venovať pozornosť kampani. Historické ekonomické a politické faktory, o ktorých sa preukázalo, že korelujú s volebnými výsledkami, tiež začínajú strácať svoju prediktívnu moc, keď sa dostaneme za hranicu približne 4 - 5 mesiacov. Našťastie to ešte stále dáva kampaniam dostatok času na vykreslenie stratégie a rozhodnutie o tom, ako rozdeliť svoje zdroje.

Použitie algoritmov na predpovedanie volieb: chat s nakresleným linzerom