Ontem foi realizada a primeira
eleição primária americana de 2016, no estado de Iowa. O PollingData acompanhou essa eleição. A
projeção feita pelo site não foi muito boa: na primária Democrata, acertamos o
vencedor, porém com uma margem maior do que de fato ocorreu; nas primárias
Republicanas, o candidato Cruz que
estava em segundo lugar com uma estimativa de 23 % acabou ganhando com 27,7%
dos votos, enquanto o Trump que liderava com 27% perdeu com 24,3%.
Para visualizar melhor como foram
essas corridas, acesse o site, e no menu principal selecione Eleições 2016
>> Estados Unidos >> Primarias. Lá apresentamos um gráfico de
tendências que mostra toda a dinâmica eleitoral de acordo com as pesquisas, e
também o resultado final da eleição. É um ótimo retrato do que ocorreu!
Nesse post não vamos discutir a
performance do PollingData e das pesquisas eleitorais. O objetivo é discutir sobre
as principais dificuldades que existem para prever o resultado das eleições
primárias americanas. Em alguns aspectos, as primárias
são similares ao primeiro turno das eleições brasileiras. Muitos eleitores
desconhecem os candidatos e apenas se decidem na véspera da eleição, fazendo
com que grandes variações entre os resultados das pesquisas na véspera do
pleito e o resultado da eleição sejam comuns.
Porém existe uma diferença muito
grande. O voto nas eleições primárias não é obrigatório. E o percentual de
pessoas elegíveis que de fato votam é muito pequeno, tipicamente variando entre
10% e 20%. Esse ano em Iowa, por exemplo, o percentual de pessoas que votaram foi de 15,7%,
um recorde positivo. Na eleição anterior havia sido de apenas 6,5%.
Qual a relevância desse
percentual de voto baixo? Enorme! Para se
fazer uma previsão sobre o resultado da eleição, é necessário antes prever quais
respondentes irão votar. Eleitores que votam frequentemente usualmente votam de
forma diferente daqueles que têm poucas chances de votar. E no caso das
primárias, essas diferenças usualmente são maiores ainda.
O problema é importante para as
pesquisas de opinião porque é comum pessoas que declararam ter
uma grande chance de votar não votarem. E quando isso ocorre, o erro de previsão das pesquisas
aumenta. Por isso os institutos desenvolveram, ao longo das
últimos décadas, diversos modelos para prever a chance de voto de cada respondente da
pesquisa. Esses modelos são chamados de “Likely Voter Models”. Para quem quer entendê-los melhor, recomendo esse link,
que discute tanto os modelos quanto os erros cometidos por eles.
Uma etapa essencial na construção desses
modelos é definir qual será o ponto de corte a partir do qual o
respondente é classificado como “provável eleitor”. Nas eleições primárias, muitas vezes não é possível encontrar um bom
corte. Isso ocorre porque é comum ocorrerem grandes concentrações de respondentes nos extremos
da escala de probabilidade de voto. Para uma discussão sobre tema, veja esse link. Além disso, por causa da baixa
incidência de voto nas primárias, usualmente o estatístico/analista têm que descartar
uma grande parte da amostra retirando quem têm pouca chance de votar, tornando as
pesquisas para essas eleições mais caras e com um grau de precisão baixo.
Apesar das dificuldades, o
PollingData continuará acompanhando as eleições primárias. Estamos testando
diferentes formulações do nosso modelo para tentar prever as oscilações esperadas
entre as pesquisas na véspera das eleições e o resultado final. Mais sobre isso
num próximo post.
No comments:
Post a Comment