Tuesday, February 2, 2016

Prevendo o resultado das eleições primárias americanas

Ontem foi realizada a primeira eleição primária americana de 2016, no estado de Iowa. O PollingData acompanhou essa eleição. A projeção feita pelo site não foi muito boa: na primária Democrata, acertamos o vencedor, porém com uma margem maior do que de fato ocorreu; nas primárias Republicanas, o candidato Cruz  que estava em segundo lugar com uma estimativa de 23 % acabou ganhando com 27,7% dos votos, enquanto o Trump que liderava com 27% perdeu com 24,3%.

Para visualizar melhor como foram essas corridas, acesse o site, e no menu principal selecione Eleições 2016 >> Estados Unidos >> Primarias. Lá apresentamos um gráfico de tendências que mostra toda a dinâmica eleitoral de acordo com as pesquisas, e também o resultado final da eleição. É  um ótimo retrato do que ocorreu!

Nesse post não vamos discutir a performance do PollingData e das pesquisas eleitorais. O objetivo é discutir sobre as principais dificuldades que existem para prever o resultado das eleições primárias americanas. Em alguns aspectos, as primárias são similares ao primeiro turno das eleições brasileiras. Muitos eleitores desconhecem os candidatos e apenas se decidem na véspera da eleição, fazendo com que grandes variações entre os resultados das pesquisas na véspera do pleito e o resultado da eleição sejam comuns.

Porém existe uma diferença muito grande. O voto nas eleições primárias não é obrigatório. E o percentual de pessoas elegíveis que de fato votam é muito pequeno, tipicamente variando entre 10% e 20%. Esse ano em Iowa, por exemplo, o percentual de pessoas que votaram foi de 15,7%, um recorde positivo. Na eleição anterior havia sido de apenas 6,5%.

Qual a relevância desse percentual de voto baixo?  Enorme! Para se fazer uma previsão sobre o resultado da eleição, é necessário antes prever quais respondentes irão votar. Eleitores que votam frequentemente usualmente votam de forma diferente daqueles que têm poucas chances de votar. E no caso das primárias, essas diferenças usualmente são maiores ainda.

O problema é importante para as pesquisas de opinião porque é comum pessoas que declararam ter uma grande chance de votar não votarem. E quando isso ocorre, o erro de previsão das pesquisas aumenta. Por isso os institutos desenvolveram, ao longo das últimos décadas, diversos modelos para prever a chance de voto de cada respondente da pesquisa. Esses modelos são chamados de “Likely Voter Models”. Para quem quer entendê-los melhor, recomendo esse link, que discute tanto os modelos quanto os erros cometidos por eles.

Uma etapa essencial na construção desses modelos é definir qual será o ponto de corte a partir do qual o respondente é classificado como “provável eleitor”. Nas eleições primárias,  muitas vezes não é possível encontrar um bom corte. Isso ocorre porque é comum ocorrerem grandes concentrações de respondentes nos extremos da escala de probabilidade de voto. Para uma discussão sobre tema, veja esse link. Além disso, por causa da baixa incidência de voto nas primárias, usualmente o estatístico/analista têm que descartar uma grande parte da amostra retirando quem têm pouca chance de votar, tornando as pesquisas para essas eleições mais caras e com um grau de precisão baixo.


Apesar das dificuldades, o PollingData continuará acompanhando as eleições primárias. Estamos testando diferentes formulações do nosso modelo para tentar prever as oscilações esperadas entre as pesquisas na véspera das eleições e o resultado final. Mais sobre isso num próximo post.

No comments:

Post a Comment