Saturday, October 4, 2014

Aécio virou o jogo aos 44 do segundo tempo

Como já haviámos sugerido no post de ontem, nas 3 pesquisas publicadas hoje, o Aécio manteve sua ascensão e agora está na frente da Marina no primeiro turno. E a sua probabilidade de ir para o segundo turno, que estava ontem em 22%, hoje passou para 79%. Ou seja, essencialmente o Aécio trocou de lugar com a Marina.

As probabilidades oscilam tanto porque falta apenas 1 dia para as eleições, ou seja, não existe tempo hábil para recuperacões muito grandes, e o modelo do Polling Data sabe disso.  Uma diferença de 2 pontos percentuais faltando apenas 1 dia para as eleições implica em uma probabilidade muito maior de ir para o segundo turno do que a mesma diferença de 2 pontos faltando uma semana, por exemplo.


É muito difícil que a Marina tire essa diferença agora. Por outro lado, o Aécio tirou 4 pontos de diferença em apenas 2 dias.  Agora o único jeito de saber o resultado dessa disputa emocionante pelo segundo lugar é esperando pra ver a apuração.

2 comments:

  1. Neale, como comentou em outro post, esta foi uma das eleições mais difíceis de se fazer previsão no Brasil. Se as pesquisas dos institutos apresentam dados pouco confiáveis (até pesquisas de boca-de-urna apresentaram algumas diferenças gritantes, bem acima da "margem de erro") com um viés uniforme (posso estar equivocado, mas não lembro de ter visto discrepâncias expressivas entre os institutos nos principais estados), a vida do previsor fica complicada. Se houvesse desvios em duas pesquisas, o modelo deveria equilibrá-las, mas se ambas desviam para o mesmo lado, não como balancear e aí não dá para escapar do princípio de Gigo (garbage in, garbage out).
    No entanto, uma coisa estava me incomodando nos seus modelos nos últimos dias: eles não incorporavam a tendência (ou onda, ou "momentum" ou como quiser chamar). Aécio subia nas pesquisas, mas o modelo considerava o último dado e ponto. Como modelar isso? Não saberia dizer.
    Outra coisa que poderia ser melhorada é a forma de tratamento dos votos brancos/nulos/não sabe. Nos últimos dias acho que faria mais sentido apresentar as estimativas em termos de votos válidos do que votos totais, até para facilitar as comparações com os resultados.
    Por exemplo, a estimativa de Pezão no Rio era de 31%, com intervalo de 28% a 34%, considerando os votos totais. O resultado foi 40,6% (dos votos válidos). À primeira vista parece que a sua estimativa estava furada, só que considerando os votos totais vê-se que não (Pezão teve 33,5% dos votos totais). Ainda no Rio, Crivella teve 20,26% (válidos), 16,7% (totais) x 18% de sua estimativa (intervalo 15%-21%).
    Nos votos para presidente, Dilma teve 41,6% (37,6%) x 41% (range 38-43%), Aécio, 33,5% (30,3%) x 23% [21-26%] e Marina, 21,3% (19,3%) x 22% [range 18-24%]. Dilma e Marina dentro do range, Aécio, fora.
    Acho que um post com a comparação das estimativas e os resultado seria muito interessante e ajudaria a entender os limites do modelo e como poderia ser aperfeiçoado.
    Bom trabalho e boa sorte.
    saudacoes
    MLM

    ReplyDelete
  2. Olá MLM,

    Demorei pra responder ao seu cometário, porém já apresentei em outro post a comparação das previsões do modelo com as pesquisas.

    Eu já havia me questionado sobre como levar em conta as tendências das pesquisas no modelo de previsão. Após ler seu comentário, resolvi tentar melhorar o modelo novamente.
    Inicialmente tentei “ampliar” o modelo dentro do framework bayesiano mesmo.

    Testei diferentes tipos de modelos dinâmicos (“Linear growth model”, “Dynamic regression”, “Dynamic beta regression”,etc) mas as estimativas dos modelos ficam muito estranhas. Ainda não consegui encontrar uma solução que resolva a questão citada por você. Acho que os modelos que eu testei não são identificáveis.

    Se eu não conseguir resolver dessa forma, penso em trabalhar com as estimativas num segundo estágio, por exemplo com um modelo auto-regressivo sobre as proprias estimativas do modelo.

    Quando conseguir um resultado interessante, posto aqui no blog.

    ReplyDelete