Thursday, September 4, 2014

Todos os modelos estão errados, porém alguns são úteis....mas nem sempre!

Não faz nem uma semana que lançamos o PollingData e já faremos uma alteração significativa no conteúdo do site. Nesses poucos dias ficou evidente que incluirmos as probabilidades de vitória dos candidatos em dois cenários diferentes (‘atual’ e ‘no dia da eleição’) acabou gerando muitas dúvidas nos nossos visitantes.

Tentamos explicar as diferenças em alguns posts, mas a dúvida continua lá. Pra acabar com a confusão de vez, vamos seguir o princípio de Ockham: viva a parcimônia! Com o objetivo de simplificar o site e a interpretação das probabilidades, a partir de hoje iremos manter apenas um único cenário.

Também não iremos mais levar em conta os resultados de eleições passadas nos cálculos das probabilidades de ocorrência dos eventos. Porquê? Dois motivos principais:

  1. Novamente, para simplificar a interpretação das probabilidades.
  2. Porque acreditamos que, para essa eleição específica, as eleições passadas não são muito informativas. 

O segundo ponto merece uma explicação mais detalhada. Como a história da democracia no Brasil é relativamente nova, não tivemos muitas eleições. Por esse motivo, para construir um modelo baseado em eleições passadas, tivemos que recorrer a eleições de outros países. Por um lado aumentamos bastante a base de eleições, tornando o modelo resultante mais robusto. Por outro lado, reduzimos muito as opções de variáveis que podem ser usadas, pois cada país utiliza diferentes indicadores.  

O ponto é: utilizamos a aprovação do candidato do governo no modelo, porém a variável que realmente importa é o “desejo de mudança” da população. Essas variáveis são altamente correlacionadas, “caminham juntas” no geral. Porém nesse ano, no Brasil, não é o que estamos vendo. A aprovação da Dilma tem se mantido razoavelmente estável , porém o desejo de mudança tem aumentado. Ou seja, ao utilizar aprovação acreditamos que estamos super-estimando a probabilidade de vitória da Dilma. Citando George Box (um estátistico bem famoso): “todos os modelos estão errados, porém alguns são úteis”. O modelo que estávamos utilizando já se mostrou útil em diversas eleições mundo afora (Nigéria, Venezuela, Estados Unidos, França e Brasil pra citar alguns países) , porém não acreditamos que seja tão confiável para a eleição presidencial brasileira de 2014.

Além disso, claramente essa eleição é atípica, principalmente por causa da morte do candidato Eduardo Campos. Nesse ciclo eleitoral, consideramos que seja melhor utilizar apenas as pesquisas divulgadas na mídia para calcular as chances de vitória de cada candidato.


1 comment:

  1. Não pode deixar o segundo modelo disponível em algum outro lugar?

    ReplyDelete