Thursday, October 29, 2015

Performance do PollingData na Argentina - Turno 1

PollingData está acompanhando as eleições Argentinas desde agosto desse ano, e nesse último domingo os argentinos foram as urnas. O resultado da eleição pode ser visto nesse link (em espanhol). Na tabela abaixo está o comparativo entre a previsão final do PollingData e a contagem dos votos. O Erro Absoluto Médio foi de 2,7%. Por esse critério, essa foi a pior previsão do PollingData desde Agosto 2014, quando o site entrou no ar.



Como já foi discutido nesse post, as eleições Argentinas de 2015 são o maior desafio já enfrentado pelo site por causa do cenário eleitoral instável, da baixa quantidade de pesquisas divulgadas e da falta de informação sobre as pesquisas publicadas.


Independentemente desses desafios, o PollingData continuará a acompanhar as eleições Argentinas, que pela primeira vez em sua história serão decididas no segundo turno. Acesse o site PollingData agora para ver as chances de vitória dos dois candidatos que estão no segundo turno!

Tuesday, October 20, 2015

Performance do PollingData nas eleições canadenses

PollingData também estava acompanhando as eleições canadenses, que ocorreram ontem. O resultado da eleição pode ser visto nesse link (em inglês). Na tabela abaixo está o comparativo entre a previsão final do PollingData e a contagem dos votosO Erro Absoluto Médio foi de 1,14%. Por esse critério a previsão não foi tão boa quanto na Suíça 2015 ou no Brasil 2014, porém ainda foi uma ótima previsão.
.

Monday, October 19, 2015

Performance do PollingData na Suiça

O PollingData estava acompanhando as eleições suíças, que ocorreram ontem. O resultado da eleição pode ser visto nesse link (em alemão). Na tabela abaixo está o comparativo entre a previsão final do PollingData e a contagem dos votos. Utilizando qualquer medida de qualidade da previsão, fica evidente que a performance do PollingData foi muito boa, principalmente se considerarmos o número bem reduzido de pesquisas disponíveis. O Erro Absoluto Médio foi de 0,5%, similar ao observado no segundo turno das eleições presidenciais brasileiras em 2015.




Hoje estão sendo realizadas as eleições canadenses, outra eleição sendo acompanhada pelo PollingData. Amanhã divulgaremos o comparativo final também dessa eleição!

Tuesday, October 13, 2015

Fraude nas eleições presidenciais?

Na lista da ABE circulou alguns emails discutindo a possibilidade de fraudar as eleições com o uso das urnas eletrônicas, e também alguns emails discutindo se seria possível detectar essa fraude usando as pesquisas eleitorais como referência. O artigo citado inicialmente como referência sobre as fraudes foi esse. Segue abaixo minha contribuição para a discussão.

Acho que avaliar a existência de fraude nos resultados das eleições presidenciais apenas com dados secundários é bastante difícil. Teríamos que fazer diversas suposições, essencialmente inferindo que diferenças observadas maiores do que as diferenças esperadas são por causa de fraude – e esse é um terreno bem perigoso!

Mas se, apesar dessa ressalva, o meu objetivo fosse avaliar a existência ou não de fraude, eu usaria algum modelo baseado nas pesquisas eleitorais, como o do PollingData, porém também utilizaria outras fontes de informação existentes, como:

1- Votações históricas no nível da zona/seção eleitoral. Essas informações podem ser usadas tanto pra modelar/prever o resultado da eleição em cada unidade geográfica, permitindo avaliar se a votação observada em cada seção está coerente com o esperado. Combinando essas informações com os dados da malha de setores censitários, por exemplo, podemos ter uma modelo bastante interessante para prever o voto que leva em consideração também a renda dos eleitores.

2- Algum model estrutural, como o modelo de aprovação do PollingData. Com esse modelo (que foi estimado utilizando mais de 150 eleições de mais de 20 países), é possível estimar a probabilidade de vitória de um candidato dado a aprovação do atual governante e o tipo do  candidato do governo para a próxima eleição (re-eleição ou sucessão).

3- Também podemos usar a informação de votação em outros cargos políticos por zona/seção eleitoral.  Nesse nível geográfico, deve haver uma correlação alta entre votos pra presidente e outros cargos, que também pode ser bastante informativa para avaliar a existência de fraude na eleição presidencial. Talvez essa seja a informação mais importante se a fraude ocorrer apenas para o cargo para presidente, que parece ser o cenário mais plausível.

4- Além dos modelos espaço e/ou temporais mencionados acima, podemos usar algum modelo do tipo usado pelo Mignon em nesse artigo. As suposições são mais fortes, mas pode ser útil. Talvez esse modelo possa ser generalizado, escolhendo mais de uma zona eleitoral, de forma a representar todos os estados e/ou municípios.

Se todas essas fontes de informação apontarem na mesma direção, seria um forte indício de algo fraudulento. Porém se apenas algumas delas acusarem algo errado, seria difícil fazer um caso a favor de fraude, mesmo que ela existisse.


Friday, October 9, 2015

O site PollingData está de cara nova...

O site PollingData está de cara nova, a interface com o usuário foi totalmente re-modelada. Além disso, agora temos muito mais conteúdo: estamos acompanhando as eleições da Argentina, Suíça, Espanha e Canadá. 

Vale a pena conferir!

Thursday, October 8, 2015

Pesquisas eleitorais e as eleições presidenciais Argentinas de 2015

Em julho desse ano, o PollingData começou a acompanhar as eleições presidenciais Argentinas de 2015. Além da dificuldade com o idioma, existem diversos fatores metodológicos que se mostraram um desafio para acompanhar essas eleições. Nesse post, vou falar sobre esses desafios.

Em primeiro lugar, as eleições Argentinas tem algumas diferenças importantes se comparado ao Brasil. Lá existem eleições primárias, e essas são obrigatórias. Por um lado, as primárias fazem com que os eleitores fiquem mais familiarizados com os candidatos muito cedo no ciclo eleitoral. Por outro lado, acredito que o gasto público com as eleições deve ser enorme, visto que na Argentina também existem primeiro e segundo turnos obrigatórios.

Outra diferença interessante nos dois processos eleitorais é que, na Argentina, existem dois cenários nos quais um candidato pode ganhar as eleições presidenciais no primeiro turno. São eles:  1) se um candidato tiver mais de 45% dos votos válidos e 2) Se o candidato com mais votos tiver pelo menos 40% dos votos válidos e pelo menos 10% de votos a mais que o segundo colocado. Calcular essas probabilidades de vitória foi um desafio interessante.

As outras dificuldades encontradas estão relacionadas a aspectos metodológicos das pesquisas e também a falta de informação. Por exemplo, no site apenas calculamos as probabilidades dos candidatos irem para o segundo turno ou ganharem no primeiro turno. Não conseguimos calcular a probabilidade de vitória (não condicional), pois não parecem existir pesquisas fazendo simulações sobre o segundo turno.

Mas sem sombra de dúvida, a maior dificuldade têm sido encontrar informações mais detalhadas sobre as pesquisas eleitorais. Encontrar pesquisas publicadas já se mostrou um desafio. Tenho recorrido, essencialmente, a três fontes de informação: wikipedia, riojapolitica e ae. Mas mesmo quando encontro quando encontro pesquisas novas, tenho muito dificuldade de descobrir informações básicas sobre a pesquisa, como data de coleta dos dados ou até tamanho da amostra. Como referência, em 43% das pesquisas utilizadas pelo PollingData o tamanho da amostra não é conhecido. Também é muito difícil saber se os resultados das pesquisas se referem a votos válidos ou totais. E essa informação é especialmente importante para calcular as probabilidades de vitória dos candidatos. 

Para muitos, o Brasil já é considerado um país com pouca informação disponível sobre as eleições (poucas pesquisas + poucos institutos + pouco informação metodológica), o que o torna um país onde é difícil prever o resultado das eleições. Essa dificuldade pode ser ainda maior na Argentina, onde existem ainda menos pesquisas e informações metodológicas sobre as mesmas.  Por outro lado, muito mais institutos de pesquisas publicando resultados de pesquisas no nível nacional (22 até o momento). Esse é um fator relevante pois permite que os vieses metodológicos dos institutos sejam estimados com maior precisão (supondo que não são todos na mesma direção – publicarei um post sobre esse tema num futuro próximo).


Agora resta esperar o primeiro turno das eleições para ver a performance das pesquisas e do PollingData na previsão dos resultados.