Thursday, February 12, 2015

A Lei de Benford se aplica aos votos municipais no nível estadual?

O blog do PollingData ficou bastante tempo parado após o final das eleições. Mas queremos manter o blog vivo, então após essa parada estendida, voltaremos a publicar posts sobre estatística, pesquisas eleitorais e outros temas de interesse. Começaremos com uma breve discussão sobre a Lei de Benford.

Logo após as eleições algumas análises foram publicadas onde aplicaram a Lei de Benford ao número de votos da Dilma em cada município. A Lei de Benford é comummente utilizada para detectar fraudes em sequências de números aleatórios. Se os números analisados não são aleatórios, não respeitarão a Lei de Benford. Assim, a não conformidade com essa Lei é vista como evidência de fraude.

Resolvemos falar sobre esse assunto agora porque acabou de circular um email discutindo o tema na lista da ABE. Os dois blogs mais citados que discutem o assunto foram o Análise Real e o Saturno V . O segundo link um pouco mais informativo. Porém em ambos faltou enfatizar se as condições necessárias para a validade da Lei estão sendo respeitadas. Ou seja, existe evidência de que a Lei não se aplica ou de que houve fraude?

No artigo fica muito claro sob quais condições a Lei é aplicável. Baseado nesse artigo e nos dois blogs mencionados, enviei um email para a lista da ABE com a minha interpretação da análise. Segue o email abaixo.

“Acho que a conclusao e' que o numero de votos por municipio de um estado nao precisa seguir a Lei de Benford, ou seja, a evidencia e' de que a lei nao se aplica nesse caso, e nao de fraude. 

O motivo que o voto em um estado nao precisa seguir a Lei de Benford se da porque 2 condicoes importantes para que a proximacao seja razoavel nao sao satisfeitas: 

1-  o numero de municipios em cada estado e' relativamente pequeno, ou seja, a amostra e' pequena, e a Lei de Benford e' "assintotica"...
2- os numeros sendo analisados (votos nesse caso) tem que percorrer varias ordens de grandeza para que a Lei de Benford seja aplicavel. E' preciso, por exemplo, que os numeros tenham um range de pelo menos 10^1  ate 10^7.  Se assumem valores menores do que 10^7 a aproximacao e' ruim. Ou seja, qualquer estado, com a excecao de Sao Paulo, nao satisfaz essa condicao.

Por outro lado, se analisarmos todos os municipios do Brasil, sem olhar cada estado separadamente, a lei deve ser aplicavel, porque teremos uma amostra de mais de 5500 municipios e os votos em um candidato devem se aproximar do range recomendado. Utilizando os dados que o Carlos Cinelli (Análise Real) disponibilizou no blog, fiz essa comparacao entre a Lei (% esperado) e os votos para a Dilma por cidade (% observado) - vejam na tabela abaixo. Acho que esta muito proximo, pelo menos pra mim nao parece ter indicio de fraude por esse criterio. Mas um estudo mais serio olharia muitos outros criterios relevantes....”

Voto Dilma
(Primeiro Digito)
Freq. Observada
Perc. Observado
Perc. Benfords Law
1
1678
30%
30%
2
1058
19%
18%
3
718
13%
12%
4
473
8%
10%
5
423
8%
8%
6
388
7%
7%
7
290
5%
6%
8
320
6%
5%
9
267
5%
5%