O blog do PollingData ficou bastante tempo parado
após o final das eleições. Mas queremos manter o blog vivo, então após essa
parada estendida, voltaremos a publicar posts sobre estatística, pesquisas
eleitorais e outros temas de interesse. Começaremos com uma breve discussão
sobre a Lei de Benford.
Logo após as eleições algumas análises foram
publicadas onde aplicaram a Lei de Benford ao número de votos da Dilma em cada
município. A Lei de Benford é comummente utilizada para detectar fraudes em
sequências de números aleatórios. Se os números analisados não são aleatórios,
não respeitarão a Lei de Benford. Assim, a não conformidade com essa Lei é
vista como evidência de fraude.
Resolvemos falar sobre esse assunto agora porque acabou de
circular um email discutindo o tema na lista da ABE. Os dois blogs mais citados
que discutem o assunto foram o Análise
Real e o Saturno
V . O segundo link um pouco mais informativo. Porém em ambos faltou
enfatizar se as condições necessárias para a validade da Lei estão sendo
respeitadas. Ou seja, existe evidência de que a Lei não se aplica ou de que
houve fraude?
No artigo
fica muito claro sob quais condições a Lei é aplicável. Baseado nesse artigo e
nos dois blogs mencionados, enviei um email para a lista da ABE com a minha
interpretação da análise. Segue o email abaixo.
“Acho que a
conclusao e' que o numero de votos por municipio de um estado nao precisa
seguir a Lei de Benford, ou seja, a evidencia e' de que a lei nao se aplica
nesse caso, e nao de fraude.
O motivo que o voto
em um estado nao precisa seguir a Lei de Benford se da porque 2 condicoes
importantes para que a proximacao seja razoavel nao sao satisfeitas:
1- o numero
de municipios em cada estado e' relativamente pequeno, ou seja, a amostra e' pequena,
e a Lei de Benford e' "assintotica"...
2- os numeros sendo
analisados (votos nesse caso) tem que percorrer varias ordens de grandeza para
que a Lei de Benford seja aplicavel. E' preciso, por exemplo, que os numeros
tenham um range de pelo menos 10^1 ate 10^7. Se assumem valores
menores do que 10^7 a aproximacao e' ruim. Ou seja, qualquer estado, com a
excecao de Sao Paulo, nao satisfaz essa condicao.
Por outro lado, se
analisarmos todos os municipios do Brasil, sem olhar cada estado separadamente,
a lei deve ser aplicavel, porque teremos uma amostra de mais de 5500 municipios
e os votos em um candidato devem se aproximar do range recomendado. Utilizando
os dados que o Carlos Cinelli (Análise
Real) disponibilizou no blog, fiz essa
comparacao entre a Lei (% esperado) e os votos para a Dilma por cidade (%
observado) - vejam na tabela abaixo. Acho que esta muito proximo, pelo menos
pra mim nao parece ter indicio de fraude por esse criterio. Mas um estudo mais
serio olharia muitos outros criterios relevantes....”
Voto
Dilma
(Primeiro Digito) |
Freq.
Observada
|
Perc.
Observado
|
Perc.
Benfords Law
|
1
|
1678
|
30%
|
30%
|
2
|
1058
|
19%
|
18%
|
3
|
718
|
13%
|
12%
|
4
|
473
|
8%
|
10%
|
5
|
423
|
8%
|
8%
|
6
|
388
|
7%
|
7%
|
7
|
290
|
5%
|
6%
|
8
|
320
|
6%
|
5%
|
9
|
267
|
5%
|
5%
|
No comments:
Post a Comment