Em todas as manifestações
populares recentemente realizadas no Brasil, muito se têm debatido sobre o
número de pessoas que foram as ruas. Eu mesmo já me manifestei sobre o tema
nesse post.
Aparentemente, a motivação para tanto debate sobre o número real de
manifestantes ocorre porque esses números são usados para estimar o apoio/oposição
da população ao Governo. Do ponto de vista estatístico, várias questões relevantes
devem ser discutidas pois estão diretamente relacionadas ao cerne da questão:
qual a validade de usar estas estimativas para avaliar a oposição/apoio popular ao
governo?
Primeiramente, vamos pensar nas diferentes
fontes de estimativas existentes: da PM, do DataFolha e dos organizadores. Porque
existe uma diferença tão grande entre estimativas provenientes de cada fontes,
como pode ser visto nesse link?
Acredito que existam 2 motivos principais: diferenças de metodologias e falta
de metodologia.
1 - PM - O objetivo da PM é estimar quantas
pessoas estão aglomeradas em um mesmo local num determinado instante de tempo.
Para a PM determinar o contingente de policiais, essa informação basta. Para isso
utilizam uma metodologia baseada em fotos aéreas, que não tem como estimar o
fluxo de pessoas no local. Ela não tem
interesse em estimar o total de pessoas que passaram pelo local, apenas o número de pessoas em um determinado momento do dia.
2 - DataFolha - O objetivo do DataFolha é
diferente. Eles querem identificar tanto o perfil dos manifestantes, quanto
identificar quantas pessoas passaram pelo local ao longo do dia (fluxo
populacional). Ao invés de tentar explicar aqui como fazem isso, estou
incluindo esse link
para um vídeo explicativo do próprio DataFolha.
3 - Organizadores - Finalmente, os
organizadores não têm metodologia alguma, apenas um desejo enorme de mostrar
que a manifestação foi um sucesso estrondoso. Eu não consegui encontrar nenhuma
explicação sobre qual metodologia os “organizadores” utilizam para estimar o
total de pessoas. Por favor me avisem se encontrarem alguma explicação.
Dessa forma, entendo que as
estimativas não são comparáveis, porém devem usualmente seguir a seguinte
lógica: a estimativa da PM representa o mínimo de pessoas que foram a
manifestação (se houver fluxo 0 de pessoas). A estimativa dos Organizadores é o
máximo imaginável, talvez até maior do que o máximo possível. E a estimativa do
DataFolha fica em algum lugar entre as duas. Mas a meu ver, a única metodologia dessas 3 que responde a pergunta sobre quantas pessoas passaram pelo movimento é a do
DataFolha.
Um segundo ponto importante é que
estamos vendo, no momento, dois movimentos ocorrerem. Um que está sendo
rotulado como favorável do Governo, porém que engloba alguns outros movimentos
como “Respeito a constituição” e “não vai ter golpe” e que as pessoas são “inocentes
até provarem o contrário”. O outro movimento é rotulado como contrário ao Governo,
que incluem pessoas que querem o fim da corrupção, ou querem uma reforma
política, ou querem o PT fora do governo e/ou na cadeia. Ou seja, ambos os movimentos não são homogêneos,
então ao tentar incluir todas as pessoas ali presentes como pró ou contra
qualquer argumento um erro estará sendo cometido. Seria algo equivalente a um
erro de mensuração, pois estamos medindo Z, mas na realidade gostaríamos de
medir Y.
O terceiro ponto, e talvez o mais
importante, é que apenas sabemos quantas pessoas foram para as ruas, porém não sabemos
qual a chance de diferentes grupos de pessoas participarem dos movimentos. Nesse link,
a reportagem do DataFolha mostra claramente que existem perfis bem diferentes
indo pra rua. Na manifestação contra o governo do dia 13/3/2016, na cidade de
São Paulo, 77% dos manifestantes tinham educação superior. Como benchmark, na
cidade de São Paulo, apenas 28% da população possui educação superior.
Parece razoável assumir que nas
manifestações "contra" o publico é mais elitizado, e nas manifestações "à favor" o público
é mais popular. Além de serem grupos distintos, parece haver um ímpeto maior de
pessoas contra o governo se manifestarem se comparado com as pessoas à favor. Nesse contexto,
existe um potencial grande para ocorrer viés de seleção. Quero dizer com isso que
se pessoas contra o governo têm uma chance maior de participar de uma
manifestação do que quem é à favor do governo, pode parecer que a primeira
causa tem mais apoio popular que a segunda, mesmo que não seja verdade.
Segue um exemplo FICTÍCIO,
extremo, apenas para ilustrar. Segundo a ABEP 30% da população é classe A/B, e
70% classe C/D/E. Para simplificar o argumento, vamos supor que as classes A/B são
contra o governo, e que as classes C/D/E são à favor. Ou seja, nesse exemplo,
estamos dizendo que 70% da população é favorável ao governo. Se em cada grupo a
chance de uma pessoa ir a manifestação for de 1%, teríamos 1,6 milhões de
pessoas nas ruas a favor do governo, e 700 mil contra. Nesse caso não haveria
problema em utilizar o tamanho dos protestos pra inferir o apoio popular, pois
as taxas de participação são as mesmas.
Porém, vamos supor que 2,5% da
classes A/B vão a manifestação, contra apenas 1% das classes C/D/E. Ou seja,
temos predisposições diferentes de participar, dependendo do fato da pessoas
ser à favor ou contra o governo. Nessas condições, as manifestações esperadas
seriam de tamanho quase idêntico (1,7 milhões contra e 1,6 milhões a favor),
porém a verdade continua sendo a mesma, de que 70% da população é favorável ao
governo. Ou seja, nesse cenário com taxas de participação diferentes, não é razoável utilizar o tamanho dos protestos para medir o apoio popular. E esse cenário me parece o mais realista hoje em dia!
No mundo real é mais difícil
fazer essa avaliação, tanto porque não sabemos o tamanho dos grupos, quanto
porque não sabemos as predisposições de cada grupo participar dos protestos. Se
soubéssemos, não seria necessário recorrer ao número de pessoas na rua para
fazer a conta. Se o objetivo é avaliar o apoio popular, então que façam
pesquisas desenhadas para isso. Usar o número de manifestantes para estimar o
apoio popular é perigoso, porque algumas suposições bem fortes estão sendo feitas!
O Movimento Brasil Livre usou na última manifestação uma tecnologia da startup israelense Store Smarts, mais sobre a metodologia, no link abaixo.
ReplyDeletehttp://veja.abril.com.br/blog/reinaldo/geral/mbl-contara-com-tecnologia-inedita-no-brasil-para-medir-publico-na-paulista/
http://www.jta.org/2016/03/15/news-opinion/israel-middle-east/israeli-startup-plays-key-role-in-measuring-brazil-protests
E com relação ao apoio ao impeachment, há uma pesquisa do próprio DataFolha.
http://www1.folha.uol.com.br/poder/2016/03/1751950-apoio-a-impeachment-de-dilma-cresce-e-chega-a-68-diz-datafolha.shtml
Obrigado Gustavo! Interessante essa nova metodologia. Eu gostaria de ver mais detalhes da metodologia para entender exatamente como foi feito o calculo do fluxo de pessoas....
ReplyDelete