Thursday, August 7, 2014

Polling Data

Esse é o meu primeiro blog.

Como sou estatístico e tenho muito interesse em pesquisas eleitorais, esse será o tema desse blog. Esse blog fará parte do site PollingData.com.br, onde estou fazendo previsões de algumas eleições brasileiras. Antes de entrar em mais detalhes sobre o site vou primeiro contar um pouquinho do meu histórico, pra vocês entenderem como cheguei até aqui: trabalhei por 5 anos na Ipsos Brasil, onde tive muito contato com pesquisas eleitorais. Meu primeiro projeto nesse emprego foi um tracking diário para as eleições presidênciais de 2002. Fazíamos tudo internamente,a análise, as amostras, os questionários, os discos, as cotas. Conheci um pouco de todos os lados da pesquisa, do estatístico, do analista, do entrevistador, do gerente de projeto, do campo.

 Ciro Gomes sobe, Ciro Gomes desce, trabalha final de semana aqui e ali, stress com toda pesquisa publicada, e dessa forma tumultuada, a eleição chegou e foi tudo bem.  Fiz bons amigos nesse primeiro ano. Aprendi que uma equipe focada, e companheira, faz muita diferença pra que um trabalho seja bem feito. Depois dessa pesquisa, vieram muitas outras, municipais, estaduais, nacionais, internacionais, sempre muito intensas. Foi uma experiência muito importante pra mim. Principalmente porque aprendi que a teoria é diferente da prática, especialmente no que diz respeito as pesquisas de opinião pública. Os  institutos de pesquisa tendem a se preocupar principalmente com o lado prático da pesquisa, já os acadêmicos tendem a se preocupar apenas com a teoria. Ficou claro pra mim que não é possível fazer pesquisas eleitorais de qualidade ignorando a teoria, porém também não é possível fazê-las sem considerar o lado prático/logístico. Citando uma frase do filósofo John Dewey: "A prática sem a teoria é cega. E a teoria sem a prática é vazia".

Com isso em mente, resolvi voltar a estudar, e fui fazer Doutorado em Estatística na USP, com o foco em amostragem. Por mais incompatível que pareça, eu queria algo bem prático. Não queria mais ser cego, mas também não queria ser vazio. Não queria sair do doutorado com aquela sensação de que sei muito sobre nada. O título da minha tese foi “Avaliação metodológica das pesquisas eleitorais brasileiras”. Como um membro da banca disse, talvez esse título nao faça justiça ao conteúdo. O que eu tentei fazer foi uma justificativa teórica para o tipo de amostragem feito pela maioria dos institutos do Brasil, a qual eu chamo de Amostragem probabilística com Cotas. Como quase ninguém lê uma tese de doutorado, vou resumir em algumas linhas minha conclusão mais importante: não é possível fazer uma comparação justa entre a amostragem probabística teórica e a amostragem na prática, sem considerar a probabilidade de uma pessoa responder. Quem discute o tema e não fala da taxa de resposta, ou não sabe muito bem do assunto, ou é mal intencionado. Só pra enfatizar: a probabilidade de uma pessoa responder é o que faz o link entre a teoria e a prática. Discutirei mais esse tema em um outro post, provavelmente em varios outros posts.

Logo depois que defendi minha tese de doutorado, fui trabalhar para a Ipsos novamente, mas dessa vez nos EUA. Cheguei lá achando que sabia bastante sobre pesquisa eleitoral. Doce ilusão. Quase todo o meu conhecimento no assunto era sobre pesquisas pessoais, domiciliares, como se faz aqui no Brasil. Lá, esse modo de pesquisa não existe. Fazem pelo correio, pelo telephone (fixo e celular), online, multi-modo, mas não pessoal. Tive que aprender muita coisa nova. Tenho muita coisa pra compartilhar com vocês sobre essa experiência, mas nesse post vou focar em uma das coisas que mais me impressionaram: os sites agregadores de pesquisa, como o Pollster do Mark Blumenthal, o 538 do Nate Silver e o Real Clear Politics. Nesses sites, todas as pesquisas de todos os institutos são agregadas, permitindo que tenhamos uma estimativa mais real da intenção de voto de um determinado candidato em um particular momento do ciclo eleitoral.

Depois de estar um ano por lá, começou o ciclo eleitoral de 2012, re-eleição do Obama. E durante esse projeto, percebi que algo havia mudado: não ficava mais estressado com toda nova pesquisa publicada. Percebi que se o meu objetivo era acertar o resultado da eleição, eu deveria utilizar toda a informação disponível. E sem dúvida, uma nova pesquisa era informação valiosa! E gratuita!  Cada nova pesquisa me diz mais sobre a metodologia e o viés do instituto de pesquisa, sobre o cenário atual, sobre a dinâmica eleitoral.

Quando voltei ao Brasil em 2013, tinha na cabeça que gostaria de fazer algo parecido com o que os sites agregadores fizeram nos EUA. Queria unir os gráficos interativos do Pollster.com com os modelos de previsão utilizados no fivethirtyeight.com. Queria prever os resultados das eleições brasileiras utilizandos modelos ajustados ao Brasil. Queria ajudar a difundir as pesquisas eleitorais, e mostrar que existem institutos que fazem pesquisas com mais/menos qualidade, e que uma pessoa informada deve dar a pesquisa do instituto X o peso que ela merece (como descobrir esse peso? Acompanhe futuros posts do PollingData.com.br). Mostrar também que, independente da pesquisa ser probabilística ou não (ou qualquer outra coisa no meio do caminho), é informação nova, e útil, ao contrário de alguns críticos que dizem que se uma pesquisa nao pode ser feita exatamente como manda a teoria (teoria sem probabilidade de resposta), então não devemos fazer pesquisas eleitorais, pois elas são inúteis.

Inicialmente tentei fazer PollingData.com.br com o auxílio de um web designer, mas tive muita dificuldade de comunicação com ele, o resultado não ficava como eu queria, e o processo era lento. Foi ai que descobri as bibliotecas Shiny e rCharts no R. Isso me permitiu publicar o PollingData.com.br com a cara que eu queria, com os gráficos que queria e principalmente, com a informação que eu queria. O que vocês estão vendo agora é a primeira versão do PollingData.com.br. Ainda não temos muitos modelos publicados, mas o plano é ir atualizando os modelos que já estão publicados, e também incluir novas eleições, principalmente de governadores. Um resumo da metodologia utilizada nos modelos está na aba “Metodologia”. Além das previsões, meu plano é utilizar o PollingData.com.br como um veículo para discutir estatística, amostragem e pesquisas eleitorais de forma geral. Quem tiver interesse, dúvidas, críticas e sugestões, por favor publique-as no Blog.

Neale Ahmed El-Dash
neale.eldash@sleekdata.com.br


No comments:

Post a Comment