Thursday, December 8, 2016

Na Copa do Brasil, é mais vantajoso jogar o primeiro ou o segundo jogo em casa?

O site PollingData (http://www.pollingdata.com.br/) recentemente passou a acompanhar alguns campeonatos de futebol do Brasil, porém meu interesse por futebol é bem mais antigo. Uma das minhas dúvidas mais antigas que combinam futebol e estatística está relacionada a campeonatos de futebol onde o número de gols fora de casa é utilizado como critério de desempate.

No geral, parece haver um consenso de que numa disputa de ‘mata-mata’ (onde dois times fazem um jogo em casa e um jogo fora), jogar o último jogo em casa é mais vantajoso. Porém no contexto onde o gol fora de casa vale mais, será que ainda é mais vantajoso jogar o segundo jogo em casa? Minha sensação é de que dessa forma o resultado do segundo jogo acaba sendo distorcido, e que talvez seja melhor jogar o primeiro jogo em casa, sem as distorções causadas pelos gols fora de casa no jogo anterior. Sem contar que no segundo jogo, quem tem a vantagem de fazer “gols fora de casa” é o time que jogou o primeiro jogo em casa.

Para verificar se de fato jogar o segundo jogo é mais vantajoso nesse contexto, decidir analisar os resultados de todos os jogos de todas as Copas do Brasil disputadas até hoje (28 campeonatos disputados entre 1989 e 2016). Baixei todos os dados do site ogol utilizando a biblioteca rvest do R, que é muito boa e simples de usar. Minha maior dificuldade foi que o site começou a não permitir meu acesso, desconfiando (com razão) que não fosse um humano, e sim um programa que estava acessando os dados J

Hoje em dia a Copa do Brasil conta com 86 times, de todas as divisões do futebol brasileiro, então claramente existe uma diferença muito grande de qualidade entre os times. Tanto que na primeira fase, os times de menor expressão jogam o primeiro jogo em casa, e se perderem por 2 gols de diferença ou mais em casa, são eliminados sem realizar o jogo de volta.

Como não tenho muito tempo para fazer essa análise, porém quero evitar que minhas estimativas de chance de vitória tenham seus efeitos confundidos por causa do diferencial técnico entre os times, vou tomar o cuidado de analisar separadamente os jogos realizados a partir das oitavas de final. Estou supondo que a partir dessa fase, os times classificados têm um nível técnico mais similar. Claro que existem outros fatores que também podem influenciar os resultados, como cartões, expulsões, dois times da mesma cidade, outros campeonatos ocorrendo em paralelo, porém esses fatores não serão controlados aqui.

Na tabela abaixo, calculei o percentual de vezes que os times jogando em casa o primeiro ou o segundo jogo venceram a disputa, distinguindo entre as diferentes fases do campeonato. Fica evidente que ao analisar todas as fases conjuntamente, jogar o segundo jogo em casa é, em média, duas vezes melhor do que jogar o primeiro jogo em casa. Mesmo olhando apenas as fases finais (com exceção da grande final), com os times mais parelhos, a vantagem ainda é de jogar a partida final em casa, porém em grau bem menor. De cada 17 duelos, apenas 1 a mais será ganho pelo time jogando a última partida em casa.





Talvez a estatística mais interessante da tabela seja relacionada a final do campeonato. Na disputa final, não esquecendo que temos uma amostra menor, a relação parece ser ao contrário. Ou seja, na final é mais vantajoso jogar a primeira partida em casa. Por mais que apenas esse resultado vá de encontro ao que eu esperava, é difícil encontrar uma explicação para essa inversão apenas nessa disputa. Talvez os times visitantes entrem em campo mais cautelosos no primeiro jogo e façam menos gols fora de casa, dando dessa forma uma vantagem para quem joga a primeira em casa.Talvez seja por causa da pressão do time que joga em casa*. Independente de qual hipótese é correta, os dados mostram que no jogo de ida das finais, 53% das vezes o time visitante não fez gol. Um percentual bem alto se comparado com a média geral do campeonato, considerando todas as fases, que é de apenas 28%.



Para finalizar, me parece interessante apresentar uma tabela (acima) com as chances de vitória do time que joga o primeiro jogo em casa dependendo do número de gols marcados no primeiro jogo (tanto pelo time de casa quanto o visitante).  Nessa tabela estamos considerando apenas as fases finais do campeonato. Se de fato na final os times visitantes no primeiro jogo tendem a ser mais conservadores, e não fazerem gols, vemos que a probabilidade de vitória para os mandantes do primeiro jogo,  quando não sofrem gols,  é de 54%.

Fica claro dessa análise que a minha hipótese inicial, de que é mais vantajoso jogar o primeiro jogo em casa, não é verdade na maioria dos casos, com exceção da grande final.  Por isso que estatística é tão interessante, podemos empiricamente compreender o mundo em que estamos, testar hipóteses e aprender com isso. Na minha próxima conversa de boteco, meu discurso sobre o 'gol fora de casa'  será outro!

*Vale ressaltar que em 2015 o regulamento da Copa do Brasil foi alterado, e a partir desse ano gol fora de casa não é mais critério de desempate na final. Esse fato poderia afetar os resultados e ajudar a explicar porque na final os resultados parecem invertidos, porém dos 28 embates na base de dados, apenas os dois últimos ocorreram com as novas regras.








Friday, November 25, 2016

PollingData agora está prevendo o resultado do Campeonato Brasileiro de 2016

O site PollingData (http://www.pollingdata.com.br/) acabou lançar uma novidade: estamos prevendo os resultados dos jogos do Brasileirão 2016 – Série A. O campeonato está quase no final, mas como as eleições americanas e brasileiras terminaram, decidimos testar nossos modelos de previsão em outros eventos.

Estamos usando um modelo hierárquico bayesiano (baseado na Poisson bivariada). Por enquanto o modelo é bem simples, mas a forma como foi construído permite que o modelo incorpore facilmente novas informações para prever os resultados dos jogos, como por exemplo levar em conta que um time está numa trajetória ascendente/descendente (aguarde por futuras atualizações).

Com o nosso modelo calculamos as chances de ganhar o campeonato, de classificação para a Libertadores, de rebaixamento, além das probabilidades de vitória/empate/derrota para todos os jogos que ainda não foram realizados. Também incluímos um gráfico iterativo, que permite comparar a trajetória de diferentes times ao longo do campeonato. O site será atualizado ao final de todas as rodadas, então não deixe de acessar o site regularmente para ver quais times ganharão na próxima rodada!


Se você tem interesse em previsões de campeonatos de futebol, recomendamos o site Chance de Gol, do Marcelo Arruda, que é especialista no assunto e acompanha os principais campeonatos do mundo. Seu site está no ar há mais de 10 anos, e é a fonte que nós consultamos para validar o modelo de previsão de futebol do PollingData. Outra referência interessante é o site Previsão Esportiva, do pessoal de São Carlos.

Friday, October 14, 2016

PollingData acompanhando o segundo turno das eleições municipais de 2016

Hoje o site PollingData (http://www.pollingdata.com.br/) começa oficialmente a acompanhar as pesquisas do segundo turno das eleições municipais de 2016. Nesse momento estamos acompanhando 40 eleições municipais, com mais de 170 pesquisas do segundo turno incluidas em nosso acervo. 

Todas as eleições sendo acompanhadas, as previsões, as probabilidades de vitória e os gráficos com os vieses dos institutos estão no menu “Eleições 2016 > Brasil” que pode ser acessado diretamente pelo link http://www.pollingdata.com.br/#br2016. No Dashboard do site, na aba “Eleições 2016 (Brasil)”, disponibilizamos uma tabela resumo com os resultados de todas as capitais.


Também atualizamos as previsões do resultado da eleição americana de 2016. Agora estamos acompanhando pesquisas de todos os 51 estados, além das pesquisas nacionais. No Dashboard do site, na aba “Eleição Geral (EUA)”, disponibilizamos uma tabela resumo com os resultados de todos os estados. Para ver detalhes das previsões, acesse o link http://www.pollingdata.com.br/#us2016G.

Friday, October 7, 2016

Incluindo o resultado do primeiro turno das eleições municipais de 2016

O site PollingData (http://www.pollingdata.com.br/) foi atualizado com o resultado do primeiro turno das eleições municipais de 2016. Agora você pode ver em um único gráfico toda a história de cada eleição, com todas as pesquisas publicadas e também com o resultado do pleito. Os gráficos atualizados encontram-se no menu “Eleições 2016 > Brasil” que pode ser acessado diretamente pelo link  http://www.pollingdata.com.br/#br2016.
Na semana que vem, faremos uma avaliação da performance das pesquisas eleitorais no primeiro turno, e as pesquisas do segundo turno também serão incluídas no site. Não deixe de acessar o site para conferir!

Sunday, October 2, 2016

Previsão atualizada do primeiro turno das eleições municipais de 2016

O site PollingData (http://www.pollingdata.com.br/) foi atualizado com as pesquisas eleitorais mais recentes das seguintes cidades: São Paulo, Rio de Janeiro, Belo Horizonte, Recife, Fortaleza, Salvador, Curitiba, Goiânia, Belém, João Pessoa, Vitória, Campinas, Ribeirão Preto, Santos e Feira de Santana.

Acesse o site para ver a previsão atualizada do resultado da eleição na sua cidade. Nesse momento estamos acompanhando 113 eleições municipais, com mais de 420 pesquisas do primeiro turno incluídas em nosso acervo.

Saturday, October 1, 2016

Prevendo o primeiro turno das eleições municipais de 2016

O site PollingData (http://www.pollingdata.com.br/) foi atualizado com as pesquisas eleitorais mais recentes. Acesse o site para ver a previsão do resultado da eleição na sua cidade.

Nesse momento estamos acompanhando 113 eleições municipais, com mais de 410 pesquisas do primeiro turno incluídas em nosso acervo. Para facilitar o acesso as previsões, estamos disponibilizando duas formas diferentes de visualização dos resultados das capitais: uma através de um mapa interativo e outra através de uma tabela. Ambos os formatos podem ser encontrados no Dashboard do site.

 Além disso, para todas as eleições sendo acompanhadas, as previsões, as probabilidades de vitória, os gráficos com os vieses dos institutos estão no menu “Eleições 2016 > Brasil” que pode ser acessado diretamente pelo link  http://www.pollingdata.com.br/#br2016.

Na semana que vem, as pesquisas do segundo turno também serão incluídas no site. Não deixe de acessar o site para conferir!

Monday, September 12, 2016

PollingData está acompanhando as eleições municipais de 2016

Hoje o site PollingData (http://www.pollingdata.com.br/) começa, de fato, a acompanhar as pesquisas municipais de 2016. Após a oficialização das condidaturas em agosto, foi possível filtrar cenários e pesquisas que não são mais relevantes, e focar apenas naquelas que são mais informativas para prever o resultados dessas eleições.

Nesse momento estamos acompanhando 95 eleições municipais, com mais de 320 pesquisas do primeiro turno incluidas em nosso acervo.  Como são muitas eleições, estamos priorizando a divulgação de informações sobre as capitais estaduais. Para facilicar o acesso as previsões, estamos disponibilizando duas formas diferentes de visualização dos resultados dessas capitais: uma através de um mapa interativo e outra através de uma tabela. Ambos os formatos podem ser encontrados no Dashboard do site.

Além disso, para todas as eleições sendo acompanhadas, as previsões, as probabilidades de vitória, os gráficos com os vieses dos institutos estão no menu “Eleições 2016 > Brasil” que pode ser acessado diretamente pelo link http://www.pollingdata.com.br/#br2016.


Assim que for possível, as pesquisas de simulação do segundo turno também serão incluídas. O site será atualizado constantemente, então não deixe de acessá-lo para acompanhar as previsões mais recentes e conhecer o cenário político atualizado da sua cidade. 

Wednesday, June 22, 2016

Referendo sobre a permanência do Reino Unido na União Européia

Com todas as notícias relacionadas ao Impeachment, a crise  e a corrupção no Brasil sendo divulgadas constantemente na mídia, sobra pouco espaço para dar o devido destaque ao referendo popular que será votado amanhã no Reino Unido (RU). Para quem não sabe, nesse referendo os britânicos irão decidir se o RU permanece na União Européia (UE) ou não. O impacto de uma decisão de deixar a UE pode ser enorme, desde colocar em xeque a existência da UE à causar a saída da Escócia do RU.

Muitas pesquisas têm sido feitas para prever qual será o resultado da votação (link), porém por causa dos erros cometidos pelos institutos de pesquisa ao prever os resultados das eleições gerais no RU em 2015 (veja aqui), existe muita desconfiança sobre a confiabilidade das pesquisas. A maioria das pesquisas publicadas recentemente indica um empate técnico entre “Permanecer” e “Sair” da UE, com um percentual médio de 10% de indecisos. Ou seja, os indecisos podem facilmente decidir o referendo.

Uma outra incógnita muito importante é saber quem irá votar no referendo. Como não é uma eleição tradicional, é muito difícil avaliar quantas pessoas de fato comparecerão as urnas para votar. A chance de comparecer as urnas pode estar relacionada a permanência ou saída da UE, tornando a dificuldade de prever o resultado ainda maior.

Mesmo confiando no resultado das pesquisas, existe uma outra complicação importante.  No RU têm sido utilizadas duas metodologias principais para se fazer as pesquisas sobre o referendo: online e telefônica. E os resultados das duas metodologias têm sido consistentemente diferentes, sendo as pesquisas online mais favoráveis a saída da UE e as telefônicas mais favoráveis a permanência na UE.

De acordo com esse site, a diferença entre as metodologias ocorre porque na pesquisa telefônica, o entrevistador não dá a opção ao respondente de escolher “Não Sabe” ou “Não têm opinião”, forçando o mesmo a escolher um dos lados. Já nas pesquisas online, que são auto-preenchidas, o respondente pode escolher essas opções neutras, sem se posicionar a favor ou contra. O consenso têm sido de que ao forçar o respondente a escolher um dos lados, existe uma tendência maior dele escolher a opção mais familiar, ou o status quo, nesse caso de permanência na UE.

O site PollingData têm acompanhado as pesquisas do referendo do RU, porém não de forma pública. Nesse post vamos mostrar as previsões atualizadas do site utilizando dois modelos diferentes, descritos abaixo:

1-      Tradicional (sem memória) - Esse é o modelo que o site já vem utilizando á alguns anos. O principal problema com esse modelo têm side que ele supõem que a intenção de voto se manterá constante após a última pesquisa. Ou seja, assume que o cenário eleitoral se manterá constante. Denominamos esse modelo de sem memória porque não importa se um candidato estava na ascendente/descendente, a previsão do modelo irá ignorar essas tendências e supor que o cenário de hoje se repetirá amanha.
2-      Novo (com memória) – Esse é um novo modelo em ainda em desenvolvimento, e essa será a primeira vez que iremos utilizá-lo em uma situação real. Esse modelo assume que as tendências de subida/queda dos candidatos se manterão após a última pesquisa divulgada. A motivação para desenvolver esse modelo ocorreu em 2014, quando em muitas eleições ficou evidente que as estimativas seriam mais precisas se as tendências de cescimento/queda  que ocorreram as vésperas das eleições fossem levadas em conta na hora de fazer as previsões. Por isso esse modelo foi denominado de com memória.

No Brasil usualmente não existem informações claras sobre as metodologias de pesquisa utilizadas, assim o tipo de metodologia não têm sido utilizada nos modelos descritos acima. No caso das pesquisas sobre o referendo popular, a informação sobre a metodologia utilizada existe, assim adaptamos os modelos do PollingData para levarem em conta essa informação que claramente é bastante informativa.

Ao acrescentar essa informação, os modelos estimam o viés causado por cada tipo de metodologia, e implicitamente assumem que a intenção de voto está na realidade entre as estimativas obtidas pelas diferentes metodologias (ou seja, supomos que em média o viés é zero, caso contrário o modelo não é identificável). Se futuramente ficar comprovado que as pesquisas online tinham um viés e as telefônicas não eram enviesadas, por exemplo, o modelo fatalmente errará a previsão, pois ele considera que as duas metodologias trazem informações importantes sobre o cenário eleitoral.

Abaixo apresentamos um gráfico para cada modelo. Como a diferença entre os dois modelos é sutil, porém bastante importante, destacamos em preto a diferença nas previsões do resultado das eleições.




Utilizando o modelo tradicional as estimativas para o dia da eleição estão empatadas em 46%, com probabilidade de vitória de 50% para cada. Porém utilizando o modelo novo, com memória, ele capta o aumento recente da opção por “Continuar” onde as estimativas são de 49% de “Continuar” e 45% de “Sair”, com probabilidade de vitória de 73% para “Continuar”. A diferença entre os dois modelos é bem grande. O mercado de pesquisas está obtendo estimativas mais parecidas com o modelo sem memória, porém eu acho que o modelo com memória está captando a mudança da intenção de voto que está ocorrendo de última hora. Baseado nas estimativas dos modelos, minha previsão é de que o resultado do referendo será de continuar na UE, mas de fato esse e´ um teste bastante duro para o novo modelo....

Como curiosidade, segue abaixo a tabela com o viés estimado por tipo de metodologia.


Update 23/6/2016 9am:

Hoje foram divulgadas 4 novas pesquisas que foram encerradas ontem. Re-estimando os modelos incluindo essas pesquisas, obtemos os seguintes resultados. Pelo "modelo SEM memória", percentual de votos previsto é de 46% para continuar e 45% para sair, com probabilidade de vitória de 57% para continuar. Já para o "modelo COM memória", percentual de votos previstos é de 47% para continuar e 45% para sair, com probabilidade de vitória de 66% para continuar.

O motivo pelo qual os resultados dos modelos estão mais similares após essa atualização é porque existe apenas um dia entre a última pesquisa divulgada e o dia da eleição, e pelas suposições do modelo a opinião pública não pode se alterar tanto em apenas um dia. Além disso, a precisão da estimativa do dia 22 (ontem) é bem alta, porque foram observadas quatro pesquisas.



Update 23/6/2016 11am:

Por enquanto foram divulgadas 7 novas pesquisas que foram encerradas ontem. Re-estimando os modelos incluindo essas pesquisas, obtemos os seguintes resultados. Pelo "modelo SEM memória", percentual de votos previsto é de 46% para continuar e 46% para sair, com probabilidade de vitória de 51% para continuar. Já para o "modelo COM memória", percentual de votos previstos é de 46% para continuar e 45% para sair, com probabilidade de vitória de 56% para continuar.



Tuesday, May 24, 2016

PollingData Educativo....

O PollingData está lançando um nova iniciativa. Agora estamos publicando textos educativos, sobre Estatística, Amostragem e o uso do software R. Esse projeto apenas se iniciou, porém a ideia é que ganhe corpo, e ajude a divulgar e desmistificar a estatística.


Os textos educativos se encontram na aba “Educativo / Tutoriais” no menu principal. Espero que gostem da novidade ;)

Thursday, May 19, 2016

Performance do modelo de previsão do Impeachment no Senado Federal

Na última quinta-feira, no Senado Federal foi realizada a votação para abertura do pedido de Impeachment da presidenta Dilma. O resultado final da votação foi de 55 votos a favor de um total de 77 votos. Com essa decisão,  a presidenta fica afastada do mandato até o julgamento final pelo Senado, o que pode levar até 180 dias, .

O PollingData fez um modelo para prever o resultado dessa votação baseado apenas no histórico de votação de cada Senador e também na votação dos Senadores que participaram da Comissão Especial do Impeachment. Os 20 votos de senadores que participaram da Comissão foram fixados, pois estávamos supondo que o voto na comissão seria o mesmo da sessão da última quinta-feira. Os votos de todos os outros 61 Senadores foram previstos utilizando apenas o histórico de votação no Senado e posição dos Partidos / Líderes de cada partido.

A previsão desse modelo era que o número de votos a favor seria de 54 (intervalo de previsão entre 43 e 64 votos), com probabilidade de 100% da abertura do pedido de Impeachment ser aprovada. Prever que o pedido seria aprovado foi relativamente fácil devido ao contexto extremamente favorável ao pedido. Porém acertar com tanta precisão a estimativa pontual de votos é um feito considerável.

Para avaliar melhor a performance do modelo, construímos o gráfico abaixo, comparando a previsão do modelo por partido com o resultado da votação (no gráfico estamos analisando o número de votos favoráveis).



Todos os resultados estavam dentro dos intervalos de previsão. Para partidos que têm somente um Senador, esse não é um grande feito pois usualmente o intervalo incluía todos os possíveis resultados (0 ou 1 voto favorável). Porém para partidos maiores é um ótimo resultado. Mesmo estando dentro do intervalo de previsão, o partido com a pior performance foi o PDT, onde erramos por 2 votos, para todos os outros casos, erramos no máximo por apenas 1 voto.

Os dados disponíveis nos sites do Governo sobre as votações dos Senadores e dos Deputados são razoavelmente diferentes, incluindo as informações disponíveis. Para desenvolver o modelo da Câmara, para toda votação existe um posicionamento oficial do Governo e de cada partido. Já para o caso do Senado, essa informação não existe. Ela teve que ser derivada avaliando o voto do líder de cada bancada.  Além disso, muitas votações no Senado são fechadas, então existe menos informação disponível para ser utilizada no modelo.

Por esses motivos, consideramos que prever o resultado da votação no Senado era mais difícil do que na Câmara. Como a previsão no Senado teve uma performance melhor do que na Câmara, estamos muito satisfeitos com esse resultado!



Monday, April 18, 2016

Performance do modelo de previsão do Impeachment na Câmara dos Deputados

Como quase todo brasileiro deve saber, ontem foi realizada a votação na Câmara dos Deputados para aprovação do pedido de Impeachment da presidenta Dilma. O resultado final da votação foi de 367 votos a favor de um total de 513 votos.

O PollingData fez um modelo para prever o resultado dessa votação baseado apenas no histórico de votação de cada deputado. A previsão desse modelo era que o número de votos a favor estaria entre 312 e 366, com probabilidade de 67% da votação do Impeachment ser aprovada. Se considerarmos que para acertar a previsão o número de votos (367) deveria estar contido dentro do intervalo divulgado (312-366), estritamente falando, o nosso modelo errou a previsão.

Mais importante que classificar a previsão como correta ou não, é tentar descobrir onde o modelo falhou, para ajustá-lo, de forma a poder re-utilizar a mesma metodologia para prever a votação do Senado. Para avaliar onde erramos, comparamos as previsões do modelo com a votação para cada partido. Essa comparação pode ser vista no gráfico abaixo.



Fica evidente que o modelo teve um erro maior em 3 partidos: PR, PMDB e PTB. No caso do PMDB, mesmo tendo um erro de 5 votos  favoráveis a menos, o intervalo de nossa previsão contém o resultado da votação, ou seja, não foi propriamente um erro, apenas nossa previsão não era muito precisa. Já nos casos do PR e do PDT, a previsão de fato não contém o resultado da votação. Esses dois casos podem ser vistos como um erro da previsão.

Especificamente no caso do PR, onde subestimamos em 13 os votos favoráveis, a posição do partido não ficou bem definida antes da votação, como pode ser visto nestas notícias (link1, link2 e link3). Oficialmente a posição foi contraria ao Impeachment, porém o presidente do partido deixou o partido para poder votar a favor do Impeachment, alegando que mais de metade do partido era também favorável. Por esse motivo na última previsão do modelo, classificamos o PR como tendo a posição “LIVRE”. Mas na realidade, ficou evidente que a posição de fato assumida pelos deputados foi favorável ao Impeachment, tanto que 67% dos votos do PR foram “SIM”.

Fazendo essa pequena alteração no modelo, classificando o PR como “SIM”, já teríamos uma previsão bem melhor. Essa performance pode ser vista no gráfico abaixo.  O modelo passa acertar a previsão do PR, passando agora a superestimar os votos favoráveis dos deputados desse partido. Algo esperado visto a divisão entre esses deputados. Com essa alteração, passamos a ter uma previsão do total da votação de 363, muito próximo do valor real, que foi 367.




Mesmo essa simples alteração corrigindo a previsão do modelo, fica evidente que nos partidos mencionados, o padrão de votos dos deputados deve ter se alterado nos últimos meses devido a grande pressão exercida pelo governo e pela oposição, além das mudanças de posição oficial. Para melhorar esse modelo, talvez seja interessante utilizar uma série histórica menor, ou então estimar um modelo de ponto de mudança. A primeira alternativa é mais simples, porém nem sempre é vantajoso tentar reduzir viés quando o efeito colateral é aumentar a variância. A segunda alternativa é mais complicada, porém pode ser mais eficiente.  Essa escolha só será feita quando o modelo para o Senado for desenvolvido. 

Wednesday, March 23, 2016

Importa saber o tamanho das manifestações Pró e Contra o governo?

Em todas as manifestações populares recentemente realizadas no Brasil, muito se têm debatido sobre o número de pessoas que foram as ruas. Eu mesmo já me manifestei sobre o tema nesse post. Aparentemente, a motivação para tanto debate sobre o número real de manifestantes ocorre porque esses números são usados para estimar o apoio/oposição da população ao Governo. Do ponto de vista estatístico, várias questões relevantes devem ser discutidas pois estão diretamente relacionadas ao cerne da questão: qual a validade de usar estas estimativas para avaliar a oposição/apoio popular ao governo?

Primeiramente, vamos pensar nas diferentes fontes de estimativas existentes: da PM, do DataFolha e dos organizadores. Porque existe uma diferença tão grande entre estimativas provenientes de cada fontes, como pode ser visto nesse link? Acredito que existam 2 motivos principais: diferenças de metodologias e falta de metodologia.

     1 - PM - O objetivo da PM é estimar quantas pessoas estão aglomeradas em um mesmo local num determinado instante de tempo. Para a PM determinar o contingente de policiais, essa informação basta. Para isso utilizam uma metodologia baseada em fotos aéreas, que não tem como estimar o fluxo de pessoas no local.  Ela não tem interesse em estimar o total de pessoas que passaram pelo local, apenas o número de pessoas em um determinado momento do dia.

    2 - DataFolha - O objetivo do DataFolha é diferente. Eles querem identificar tanto o perfil dos manifestantes, quanto identificar quantas pessoas passaram pelo local ao longo do dia (fluxo populacional). Ao invés de tentar explicar aqui como fazem isso, estou incluindo esse link para um vídeo explicativo do próprio DataFolha.

     3 - Organizadores - Finalmente, os organizadores não têm metodologia alguma, apenas um desejo enorme de mostrar que a manifestação foi um sucesso estrondoso. Eu não consegui encontrar nenhuma explicação sobre qual metodologia os “organizadores” utilizam para estimar o total de pessoas. Por favor me avisem se encontrarem alguma explicação.

Dessa forma, entendo que as estimativas não são comparáveis, porém devem usualmente seguir a seguinte lógica: a estimativa da PM representa o mínimo de pessoas que foram a manifestação (se houver fluxo 0 de pessoas). A estimativa dos Organizadores é o máximo imaginável, talvez até maior do que o máximo possível. E a estimativa do DataFolha fica em algum lugar entre as duas. Mas a meu ver, a única metodologia dessas 3 que responde a pergunta sobre quantas pessoas passaram pelo movimento é a do DataFolha.

Um segundo ponto importante é que estamos vendo, no momento, dois movimentos ocorrerem. Um que está sendo rotulado como favorável do Governo, porém que engloba alguns outros movimentos como “Respeito a constituição” e “não vai ter golpe” e que as pessoas são “inocentes até provarem o contrário”. O outro movimento é rotulado como contrário ao Governo, que incluem pessoas que querem o fim da corrupção, ou querem uma reforma política, ou querem o PT fora do governo e/ou na cadeia. Ou seja, ambos os movimentos não são homogêneos, então ao tentar incluir todas as pessoas ali presentes como pró ou contra qualquer argumento um erro estará sendo cometido. Seria algo equivalente a um erro de mensuração, pois estamos medindo Z, mas na realidade gostaríamos de medir Y.

O terceiro ponto, e talvez o mais importante, é que apenas sabemos quantas pessoas foram para as ruas, porém não sabemos qual a chance de diferentes grupos de pessoas participarem dos movimentos. Nesse link, a reportagem do DataFolha mostra claramente que existem perfis bem diferentes indo pra rua. Na manifestação contra o governo do dia 13/3/2016, na cidade de São Paulo, 77% dos manifestantes tinham educação superior. Como benchmark, na cidade de São Paulo, apenas 28% da população possui educação superior.

Parece razoável assumir que nas manifestações "contra" o publico é mais elitizado, e nas manifestações "à favor" o público é mais popular. Além de serem grupos distintos, parece haver um ímpeto maior de pessoas contra o governo se manifestarem se comparado com as pessoas à favor. Nesse contexto, existe um potencial grande para ocorrer viés de seleção. Quero dizer com isso que se pessoas contra o governo têm uma chance maior de participar de uma manifestação do que quem é à favor do governo, pode parecer que a primeira causa tem mais apoio popular que a segunda, mesmo que não seja verdade.

Segue um exemplo FICTÍCIO, extremo, apenas para ilustrar. Segundo a ABEP 30% da população é classe A/B, e 70% classe C/D/E. Para simplificar o argumento, vamos supor que as classes A/B são contra o governo, e que as classes C/D/E são à favor. Ou seja, nesse exemplo, estamos dizendo que 70% da população é favorável ao governo. Se em cada grupo a chance de uma pessoa ir a manifestação for de 1%, teríamos 1,6 milhões de pessoas nas ruas a favor do governo, e 700 mil contra. Nesse caso não haveria problema em utilizar o tamanho dos protestos pra inferir o apoio popular, pois as taxas de participação são as mesmas.

Porém, vamos supor que 2,5% da classes A/B vão a manifestação, contra apenas 1% das classes C/D/E. Ou seja, temos predisposições diferentes de participar, dependendo do fato da pessoas ser à favor ou contra o governo. Nessas condições, as manifestações esperadas seriam de tamanho quase idêntico (1,7 milhões contra e 1,6 milhões a favor), porém a verdade continua sendo a mesma, de que 70% da população é favorável ao governo. Ou seja, nesse cenário com taxas de participação diferentes, não é razoável utilizar o tamanho dos protestos para medir o apoio popular. E esse cenário me parece o mais realista hoje em dia!

No mundo real é mais difícil fazer essa avaliação, tanto porque não sabemos o tamanho dos grupos, quanto porque não sabemos as predisposições de cada grupo participar dos protestos. Se soubéssemos, não seria necessário recorrer ao número de pessoas na rua para fazer a conta. Se o objetivo é avaliar o apoio popular, então que façam pesquisas desenhadas para isso. Usar o número de manifestantes para estimar o apoio popular é perigoso, porque algumas suposições bem fortes estão sendo feitas!








Monday, March 21, 2016

Dificuldades para acompanhar as eleições Brasileiras de 2016

Hoje o site PollingData começou a acompanhar as eleições Brasileiras de 2016. As dificuldades logísticas para conseguir consolidar todas as pesquisas publicadas na mídia brasileira são enormes. Muito maiores do que em 2014, ano que o site foi lançado, pois nesse ano ocorrem mais de 5500 eleições municipais. Ou seja, temos que acompanhar muito mais eleições do que as 28 eleições de 2014 (Presidente + 27 governadores). Nesse post vou contar como estávamos nos preparando para esse ciclo eleitoral, e como acabamos tendo nossa vida tremenda facilitada pelo Blog do Fernando Rodrigues (fomos salvos por ele, novamente!!!)

Como mencionado acima, a dificuldade logística de coletar os dados em 2016 é muito maior do que foi 2014. Já há alguns anos tenho uma ideia de como buscar essas pesquisas automaticamente na internet, porém ainda não havia tentado implementá-la. Esse ano senti que seria imprescindível fazer isso para manter o site atualizado.

O algoritmo básico é razoavelmente simples, e depende essencialmente do registro das pesquisas. Em ano de eleição toda pesquisa que for publicada na mídia têm que ser antes registrada no site do TSE, e além disso, na divulgação da pesquisa é obrigatório incluir no texto o número de identificação criado pelo TSE. Com essa combinação de fatores, tenho uma lista atualizada com todas as pesquisas que têm potencial de serem publicadas, e também tenho como buscá-las no Google usando o id do TSE.

Claro que existem muitos detalhes complicados nesse algoritmo, entre eles como determinar quais sites encontrados pelo Google de fato têm de fato o resultado da pesquisa desejada e como extrair o resultado da pesquisa do texto do site. Lembrando que essas etapas são complicadas ainda mais pela existência de simulações de segundo turno, pela existência de voto estimulado e voto espontâneo, e por existirem inicialmente muitos cenários com candidatos diferentes, visto que os candidatos que concorrerão as eleições só serão definidos em Agosto.

A primeira dificuldade real que encontrei foi o site do TSE. Ele foi desenvolvido de uma forma que torna extremamente difícil para um programa extrair as informações necessárias do site. Não vou entrar em detalhes aqui, porém existem sites que são feitos para facilitar o acesso de computadores ao seu conteúdo, e outros que são desenhados pensando apenas na interação com os humanos. O site do TSE foi desenvolvido apenas pensando nos humanos. E para conseguir extrair automaticamente suas informações, tive que utilizar um programa cuja finalidade original é testar sites, para ver se estão funcionando corretamente. Por causa do objetivo desse programa, ele têm vários efeitos colaterais negativos para automatizar a busca de informações em um site. Apesar disso, consegui criar um programa que entra no site do TSE, clica em todas as pesquisas e guarda os resultados.

Feito isso, o próximo passo foi criar um programa que entra no Google e faz uma busca avançada, procurando pelo número de registro da pesquisa e controlando alguns outros detalhes. Essa parte é relativamente fácil, o difícil é decidir quais sites são os mais relevantes e extrair a informação necessária de dentro do site. Para facilitar o desenvolvimento, fiquei trabalhando apenas em extrair as informações de um site em específico. Após conseguir extrair as informações desse site, resolvi testar o algoritmo de extração nos outros hits do Google.

Foi nessa hora que tive uma grande (e boa!) surpresa. Um dos primeiros resultados que encontrei era do Blog do Fernando Rodrigues. Foi ai que descobri que ele havia atualizado seu site para incluir pesquisas de 2016. Como nesse blog existiam diversas pesquisas consolidadas, resolvi parar de desenvolver o algoritmo de extração baseado no site do TSE, e comecei a desenvolver um novo programa para extrair especificamente as pesquisas do blog do Fernando Rodrigues. Após terminar o algoritmo de extração do TSE, darei mais detalhes sobre ele num post futuro.

Apesar de inicialmente parecer mais fácil ter um site com todas as pesquisas já consolidadas do que buscar cada uma individualmente na net, tive mais um grande obstáculo: extrair as informações automaticamente do Blog, pois as pesquisas de cada eleição estão localizadas numa tabela dentro de um arquivo em pdf. Após pesquisar bastante, encontrei um programa muito bom, chamado “tabula”. Consegui executar esse programa de dentro do R (que é o programa que uso para fazer o PollingData) e pronto – consegui de forma automática extrair os resultados das pesquisas!


Depois de todo esse trabalho, estava finalmente pronto para usar os dados da pesquisa e estimar os modelos de previsão do PollingData. E adivinhem?  Mais uma dificuldade, pois com poucas pesquisas e muitos cenários com diferentes candidatos, o modelo que eu tradicionalmente uso não conseguia rodar (missing data!!!). Mas para não cansar demais quem está lendo esse post, deixo pra contar sobre as dificuldades de modelagem em um outro post.

Finalizando, gostaria novamente de agradecer publicamente ao Fernando Rodrigues. Acho o trabalho que ele faz no seu blog espetacular,e além de tudo torna minha vida muito mais fácil! Sem falar que pelo site dele consigo pesquisas fora dos anos de eleição, como em 2015. Isso não seria possível com meu algoritmo pois ele depende do registro das pesquisas.

Monday, February 29, 2016

Probabilidade Incondicional e uma errata

Na semana passada recebi um email de um usuário (André) do site PollingData, afirmando que as probabilidades de vitória (incondicionais) na eleição Geral dos candidatos a presidência dos EUA estavam erradas. Claramente eu não quero que o site esteja errado, então apesar de ter bastante confiança de que as probabilidades estavam sendo calculadas da maneira correta, resolvi refazer os cálculos. Nesse post, vou explicar com mais detalhes como essas probabilidades são calculadas.

Antes de dar mais detalhes sobre o questionamento do André, vou explicar rapidinho porque as probabilidades de vitória nas eleições gerais são denominadas incondicionais. Nos EUA, ao invés de haver Primeiro e Segundo como no Brasil, existem as eleições Primárias e a Geral. Apesar de todo o processo ser bastante diferente, para calcular as probabilidades de vitória dos candidatos a similaridade é grande: vão disputar as eleições Gerais apenas os candidatos que ganharem as eleições Primárias.


As pesquisas divulgadas são para as Primárias, ou então para os cenários mais prováveis para a eleição Geral. Isso quer dizer que as probabilidades de vitória na Geral são condicionais ao cenário sendo considerado. Mas a probabilidade que queremos encontrar é a probabilidade de vitória na eleição Geral, independente do cenário. Essa probabilidade é denominada Incondicional, pois não está condicionada ao cenário.

Para encontrar o probabilidade Incondicional é necessário levar em conta a probabilidade de cada cenário ocorrer e também as probabilidades condicionais de vitória em cada cenário. Esse cálculo não é muito complicado, mas é necessário tomar cuidado pois existem muitos cenários para os quais não foram realizadas pesquisas ou então que não são acompanhados pelo PollingData.

Voltando ao questionamento do André, a probabilidade que chamou a sua atenção era a de vitória incondicional do Bernie Sanders. Para ele, não fazia sentido o Sanders, que tinha apenas 20% de chance de ganhar as primárias, ter uma probabilidade incondicional de vitória de 31%, bem maior do que a chance do Trump vencer (15%) sendo que ele tinha 86% de probabilidade de vitória nas Primárias.

De fato, essa é uma inversão grande, o que a torna suspeita. Antes de publicar o resultado no site, eu também havia me questionado sobre isso. Porém percebi que o Sanders era quem tinha a maior probabilidade condicional de vitória sobre o Trump, chegando a quase 75%. Para contraste, a probabilidade condicional de vitória da Clinton sobre o Trump é de 60%. Esse fato me pareceu suficiente para justificar essa inversão nas probabilidades, então publiquei o resultado.

Mas o André foi bem insistente que havia algo errado. Expliquei para ele o parágrafo  anterior, mas ele não concordou que pudesse haver uma inversão. Com razão.  Nas palavras dele: 

O que é logicamente impossível é o Bernie ter uma probabilidade de ser eleito presidente maior que a de ele mesmo ser nomeado. É o velho problema da Linda, testado pelo Kahneman e o Tversky. O resultado que estava lá era logicamente impossível, não apenas surpreendente

Decidi re-calcular explicitamente todas as probabilidades para mostrar pra ele minhas contas. E ao fazer isso, descobri que havia um erro!!! Não do cálculo das probabilidades, mas os labels estavam trocado. A probabilidade do Trump era a do Sanders, e vice-versa.

Trabalhei muito tempo com uma pessoa extremamente insightful, que sempre teve um feeling “estatístico” muito bom , sobre resultados de modelos , tabulações, probabilidades – tudo! Ele sempre sabia quando havia um erro, mesmo quando era imperceptível para mim. Muitas vezes o erro não era exatamente o que ele imaginava, mas de fato, quase sempre havia um erro. Ele é dessas pessoas que não têm dificuldades em “elicitar prioris subjetivas”.  O André me lembrou dele!

Gostaria de agradecer ao André pelo email, e principalmente por se preocupar. De fato, além de ajudar a melhorar o meu site, tivemos uma troca interessante de emails!

Friday, February 5, 2016

Carnaval + Primárias de New Hampshire?

O  site PollingData (http://www.pollingdata.com.br/) está acompanhando as eleições primárias americanas no estado de New Hampshire.  Acesse o site durante o carnaval para se manter atualizado.  A eleição será na terça-feira de Carnaval, dia 9 de fevereiro. 
Agora você pode acessar as diferentes abas do site usando links específicos. Os gráficos com as pesquisas se encontram nos links Democratas e Republicanos. As probabilidades de vitória de cada candidato estão no Dashboard.
Bom carnaval a todos!

Tuesday, February 2, 2016

Prevendo o resultado das eleições primárias americanas

Ontem foi realizada a primeira eleição primária americana de 2016, no estado de Iowa. O PollingData acompanhou essa eleição. A projeção feita pelo site não foi muito boa: na primária Democrata, acertamos o vencedor, porém com uma margem maior do que de fato ocorreu; nas primárias Republicanas, o candidato Cruz  que estava em segundo lugar com uma estimativa de 23 % acabou ganhando com 27,7% dos votos, enquanto o Trump que liderava com 27% perdeu com 24,3%.

Para visualizar melhor como foram essas corridas, acesse o site, e no menu principal selecione Eleições 2016 >> Estados Unidos >> Primarias. Lá apresentamos um gráfico de tendências que mostra toda a dinâmica eleitoral de acordo com as pesquisas, e também o resultado final da eleição. É  um ótimo retrato do que ocorreu!

Nesse post não vamos discutir a performance do PollingData e das pesquisas eleitorais. O objetivo é discutir sobre as principais dificuldades que existem para prever o resultado das eleições primárias americanas. Em alguns aspectos, as primárias são similares ao primeiro turno das eleições brasileiras. Muitos eleitores desconhecem os candidatos e apenas se decidem na véspera da eleição, fazendo com que grandes variações entre os resultados das pesquisas na véspera do pleito e o resultado da eleição sejam comuns.

Porém existe uma diferença muito grande. O voto nas eleições primárias não é obrigatório. E o percentual de pessoas elegíveis que de fato votam é muito pequeno, tipicamente variando entre 10% e 20%. Esse ano em Iowa, por exemplo, o percentual de pessoas que votaram foi de 15,7%, um recorde positivo. Na eleição anterior havia sido de apenas 6,5%.

Qual a relevância desse percentual de voto baixo?  Enorme! Para se fazer uma previsão sobre o resultado da eleição, é necessário antes prever quais respondentes irão votar. Eleitores que votam frequentemente usualmente votam de forma diferente daqueles que têm poucas chances de votar. E no caso das primárias, essas diferenças usualmente são maiores ainda.

O problema é importante para as pesquisas de opinião porque é comum pessoas que declararam ter uma grande chance de votar não votarem. E quando isso ocorre, o erro de previsão das pesquisas aumenta. Por isso os institutos desenvolveram, ao longo das últimos décadas, diversos modelos para prever a chance de voto de cada respondente da pesquisa. Esses modelos são chamados de “Likely Voter Models”. Para quem quer entendê-los melhor, recomendo esse link, que discute tanto os modelos quanto os erros cometidos por eles.

Uma etapa essencial na construção desses modelos é definir qual será o ponto de corte a partir do qual o respondente é classificado como “provável eleitor”. Nas eleições primárias,  muitas vezes não é possível encontrar um bom corte. Isso ocorre porque é comum ocorrerem grandes concentrações de respondentes nos extremos da escala de probabilidade de voto. Para uma discussão sobre tema, veja esse link. Além disso, por causa da baixa incidência de voto nas primárias, usualmente o estatístico/analista têm que descartar uma grande parte da amostra retirando quem têm pouca chance de votar, tornando as pesquisas para essas eleições mais caras e com um grau de precisão baixo.


Apesar das dificuldades, o PollingData continuará acompanhando as eleições primárias. Estamos testando diferentes formulações do nosso modelo para tentar prever as oscilações esperadas entre as pesquisas na véspera das eleições e o resultado final. Mais sobre isso num próximo post.

Wednesday, January 27, 2016

Nova atualização do PollingData: agora a performance dos institutos de pesquisa pode ser avaliada!

O site Pollingdata (http://www.pollingdata.com.br/) acabou de receber uma grande atualização. Agora foram incluídos no site o resultado oficial das eleições de 1989-2015. Dessa forma o usuário pode avaliar por si mesmo qual foi a performance das pesquisas eleitorais em cada eleição.

Uma base de dados pronta para análise, combinando os resultados e as pesquisas, pode ser baixada do site . Além disso, os resultados das eleições também foram incluídos nos gráficos de tendência das pesquisas eleitorais, permitindo que a história completa de cada eleição possa ser visualizada em um único gráfico. 

Num futuro próximo, o site PollingData usará esses dados para lançar um ranking dos institutos de pesquisa, que serão avaliados de acordo com a sua performance nas eleições passadas. A criação desse ranking será fundamental para acompanhar as eleições municipais de 2016.


Não deixe de acessar o site para ver as novidades que estão localizadas no menu principal em Acervo/Eleicoes Anteriores => Pesquisas (1989-2015)!

Monday, January 4, 2016

Alunos de escolas Waldorf têm alguma desvantagem no ENEM?

Meu primeiro post em 2016 será sobre as duas coisas mais importantes pra mim: minhas duas filhas de 3 anos. Elas estudam numa escola Waldorf, ou seja, uma escola que utiliza a pedagogia Waldorf. Pra quem não conhece, segue abaixo o parágrafo inicial do Wikipedia:

“A Pedagogia Waldorf é uma abordagem pedagógica baseada na filosofia da educação do filósofo alemão Rudolf Steiner, fundador da antroposofia. A pedagogia procura integrar de maneira holística o desenvolvimento físico, espiritual, intelectual e artístico dos alunos. O objetivo é desenvolver indivíduos livres, integrados, socialmente competentes e moralmente responsáveis. As escolas e professores possuem grande autonomia para determinar o currículo, metodologia e governança.”

Como quase tudo na vida, alguns aspectos dessas escolas são muito interessantes, e outro nem tanto. Enquanto minhas filhas estão no Jardim, não tenho dúvidas de que mantê-las nesse tipo de escola seja a melhor opção. Porém em alguns anos elas já iniciarão o ensino fundamental. E para essa nova etapa, tenho diversas dúvidas sobre mantê-las em uma escola Waldorf.

Não vou comparar aqui os diferentes temas das pedagogias das escolas ‘tradicionais’ versus as Waldorf. Nem tenho qualificação para isso e esse é um blog sobre estatística. Um professor da USP escreveu um artigo sobre isso que pode ajudar aos mais interessados no tema (link). Meu interesse é bem mais pontual. De todas as conversas que já tive com pais/professores de alunos de escolas Waldorf, sinto que a ênfase dada para a realização de provas é bem baixa (na grade escolar). Elas são evitadas até o ensino médio. E mesmo nesse caso, me parece que são realizadas com uma frequência bem menor do que em escolas tradicionais.

Até ai, tudo bem.  Não acho que a educação de uma criança deva ser voltada especificamente para fazer provas, ou que essa é a única forma de avaliar a qualidade do aprendizado. Porém no Brasil, para ingressar na faculdade é necessário passar por provas muito longas, que demandam demais do aluno e que têm uma pressão "competitiva" muito alta (Vestibular e/ou ENEM). Provas desse tipo são difíceis até para quem têm bastante experiência com provas. E não há nenhum indício de que isso vai mudar num futuro próximo.

Ou seja, se um aluno no Brasil quer ir pra faculdade, terá que saber fazer essas provas. Uma das minhas preocupações com relação as escolas Waldorf é justamente essa. Acho que os alunos não estão tão bem preparados para essa etapa. E mais especificamente, o ensino da Matemática me parece ser bastante lúdico, um aprendizado bem distante daquilo que será cobrado no ENEM/Vestibular.

Com isso em mente, resolvi analisar os microdados do ENEM de 2014, disponibilizados pelo INEP aqui. Meu objetivo foi comparar as notas médias dos alunos de escolas tradicionais com os de escolas Waldorf. A primeira etapa foi identificar as escolas Waldorf na base do ENEM. Apenas procurando por escolas com o a palavra Waldorf no nome, encontrei um total de 104 alunos nas escolas listadas na tabela abaixo.


São poucos alunos, mas de fato existem bem poucas escolas Waldorf com ensino médio no Brasil. As escolas listadas estão com certeza entre as principais do Brasil, porém uma possibilidade de aumentar essa base seria incluir escolas Waldorf que não têm Waldorf no nome e que tenham ensino médio. Não sei se existem escolas assim, mas se alguém tiver interesse em melhorar a análise abaixo, segue o link com a listagem de todas as escolas filiadas a Federação das Escolas Waldorf.

A segunda etapa foi filtrar os alunos na base do ENEM de forma a tentar fazer uma comparação justa entre os alunos. Os seguintes filtros foram aplicados na base do ENEM 2014:

    1- Escolas do estado de São Paulo, pois quase todos os alunos de escolas Waldorf na base do ENEM são de SP.
      2-  Escolas particulares, pois as escolas Waldorf são particulares.
      3- Alunos concluindo o ensino médio em 2014, pois me parece razoável considerar apenas alunos que estão fazendo o ENEM no último ano do ensino médio.

O Inep publica as notas das quatro provas do ENEM separadamente. O resultado da comparação simples das médias segue na tabela abaixo. Como esperado, em todas as provas a nota média dos alunos de escolas Waldorf é um pouco mais baixa (~1%), com exceção de Matemática, onde a diferença é maior,  chegando a 8%.  


Várias ressalvas devem ser feitas a essa análise. Em primeiro lugar, a análise feita é bastante simples, e devem haver vários outros fatores que afetam as notas além da pedagogia que deveriam ser considerados numa análise mais aprofundada (por exemplo utilizando Propensity Scoring). Em segundo lugar, essa diferença observada pode ser causada por um viés de seleção, pois na minha experiência a maioria dos pais que colocam seus filhos em escolas Waldorf são formados em Humanas/Biológicas, e seja por afinidade, seja por DNA, podem influenciar o interesse/aptidão dos filhos por matemática.

Mas fica aqui o que eu aprendi com essa análise: hoje em dia, existe tanta informação disponível na internet sobre as escolas que os pais podem fazer uma avaliação objetiva sobre o impacto da escola na vida do seu filho – podem fazer uma decisão informada! Por outro lado, não podemos esperar que as escolas façam tudo por nós. Nós, os pais, somos responsáveis por prepará-los para a vida. Se prefiro matricular meu filho em um escola que vai prepará-lo melhor para o ENEM, em casa tenho que trabalhar mais o seu lado social, criativo, artístico, esportivo, etc. Se quero um escola mais focada no lado pessoal/artístico, então tenho que ajudar a prepará-lo melhor para o ENEM. Sinto que nessa discussão sobre escolas Tradicionais vs Waldorf, os pais/professores querem qualificar um método como melhor que o outro. Temos que ser um pouco mais flexíveis, e perceber que para a grande maioria das questões, o mundo é cinza, não branco e preto!


Blog Archive