Wednesday, September 24, 2014

Probabilidade Condicional

Probabilidade condicional deve ser um dos temas da estatística que mais causam confusão nas pessoas. Nem sempre é fácil perceber se a probabilidade é (ou deveria ser) condicional. Acredito que até profissionais experientes se atrapalham algumas vezes.

Vamos falar de assunto aqui pra explicar as probabilidades utilizadas no Pooling Data. A probabilidade condicional é definida como a probabilidade de um evento A ocorrer, dado que um evento B já ocorreu. Assim P(A) é a probabilidade do evento A ocorrer independente de B (sem saber se B ocorreu ou não). E P(A/B) é a probabilidade do evento A ocorrer dado que sabemos que o evento B já ocorreu.

Por exemplo, se você é uma pai sortudo, a probabilidade do seu filho de 2 anos acordar no meio da noite é de apenas 5%, ou seja, P(acordar)=0,05. Porém, se você sabe que seu filho está com dor de ouvido, a probabilidade do seu filho acordar passa a ser de 70% (até mais, eu acredito). Ou seja, P(acordar/”dor de ouvido”) = 0,70.

Claramente, dependendo do evento que ocorreu, as probabilidades podem se alterar profundamente. No caso do Pooling Data o fato da probabilidade ser condicional é bastante relevante, principalmente por causa da existência do segundo turno. Com exceção da probabilidade de ocorrência do segundo turno (que não é condicionada a ocorrência do Segundo turno), todas as outras probabilidades calculadas no site poderiam ser condicionais ou não. E não é uma questão de certo ou errado, ambas as probabilidades existem e têm interpretações totalmente coerentes. Está mais relacionado com quais probabilidades nós achamos serem as mais interessantes para o nosso público.

No caso das probabilidades dos candidatos irem para o segundo turno, estamos considerando probabilidade condicionais. Ou seja, elas devem ser lidas da seguinte forma: Se houver segundo turno, a probabilidade do candidato X ir para o segundo turno é de Y%. Escolhemos apresentar as probabilidades dessa forma porque para nós, a resposta da pergunta “quem vai para o segundo turno?” é mais interessante condicionada a ocorrência do mesmo.  Porém, quem olhar as probabilidades de ir para o segundo turno dos candidatos a governador de SP e de MG pode estranhar o fato de que a probabilidade de ocorrência do segundo turno é essencialmente 0%, porém algums candidatos têm probabilidade 100% de ir para o segundo turno. Enão não se confundam, esses resultados aparentemente incoerentes ocorrem porque estamos usando probabilidades condicionais.


Já no caso das probabilidades dos candidatos vencerem as eleições, NÃO estamos considerando probabilidade condicionais. Ou seja, elas devem ser lidas da seguinte forma: A probabilidade do candidato X ganhar as eleições é de Y%. Escolhemos apresentar as probabilidades dessa forma porque para nós, a resposta da pergunta “quem vai ganhar as eleições?” é mais interessante independentemente da ocorrência do segundo turno.  

No comments:

Post a Comment