Probabilidade condicional deve ser um dos temas
da estatística que mais causam confusão nas pessoas. Nem sempre é fácil
perceber se a probabilidade é (ou deveria ser) condicional. Acredito que até
profissionais experientes se atrapalham algumas vezes.
Vamos falar de assunto aqui pra explicar as
probabilidades utilizadas no Pooling Data. A probabilidade condicional é
definida como a probabilidade de um evento A ocorrer, dado que um evento B já
ocorreu. Assim P(A) é a probabilidade do evento A ocorrer independente de B
(sem saber se B ocorreu ou não). E P(A/B) é a probabilidade do evento A ocorrer
dado que sabemos que o evento B já ocorreu.
Por exemplo, se você é uma pai sortudo, a probabilidade
do seu filho de 2 anos acordar no meio da noite é de apenas 5%, ou seja,
P(acordar)=0,05. Porém, se você sabe que seu filho está com dor de ouvido, a
probabilidade do seu filho acordar passa a ser de 70% (até mais, eu acredito).
Ou seja, P(acordar/”dor de ouvido”) = 0,70.
Claramente, dependendo do evento que ocorreu,
as probabilidades podem se alterar profundamente. No caso do Pooling Data
o fato da probabilidade ser condicional é bastante relevante, principalmente
por causa da existência do segundo turno. Com exceção da probabilidade de
ocorrência do segundo turno (que não é condicionada a ocorrência do Segundo
turno), todas as outras probabilidades calculadas no site poderiam ser
condicionais ou não. E não é uma questão de certo ou errado, ambas as
probabilidades existem e têm interpretações totalmente coerentes. Está mais
relacionado com quais probabilidades nós achamos serem as mais interessantes para o nosso público.
No caso das probabilidades dos candidatos irem
para o segundo turno, estamos considerando probabilidade condicionais. Ou seja,
elas devem ser lidas da seguinte forma: Se houver segundo turno, a probabilidade do
candidato X ir para o segundo turno é de Y%. Escolhemos apresentar as
probabilidades dessa forma porque para nós, a resposta da pergunta “quem vai
para o segundo turno?” é mais interessante condicionada a ocorrência do
mesmo. Porém, quem olhar as
probabilidades de ir para o segundo turno dos candidatos a governador de SP e
de MG pode estranhar o fato de que a probabilidade de ocorrência do segundo
turno é essencialmente 0%, porém algums candidatos têm probabilidade 100% de ir
para o segundo turno. Enão não se confundam, esses resultados aparentemente
incoerentes ocorrem porque estamos usando probabilidades condicionais.
Já no caso das probabilidades dos candidatos
vencerem as eleições, NÃO estamos considerando probabilidade condicionais. Ou
seja, elas devem ser lidas da seguinte forma: A probabilidade do candidato X
ganhar as eleições é de Y%. Escolhemos apresentar as probabilidades
dessa forma porque para nós, a resposta da pergunta “quem vai ganhar as
eleições?” é mais interessante independentemente da ocorrência do segundo turno.
No comments:
Post a Comment