O site PollingData (http://www.pollingdata.com.br/) recentemente passou a acompanhar alguns campeonatos de futebol do
Brasil, porém meu interesse por futebol é bem mais antigo. Uma das minhas
dúvidas mais antigas que combinam futebol e estatística está relacionada a
campeonatos de futebol onde o número de gols fora de casa é utilizado como
critério de desempate.
No geral, parece
haver um consenso de que numa disputa de ‘mata-mata’ (onde dois times fazem um
jogo em casa e um jogo fora), jogar o último jogo em casa é mais vantajoso. Porém
no contexto onde o gol fora de casa vale mais, será que ainda é mais vantajoso
jogar o segundo jogo em casa? Minha sensação é de que dessa forma o resultado
do segundo jogo acaba sendo distorcido, e que talvez seja melhor jogar o
primeiro jogo em casa, sem as distorções causadas pelos gols fora de casa no
jogo anterior. Sem contar que no segundo jogo, quem tem a vantagem de fazer “gols
fora de casa” é o time que jogou o primeiro jogo em casa.
Para verificar se de
fato jogar o segundo jogo é mais vantajoso nesse contexto, decidir analisar os
resultados de todos os jogos de todas as Copas do Brasil disputadas até hoje
(28 campeonatos disputados entre 1989 e 2016). Baixei todos os dados do site ogol utilizando a biblioteca rvest do R, que
é muito boa e simples de usar. Minha maior dificuldade foi que o site começou a
não permitir meu acesso, desconfiando (com razão) que não fosse um humano, e
sim um programa que estava acessando os dados J
Hoje em dia a Copa do
Brasil conta com 86 times, de todas as divisões do futebol brasileiro, então
claramente existe uma diferença muito grande de qualidade entre os times. Tanto
que na primeira fase, os times de menor expressão jogam o primeiro jogo em
casa, e se perderem por 2 gols de diferença ou mais em casa, são eliminados sem
realizar o jogo de volta.
Como não tenho muito
tempo para fazer essa análise, porém quero evitar que minhas estimativas de
chance de vitória tenham seus efeitos confundidos por causa do diferencial
técnico entre os times, vou tomar o cuidado de analisar separadamente os jogos
realizados a partir das oitavas de final. Estou supondo que a partir dessa
fase, os times classificados têm um nível técnico mais similar. Claro que
existem outros fatores que também podem influenciar os resultados, como cartões,
expulsões, dois times da mesma cidade, outros campeonatos ocorrendo em
paralelo, porém esses fatores não serão controlados aqui.
Na tabela abaixo,
calculei o percentual de vezes que os times jogando em casa o primeiro ou o
segundo jogo venceram a disputa, distinguindo entre as diferentes fases do
campeonato. Fica evidente que ao analisar todas as fases conjuntamente, jogar o
segundo jogo em casa é, em média, duas vezes melhor do que jogar o primeiro
jogo em casa. Mesmo olhando apenas as fases finais (com exceção da grande final),
com os times mais parelhos, a vantagem ainda é de jogar a partida final em
casa, porém em grau bem menor. De cada 17 duelos, apenas 1 a mais será ganho
pelo time jogando a última partida em casa.
Talvez a estatística
mais interessante da tabela seja relacionada a final do campeonato. Na disputa
final, não esquecendo que temos uma amostra menor, a relação parece ser ao
contrário. Ou seja, na final é mais vantajoso jogar a primeira partida em casa.
Por mais que apenas esse resultado vá de encontro ao que eu esperava, é difícil
encontrar uma explicação para essa inversão apenas nessa disputa. Talvez os
times visitantes entrem em campo mais cautelosos no primeiro jogo e façam menos
gols fora de casa, dando dessa forma uma vantagem para quem joga a primeira em
casa.Talvez seja por causa
da pressão do time que joga em casa*. Independente de qual hipótese é correta,
os dados mostram que no jogo de ida das finais, 53% das vezes o time visitante
não fez gol. Um percentual bem alto se comparado com a média geral do
campeonato, considerando todas as fases, que é de apenas 28%.
Para finalizar, me parece interessante apresentar uma tabela (acima) com as chances de vitória do time que joga o primeiro jogo em casa dependendo do número de gols marcados no primeiro jogo (tanto pelo time de casa quanto o visitante). Nessa tabela estamos considerando apenas as fases finais do campeonato. Se de fato na final os times visitantes no primeiro jogo tendem a ser mais conservadores, e não fazerem gols, vemos que a probabilidade de vitória para os mandantes do primeiro jogo, quando não sofrem gols, é de 54%.
Fica claro dessa
análise que a minha hipótese inicial, de que é mais vantajoso jogar o primeiro
jogo em casa, não é verdade na maioria dos casos, com exceção da grande final. Por isso que estatística é tão interessante,
podemos empiricamente compreender o mundo em que estamos, testar hipóteses e
aprender com isso. Na minha próxima conversa de boteco, meu discurso sobre o 'gol fora de casa' será outro!
*Vale ressaltar que em 2015 o regulamento da Copa do Brasil foi alterado, e a partir desse ano gol fora de casa não é mais critério de desempate na final. Esse fato poderia afetar os resultados e ajudar a explicar porque na final os resultados parecem invertidos, porém dos 28 embates na base de dados, apenas os dois últimos ocorreram com as novas regras.
No comments:
Post a Comment