Probabilidades de pasar la fase de grupos en Copa Libertadores 2020

#conmebol #copa-libertadores #analytics #futbol #data-science #rstats
Conmebol
Español
Autor/a

Ismael Gómez Schmidt

Fecha de publicación

28 de febrero de 2020

Ya están definidos todos los clasificados a la fase de grupos de la edición 2020 de la Copa Libertadores!


Como ya es costumbre, acá te dejo las probabilidades que tiene cada equipo de pasar la fase de grupos según un modelo predictivo que considera como variable de entrada únicamente la valorización económica de su plantel centrada respecto al promedio de esta misma variable en el grupo que le tocó.

Probabilidades de pasar fase de grupos

Probabilidades de clasificación a ⅛ de final - Copa Libertadores 2020
club Valor
[Millones EU]
Valor $ centrado respecto a promedio de grupo Prob. de clasificar [%] Prob. ponderada [%]1
Grupo A
151.20 98.50 99.9 79.3
24.58 -28.11 11.6 9.2
18.05 -34.64 7.5 5.9
16.95 -35.74 6.9 5.5
Grupo B
124.70 88.70 99.9 75.9
7.40 -28.60 11.3 8.6
7.33 -28.67 11.2 8.5
4.58 -31.42 9.3 7.1
Grupo C
34.65 15.46 77.1 37.7
18.83 -0.36 50.9 24.9
17.73 -1.45 48.9 23.9
5.53 -13.65 27.8 13.6
Grupo D
138.60 73.02 99.6 51.6
89.75 24.17 86.5 44.9
26.05 -39.53 5.3 2.8
7.90 -57.68 1.4 0.7
Grupo E
121.50 67.47 99.4 57.4
58.55 4.52 59.9 34.6
20.40 -33.62 8.0 4.6
15.65 -38.38 5.8 3.3
Grupo F
69.00 44.92 96.8 55.3
11.63 -12.45 29.7 16.9
10.60 -13.48 28.1 16.0
5.08 -19.00 20.6 11.8
Grupo G
61.90 31.00 91.4 47.8
22.80 -8.09 36.8 19.3
22.50 -8.39 36.3 19.0
16.38 -14.52 26.6 13.9
Grupo H
111.05 72.27 99.6 67.3
22.90 -15.88 24.6 16.7
14.28 -24.50 14.7 9.9
6.88 -31.90 9.0 6.1

Tabla: @DatoFutbol_cl | Data: Transfermarkt
1
Ponderación aplicada para que la suma del grupo sea 100%
  • En 5 de los 8 grupos hay un claro favorito para llevarse el primer lugar (G1: Flamengo, G2: Palmeiras, G6: Racing, G7: Santos y G8: Boca Juniors), en los que la pelea por el segundo lugar es apretada entre los 3 equipos restantes.

Los demás escenarios son:

  • Una pelea ajustada por el segundo lugar entre “solo” dos equipos -> G3: Peñarol y Colo-Colo

  • Una pelea ajustada por el primer lugar entre dos equipos favoritos -> G4: River Plate + Sao Paulo y G5: Gremio + Internacional de Porto Alegre.


Datos históricos considerados (2011-2019)

El modelo ajustado (regresión logística con distribución binomial) tiene una Accuracy de 75%, considerando una muestra de testing con 72 ejemplos balanceados. Es decir, con los datos históricos de las últimas 9 ediciones de la Copa, es posible predecir correctamente al menos a 12 de los 16 equipos que pasarán la fase de grupos. En otras palabras, es esperable que hayan 4 equipos que den “la sorpresa”.

Acá puedes revisar las publicaciones anteriores donde indiqué más detalles acerca del modelo y los datos considerados.