Resumen:
|
[EN] This research aims to find which models of Machine Learning and Multivariate Statistics have a greater predictive capacity when deciding what the team's classification will be at the end of the season. The teams that ...[+]
[EN] This research aims to find which models of Machine Learning and Multivariate Statistics have a greater predictive capacity when deciding what the team's classification will be at the end of the season. The teams that competed in the first division of the Bundesliga, Premier League, LaLiga, Ligue 1 and Serie A throughout the 2018-2019 season have been studied. The badly classified teams by the best of the models, the Random Forest with balanced data, were analyzed in-depth to determine the game's actions that caused the classification error. The results indicate that, generally, the effectiveness in front of goal and the possession of the ball are the statistics in which badly classified teams differ the most with the average of their real position. In conclusion, this research shows how Machine Learning and Multivariate Statistical techniques can be used successfully to discriminate between Top and Bottom teams competing in the best leagues in the world
[-]
[ES] Esta investigación tiene como objetivo encontrar qué modelos de Machine Learning y Estadística Multivariante tienen una mayor capacidad de predicción de la posición de los equipos al final de la temporada en la tabla ...[+]
[ES] Esta investigación tiene como objetivo encontrar qué modelos de Machine Learning y Estadística Multivariante tienen una mayor capacidad de predicción de la posición de los equipos al final de la temporada en la tabla clasificatoria. Se han utilizado las acciones de juego de los equipos que compitieron en la primera división de la Bundesliga, Premier League, LaLiga, Ligue 1 y Serie A, a lo largo de la temporada 2018-2019. Los equipos mal clasificados por el mejor de los modelos, el Random Forest con datos equilibrados, fueron analizados en profundidad para determinar las acciones del juego que provocaban el error de clasificación. Los resultados indican que, generalmente, la efectividad de cara a portería y la posesión del balón son las variables en las que más difieren los equipos mal clasificados respecto a los valores medios de las variables en su grupo real. En conclusión, esta investigación muestra cómo las técnicas de Machine Learning y Estadística Multivariante se pueden utilizar con éxito para predecir la clasificación final de los equipos que compiten en las mejores ligas del mundo.
[-]
|
Agradecimientos:
|
Los autores quieren agradecer a la Universitat Politècnica de València el apoyo económico a través de la beca FPI-UPV (PAID-01-19). Además, agradecen el trabajo de los dos revisores anónimos y el editor, cuyas sugerencias ...[+]
Los autores quieren agradecer a la Universitat Politècnica de València el apoyo económico a través de la beca FPI-UPV (PAID-01-19). Además, agradecen el trabajo de los dos revisores anónimos y el editor, cuyas sugerencias mejoraron el manuscrito original.
[-]
|