Resumen:
|
[ES] La expansión del Big Data en el mundo de los deportes es cada vez más grande. Si nos
enfocamos en el mundo del fútbol, cada vez son más los clubes o entidades que apuestan por
el análisis de datos deportivos para ...[+]
[ES] La expansión del Big Data en el mundo de los deportes es cada vez más grande. Si nos
enfocamos en el mundo del fútbol, cada vez son más los clubes o entidades que apuestan por
el análisis de datos deportivos para mejorar el rendimiento de sus jugadores, evitar lesiones,
estudiar a los equipos rivales o fichar jugadores. Muchas veces hemos visto casos en los que
un club termina pagando más de lo que probablemente valga un jugador. Es un trabajo
complicado y del que se han hecho pocos estudios. Por ello, en este trabajo, se propone el uso
de modelos de regresión basados en machine learning para predecir el valor de mercado de
los futbolistas. Para realizar el trabajo, se ha seguido la metodología CRISP-DM. Se han
empleado R y Python como lenguajes de programación, librerías de Python como Pandas,
Matplotlib, Seaborn, Scikit- Learn, entre otras, y Power BI para la representación de los datos.
Se han probado todos los modelos de regresión del estado del arte así como otros que han
mejorado los resultados. Dichos modelos se eligen tras realizar varios experimentos
comparando su rendimiento. El modelo que hace una mejor predicción es el XGBoost.
[-]
[EN] The expansion of Big Data in the world of sports is ever increasing. If we focus on the world
of football, more and more clubs or entities are betting on the analysis of sports data to improve
the performance of ...[+]
[EN] The expansion of Big Data in the world of sports is ever increasing. If we focus on the world
of football, more and more clubs or entities are betting on the analysis of sports data to improve
the performance of their players, avoid injuries, study rival teams or sign players. We have often
seen cases where a club ends up paying more than a player is probably worth. It is a
complicated job and one that has been studied very little. Therefore, in this paper, we propose
the use of regression models based on machine learning to predict the market value of football
players. The work follows the CRISP-DM methodology. R and Python were used as
programming languages, Python libraries such as Pandas, Matplotlib, Seaborn, Scikit-Learn,
among others, and Power BI for data representation. All state-of-the-art regression models have
been tested, as well as others that have improved the results. These models are chosen after
several experiments comparing their performance. The model with the best prediction is the
XGBoost.
[-]
[CA] L'expansió del Big Data en el món dels esports és cada vegada més gran. Si ens centrem
en el món del futbol, cada cop són més clubs o entitats apostant per l’anàlisi de dades
esportives per millorar el rendiment ...[+]
[CA] L'expansió del Big Data en el món dels esports és cada vegada més gran. Si ens centrem
en el món del futbol, cada cop són més clubs o entitats apostant per l’anàlisi de dades
esportives per millorar el rendiment dels seus jugadors, evitar lesions, estudiar equips rivals o
signar jugadors. Moltes vegades hem vist casos en què un club acaba pagant més que un
jugador val la pena. És una feina complicada i s’han fet pocs estudis. Per aquest motiu, en
aquest treball, es proposa l’ús de models de regressió basats en l’aprenentatge automàtic per
predir el valor de mercat dels futbolistes. Per dur a terme l’obra, es segueix la metodología
CRISP-DM. R i Python s’han utilitzat com a llenguatges de programació, biblioteques Python
com Pandas, Matplotlib, Seaborn, Scikit-Learn, entre d’altres, i Power BI per a la representació
de dades. Tots els models de regressió d’última generació, així com d’altres que han millorat
els resultats, s’han provat. Aquests models es trien després de realitzar diversos experiments
comparant el seu rendiment. El model que fa la millor predicció és el XGBoost.
[-]
|