Resumen:
|
[ES] El Big Data en el área de deportes es un campo con mucha proyección que está comenzando a proliferar recientemente. Si nos enfocamos en el mundo del tenis, observamos
que no hay gran cantidad de estudios sobre el ...[+]
[ES] El Big Data en el área de deportes es un campo con mucha proyección que está comenzando a proliferar recientemente. Si nos enfocamos en el mundo del tenis, observamos
que no hay gran cantidad de estudios sobre el mismo. Por ello, en este trabajo, se propone
el uso de modelos de clasificación y regresión basados en machine learning para establecer las diferentes tipologías de juego que existen en el tenis y cuáles son más efectivas al
enfrentarlas entre sí. Para realizar el trabajo, se sigue un modelo DST(Data Science Trajectory) propuesto en el artículo titulado ÇRISP-DM twenty years later: From data mining
processes to data science trajectories"[1]. Así mismo, se han empleado diversos programas como son MySQL Workbench y librerías de Python como Pandas, Matplotlib, ScikitLearn y Selenium, entre otras. Para finalizar, como resultado del proyecto se proponen
dos modelos: uno de clasificación como es el kmeans para definir a que tipología de juego
pertenece cada jugador y otro de regresión como es el modelo de ensamblaje voting para
determinar la probabilidad de victoria de un jugador respecto a otro con una precisión
del 93.74 % Dichos modelos se eligen tras realizar varios experimentos comparando el
rendimiento de numerosos modelos.
[-]
[EN] Big Data in the area of sports is a field with a lot of projection that is beginning to proliferate recently. If we focus in the world of tennis, we observe that there are not many
studies on it. Therefore, in this ...[+]
[EN] Big Data in the area of sports is a field with a lot of projection that is beginning to proliferate recently. If we focus in the world of tennis, we observe that there are not many
studies on it. Therefore, in this paper, we propose the use of classification and regression models based on machine learning to establish the different game typologies that
exist in tennis and which ones are more effective when facing them against each other. In
order to carry out the work, we follow a DST(Data Science Trajectory) model proposed
at the european paper "CRISP-DM twenty years later: From data mining processes to
data science trajectories" [1].Likewise, several programs such as MySQL Workbench and Python libraries such as Pandas, Matplotlib, Scikit-Learn and Selenium, among others,
have been used. Finally, as a result of the project, two models are proposed: a classification model such as kmeans to define the type of game each player belongs to and a
regression model such as the voting ensemble model to determine the probability of victory of a player with respect to another with an accuracy of 93.74 % These models are
chosen after several experiments comparing the performance of several models.
[-]
[CA] El Big Data a l’àrea d’esports és un camp amb molta projecció que està començant
a proliferar recentment. Si ens enfoquem al món del tenis, observem que no hi ha gran
quantitat d’estudis sobre el mateix. Per això, ...[+]
[CA] El Big Data a l’àrea d’esports és un camp amb molta projecció que està començant
a proliferar recentment. Si ens enfoquem al món del tenis, observem que no hi ha gran
quantitat d’estudis sobre el mateix. Per això, en aquest treball, es proposa l’ús de models
de classificació i regressió basats en machine learning per a establir les diferents tipologies de joc que existeixen en el tennis i quines són les més efectives al enfrontar-les entre
sí. Per a realitzar el treball, es seguix un model DST(Data Science Trajectory) proposat
a l´article ÇRISP-DM twenty years later: From data mining processes to data science
trajectories"[1]. Així mateix, s’han emprat diversos programes com són MySQL Workbench i llibreries de Python com Pandas, Matplotlib, Scikit-Learn i Selenium, entre altres.
Per a finalitzar, com a resultat del projecte es proposen dos models: un de classificació
com és el kmeans per a definir a què tipologia de joc pertany cada jugador i un altre de
regressió com és el model d’assemblatge voting per a determinar la probabilitat de victòria d’un jugador respecte a un altre amb una precisió del 93.74 %. Aquests models es
trien després de realitzar diversos experiments comparant el rendiment de nombrosos
models.
[-]
|