Mostrar el registro sencillo del ítem
dc.contributor.advisor | Gómez Adrian, Jon Ander | es_ES |
dc.contributor.advisor | Groh, Georg | es_ES |
dc.contributor.author | Coll Alonso, Joan | es_ES |
dc.date.accessioned | 2023-09-28T18:38:28Z | |
dc.date.available | 2023-09-28T18:38:28Z | |
dc.date.created | 2023-09-06 | |
dc.date.issued | 2023-09-28 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/197325 | |
dc.description.abstract | [EN] With the recent advancements in the field of artificial intelligence, multiple applications of it have been developed and studied for music. From genre classification to performance interaction, there are many areas of interest that result from the combination of these two fields. In this work, we are particularly interested in discovering and analyzing music’s latent dimensions making use of the latest technology available. We will introduce the topic, present a thorough literature review, introduce the considered models, present the underlying technology we base our work off in a detailed way, explain our planned methodology and experiments, discuss the obtained results and draw conclusions and possible lines of future work. Although both VAE and BERT were considered, BERT was deemed as the better option given that music is sequential data. t-SNE was chosen as the dimensionality reduction technique and k-means as the clustering method. BERT provided numerical data for every musical piece analyzed, whose dimensions we reduced with t-SNE and on which we performed clustering with k-means to analyze the resulting representation. We found an optimal value of k for which the different clusters could be explained, thus proving BERT understands music according to some latent parameters. | es_ES |
dc.description.abstract | [ES] Con los recientes avances en el campo de la inteligencia artificial, se han desarrollado y estudiado múltiples aplicaciones en el ámbito de la música. En este trabajo, estamos especialmente interesados en descubrir y analizar las dimensiones latentes de la música haciendo uso de la última tecnología disponible. Introduciremos el tema, presentaremos una revisión exhaustiva de la literatura, introduciremos los principales modelos, presentaremos la tecnología subyacente en la que se basa nuestro trabajo de forma detallada, explicaremos nuestra metodología y experimentos previstos, debatiremos los resultados obtenidos y extraeremos conclusiones y posibles líneas de trabajo futuras. El BERT proporcionó datos numéricos para cada pieza musical analizada, cuyas dimensiones se redujeron con el T-SNE y sobre las que se realizó un agrupamiento con K-Mans para analizar la representación resultante. Hemos hallado un valor óptimo para el que se pueden explicar los distintos clusters, demostrando así queBERT entiende la música según unos parámetros determinados. | es_ES |
dc.description.abstract | [DE] Mit den jüngsten Fortschritten auf dem Gebiet der künstlichen Intelligenz, wurden zahlreiche Anwendungen für die Musik entwickelt und untersucht. Von der Genreklassifizierung bis hin zur Interaktion bei der Aufführung gibt es viele Bereiche von Interesse, die sich aus der Kombination dieser beiden Gebiete ergeben. In dieser Arbeit sind wir besonders an der Entdeckung und Analyse von die latenten Dimensionen der Musik zu entdecken und zu analysieren, indem wir die neueste verfügbare Technologie nutzen. Wir werden in das Thema einführen, einen gründlichen Literaturüberblick geben, die in Frage kommenden Modelle vorstellen, die zugrundeliegende Technologie, auf die wir unsere Arbeit stützen Wir stellen die unserer Arbeit zugrundeliegende Technologie detailliert vor, erläutern unsere geplante Methodik und unsere Experimente, diskutieren die erzielten Ergebnisse und ziehen Schlussfolgerungen sowie mögliche Ansätze für zukünftige Arbeiten. Obwohl sowohl VAE als auch BERT in Betracht gezogen wurden, wurde BERT als die bessere Option angesehen da es sich bei Musik um sequenzielle Daten handelt. t-SNE wurde als Dimensionalitätsreduktion und k-means als Clustermethode gewählt. BERT lieferte numerische Daten für jedes analysierte Musikstück, dessen Dimensionen wir mit t-SNE reduzierten und auf Clustering mit k-means durchgeführt haben, um die resultierende Darstellung zu analysieren. Wir fanden einen optimalen Wert von k, für den die verschiedenen Cluster erklärt werden konnten, und bewiesen damit, dass BERT Musik anhand einiger latenter Parameter versteht | es_ES |
dc.format.extent | 77 | es_ES |
dc.language | Inglés | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | Música | es_ES |
dc.subject | Dimensiones latentes | es_ES |
dc.subject | Popularidad | es_ES |
dc.subject | Autocodificadores variacionales | es_ES |
dc.subject | Machine learning | es_ES |
dc.subject | Deep learning | es_ES |
dc.subject | Variational Autoencoders (VAEs) | es_ES |
dc.subject | Music | es_ES |
dc.subject.classification | LENGUAJES Y SISTEMAS INFORMATICOS | es_ES |
dc.subject.other | Grado en Ingeniería Informática-Grau en Enginyeria Informàtica | es_ES |
dc.title | Finding music's latent dimensions with Variational Autoencoders | es_ES |
dc.title.alternative | Encontrando las dimensiones latentes de la música mediante Autocodificadores Variacionales (VAE) | es_ES |
dc.title.alternative | Trobant les dimensions latents de la música mitjançant Autocodificadors Variacionals (VAE) | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica | es_ES |
dc.description.bibliographicCitation | Coll Alonso, J. (2023). Finding music's latent dimensions with Variational Autoencoders. Universitat Politècnica de València. http://hdl.handle.net/10251/197325 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\158953 | es_ES |