- -

Finding music's latent dimensions with Variational Autoencoders

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Finding music's latent dimensions with Variational Autoencoders

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Gómez Adrian, Jon Ander es_ES
dc.contributor.advisor Groh, Georg es_ES
dc.contributor.author Coll Alonso, Joan es_ES
dc.date.accessioned 2023-09-28T18:38:28Z
dc.date.available 2023-09-28T18:38:28Z
dc.date.created 2023-09-06
dc.date.issued 2023-09-28 es_ES
dc.identifier.uri http://hdl.handle.net/10251/197325
dc.description.abstract [EN] With the recent advancements in the field of artificial intelligence, multiple applications of it have been developed and studied for music. From genre classification to performance interaction, there are many areas of interest that result from the combination of these two fields. In this work, we are particularly interested in discovering and analyzing music’s latent dimensions making use of the latest technology available. We will introduce the topic, present a thorough literature review, introduce the considered models, present the underlying technology we base our work off in a detailed way, explain our planned methodology and experiments, discuss the obtained results and draw conclusions and possible lines of future work. Although both VAE and BERT were considered, BERT was deemed as the better option given that music is sequential data. t-SNE was chosen as the dimensionality reduction technique and k-means as the clustering method. BERT provided numerical data for every musical piece analyzed, whose dimensions we reduced with t-SNE and on which we performed clustering with k-means to analyze the resulting representation. We found an optimal value of k for which the different clusters could be explained, thus proving BERT understands music according to some latent parameters. es_ES
dc.description.abstract [ES] Con los recientes avances en el campo de la inteligencia artificial, se han desarrollado y estudiado múltiples aplicaciones en el ámbito de la música. En este trabajo, estamos especialmente interesados en descubrir y analizar las dimensiones latentes de la música haciendo uso de la última tecnología disponible. Introduciremos el tema, presentaremos una revisión exhaustiva de la literatura, introduciremos los principales modelos, presentaremos la tecnología subyacente en la que se basa nuestro trabajo de forma detallada, explicaremos nuestra metodología y experimentos previstos, debatiremos los resultados obtenidos y extraeremos conclusiones y posibles líneas de trabajo futuras. El BERT proporcionó datos numéricos para cada pieza musical analizada, cuyas dimensiones se redujeron con el T-SNE y sobre las que se realizó un agrupamiento con K-Mans para analizar la representación resultante. Hemos hallado un valor óptimo para el que se pueden explicar los distintos clusters, demostrando así queBERT entiende la música según unos parámetros determinados. es_ES
dc.description.abstract [DE] Mit den jüngsten Fortschritten auf dem Gebiet der künstlichen Intelligenz, wurden zahlreiche Anwendungen für die Musik entwickelt und untersucht. Von der Genreklassifizierung bis hin zur Interaktion bei der Aufführung gibt es viele Bereiche von Interesse, die sich aus der Kombination dieser beiden Gebiete ergeben. In dieser Arbeit sind wir besonders an der Entdeckung und Analyse von die latenten Dimensionen der Musik zu entdecken und zu analysieren, indem wir die neueste verfügbare Technologie nutzen. Wir werden in das Thema einführen, einen gründlichen Literaturüberblick geben, die in Frage kommenden Modelle vorstellen, die zugrundeliegende Technologie, auf die wir unsere Arbeit stützen Wir stellen die unserer Arbeit zugrundeliegende Technologie detailliert vor, erläutern unsere geplante Methodik und unsere Experimente, diskutieren die erzielten Ergebnisse und ziehen Schlussfolgerungen sowie mögliche Ansätze für zukünftige Arbeiten. Obwohl sowohl VAE als auch BERT in Betracht gezogen wurden, wurde BERT als die bessere Option angesehen da es sich bei Musik um sequenzielle Daten handelt. t-SNE wurde als Dimensionalitätsreduktion und k-means als Clustermethode gewählt. BERT lieferte numerische Daten für jedes analysierte Musikstück, dessen Dimensionen wir mit t-SNE reduzierten und auf Clustering mit k-means durchgeführt haben, um die resultierende Darstellung zu analysieren. Wir fanden einen optimalen Wert von k, für den die verschiedenen Cluster erklärt werden konnten, und bewiesen damit, dass BERT Musik anhand einiger latenter Parameter versteht es_ES
dc.format.extent 77 es_ES
dc.language Inglés es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Música es_ES
dc.subject Dimensiones latentes es_ES
dc.subject Popularidad es_ES
dc.subject Autocodificadores variacionales es_ES
dc.subject Machine learning es_ES
dc.subject Deep learning es_ES
dc.subject Variational Autoencoders (VAEs) es_ES
dc.subject Music es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Grado en Ingeniería Informática-Grau en Enginyeria Informàtica es_ES
dc.title Finding music's latent dimensions with Variational Autoencoders es_ES
dc.title.alternative Encontrando las dimensiones latentes de la música mediante Autocodificadores Variacionales (VAE) es_ES
dc.title.alternative Trobant les dimensions latents de la música mitjançant Autocodificadors Variacionals (VAE) es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Coll Alonso, J. (2023). Finding music's latent dimensions with Variational Autoencoders. Universitat Politècnica de València. http://hdl.handle.net/10251/197325 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\158953 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem