[ES] El rendimiento de las soluciones basadas en técnica de Inteligencia Artificial (IA) dependen, en gran medida, del conjunto de datos utilizado para su entrenamiento. No sólo la cantidad de los datos, si no la calidad ...[+]
[ES] El rendimiento de las soluciones basadas en técnica de Inteligencia Artificial (IA) dependen, en gran medida, del conjunto de datos utilizado para su entrenamiento. No sólo la cantidad de los datos, si no la calidad de estos. El objetivo principal de este proyecto es la implementación de un algoritmo de Aprendizaje Activo (AL) en un contexto donde la cantidad de datos disponibles no etiquetados es mucho mayor que el presupuesto de etiquetado (en este proyecto se trabajarán con señales de audio ambientales). Por tanto, la duración total del conjunto de datos es mucho mayor al tiempo que se puede emplear para etiquetarlo. La puesta en marcha de estas técnicas garantiza que los datos que se vayan a etiquetar sean interesantes y ricos en términos de diversidad así poder optimizar un entrenamiento de un algoritmo de IA con la cantidad de datos etiquetados, se puede entender el AL como un método para la optimización de los recursos de etiquetado. Cabe destacar que para el algoritmo de AL se han utilizado técnicas de Deep y Machine Learning. Como caso práctico de uso se han utilizado grabaciones realizadas en el puerto de Valencia. El proyecto se ha realizado durante las prácticas de Grado en el Instituto Tecnológico de Informática (ITI).
[-]
[EN] The performance of Artificial Intelligence (AI) based solutions largely depends on the dataset used for their training. Not only the amount of data, but also the quality of the data. The main objective of this project ...[+]
[EN] The performance of Artificial Intelligence (AI) based solutions largely depends on the dataset used for their training. Not only the amount of data, but also the quality of the data. The main objective of this project is the implementation of an Active Learning (AL) algorithm in a context where the amount of available unlabeled data exceeds the labeling budget (in this project, will be worked on enviromental audio signals). Therefore, the total duration of the dataset is much bigger than the available time for labeling it. The deployment of these techniques ensures that the data that will be labeled are interesting in terms of diversity, thus optimizing an AI algorithm with the labeled data as train data. AL can be understood as a method for optimizing labeling resources. It is worth noting that Deep and Machine Learning techniques have been used for the AL algorithm. As a practical use case, recordings made in the port of Valencia have been employed obtained during the implementation of the Soroll-IA2 project funded by the Instituto Valenciano de Competitividad Empresarial (IVACE) and the European Regional Development Fund (ERDF). The project has been carried out during the Bachelor's degree internships at the Instituto Tecnológico de Informática (ITI).
[-]
[CA] El rendiment de solucions basades en tècniques d’Intel.ligència Artificial (IA) depèn,
en gran mesura, del conjunt de dades utilitzat per al seu entrenament. No solament la
quantitat de dades, sinó la qualitat ...[+]
[CA] El rendiment de solucions basades en tècniques d’Intel.ligència Artificial (IA) depèn,
en gran mesura, del conjunt de dades utilitzat per al seu entrenament. No solament la
quantitat de dades, sinó la qualitat d’aquestes. L’objectiu principal d’aquest projecte és la
implementació d’un algorisme d’Aprenentatge Actiu (AL per les seues sigles en anglés)
en un context on la quantitat de dades disponibles no etiquetades és molt major que el
pressupost d’etiquetatge (en aquest projecte es treballarà amb senyals d’àudio ambientals). Per tant, la duració total del conjunt de dades és molt major al temps disposat per
etiquetar-lo. L’aplicació d’aquestes tècniques garanteix que les dades a etiquetar siguen
interessants en termes de diversitat, per tal d’optimitzar un entrenament d’un algorisme
d’IA amb la quantitat de dades etiquetades. Es pot entendre l’AL com un mètode per
a l’optimització dels recursos d’etiquetatge. Cal destacar que per a l’algoritme d’AL s’-
han utilitzat tècniques de Deep i Machine Learning. Com a cas pràctic d’ús s’han utilitzat
gravacions realitzades en el port de València obtingudes durant l’execució del projecte
Soroll-IA2 financiat per el Instituto Valenciano de Competitividad Empresarial (IVACE)
i el Fondo Europeo de Desarrollo Regional (FEDER). El projecte s’ha realitzat durant les
pràctiques de Grau a l’Institut Tecnològic d’Informàtica (ITI).
[-]
|