Mostrar el registro sencillo del ítem
dc.contributor.advisor | López Monfort, José Javier | es_ES |
dc.contributor.author | Giurgica, Gabriel | es_ES |
dc.date.accessioned | 2021-10-11T13:49:29Z | |
dc.date.available | 2021-10-11T13:49:29Z | |
dc.date.created | 2021-07-23 | es_ES |
dc.date.issued | 2021-10-11 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/174442 | |
dc.description.abstract | [ES] Las orejas tienen un carácter único para cada persona. Debido a este hecho, el interés por determinar su forma ha aumentado considerablemente en las últimas décadas. Algunas aplicaciones en las que la detección de puntos de referencia del oído es útil son: Determinación de la función de transferencia relacionada con la cabeza, reconstrucción de la cabeza humana en 3D y aplicaciones biométricas. Este trabajo parte de la colección A de la base de datos de oído "In-the-wild", que contiene 605 imágenes de oído que contienen anotaciones para 55 puntos. Para compensar el tamaño limitado de la base de datos utilizada, se pueden utilizar varias técnicas de aumento de datos. Los mecanismos estándar utilizados para el aumento son: operaciones para rotar, voltear, cambiar brillo, contraste, tono, saturación o canales. Así, este trabajo presenta una comparación entre 5 pipelines de aumento de datos basados en las técnicas mencionadas anteriormente.Se utilizan para entrenar múltiples modelos con la misma arquitectura para la detección de puntos de referencia del oído. Los resultados obtenidos después de la capacitación se comparan para ver qué canalización de aumento de datos proporciona los mejores resultados. Además de comparar las 5 canalizaciones de aumento de datos, este trabajo también propone una nueva arquitectura de red neuronal, llamada ResNet-42, para detectar los puntos de referencia del oído. Además, se utiliza una función de pérdida diferente, a saber, Wing Loss, en contraste con las clásicas utilizadas hasta ahora para esta tarea. | es_ES |
dc.description.abstract | [EN] The ears have a unique character for each person. Due to this fact, the interest in determining its shape has increased considerably in recent decades. Some applications where the ear landmarks detection is useful are: Head-Related Transfer Function determination, 3D human head reconstruction and biometric applications. This work starts from collection A of the "In-the-wild" Ear Database, which contains 605 ear images containing annotations for 55-points. In order to compensate the limited size of the used database, several data augmentation techniques can be used. The standard mechanisms used for augmentation are: operations to rotate, flip, change brightness, contrast, hue, saturation or channels. Thus, this work presents a comparison between 5 data augmentation pipelines based on the previously mentioned techniques They are used to train multiple models with same architecture for ear landmarks detection. The results obtained after the training are then compared to see which data augmentation pipeline provides the best results In addition to comparing the 5 data augmentation pipelines, this work also proposes a new neural network architecture, called ResNet-42, for detecting the ear landmarks. Moreover, a different loss function, namely the Wing Loss, is used in contrast to the classical ones used so far for this task. | en_EN |
dc.format.extent | 40 | es_ES |
dc.language | Inglés | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | Aumento de datos | es_ES |
dc.subject | Oído | es_ES |
dc.subject | Detección de puntos de referencia | es_ES |
dc.subject | Aprendizaje profundo | es_ES |
dc.subject | ResNet | es_ES |
dc.subject | Data Augumentation | en_EN |
dc.subject | Ear | en_EN |
dc.subject | Landmarks detection | en_EN |
dc.subject | Deep learning | en_EN |
dc.subject.classification | TEORIA DE LA SEÑAL Y COMUNICACIONES | es_ES |
dc.subject.other | Máster Universitario en Tecnologías, Sistemas y Redes de Comunicaciones-Màster Universitari en Tecnologies, Sistemes i Xarxes de Comunicacions | es_ES |
dc.title | Reconstrucción 3D de la cabeza mediante fotografía para modelado de audio 3D | es_ES |
dc.type | Tesis de máster | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Comunicaciones - Departament de Comunicacions | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros de Telecomunicación - Escola Tècnica Superior d'Enginyers de Telecomunicació | es_ES |
dc.description.bibliographicCitation | Giurgica, G. (2021). Reconstrucción 3D de la cabeza mediante fotografía para modelado de audio 3D. Universitat Politècnica de València. http://hdl.handle.net/10251/174442 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\144358 | es_ES |