- -

Estudio y comparativa de diferentes modelos de difusión para generación condicional de caras

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Estudio y comparativa de diferentes modelos de difusión para generación condicional de caras

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Paredes Palacios, Roberto es_ES
dc.contributor.author Juan González, Jorge es_ES
dc.date.accessioned 2023-10-20T11:15:04Z
dc.date.available 2023-10-20T11:15:04Z
dc.date.created 2023-07-26
dc.date.issued 2023-10-20 es_ES
dc.identifier.uri http://hdl.handle.net/10251/198454
dc.description.abstract [ES] El problema de la síntesis de imágenes ha ganado mucha atención en los últimos años por la aparición de modelos de difusión capaces de generar imágenes con una calidad y variedad sin precedentes. En este trabajo analizaremos qué son los modelos de difusión, cómo pueden generar imágenes, qué mecanismos existen para condicionar este tipo de modelos, qué papel juega la arquitectura Transformer en estos modelos y en su condicionamiento; y qué métricas se utilizan para evaluar modelos de difusión. Evaluaremos y compararemos el desempeño de diferentes modelos de difusión (DDPM condicionado por atributos y Stable Diffusion condicionado por texto) en la tarea de síntesis de imágenes, en concreto síntesis condicional de caras. Evaluaremos tanto la calidad de las imágenes generadas como la fidelidad con la que los distintos modelos de difusión se ajustan al condicionamiento. La métrica más utilizada para medir la calidad del condicionamiento en modelos generativos de imágenes es CLIP Score aunque esta métrica está limitada a modelos que generan imágenes a partir de texto y utiliza el modelo CLIP por lo que está sujeta al sesgo que pueda tener este modelo. Para reforzar los resultados de la evaluación entrenaremos un modelo que estime la condición usada a partir de la imagen generada con el objetivo de usar este modelo como métrica complementaria a CLIP Score. es_ES
dc.description.abstract [EN] The problem of image synthesis has gained much attention in recent years due to the emergence of diffusion models capable of generating images with unprecedented quality and variety. In this paper we will analyze what diffusion models are, how they can generate images, what mechanisms exist to condition this type of models, what role the Transformer architecture plays in these models and in their conditioning; and what metrics are used to evaluate diffusion models. We will evaluate and compare the performance of different diffusion models (attribute-conditioned DDPM and text-conditioned Stable Diffusion) on the task of image synthesis, specifically conditional face synthesis. We will evaluate both the quality of the generated images and the fidelity with which the different diffusion models match the conditioning. The most commonly used metric to measure the quality of conditioning in image generative models is CLIP Score although this metric is limited to models that generate images from text and uses the CLIP model so it is subject to the bias that this model may have. To strengthen the evaluation results we will train a model that estimates the condition used from the generated image in order to use this model as a complementary metric to CLIP Score. es_ES
dc.format.extent 59 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Modelos generativos es_ES
dc.subject Modelos de difusión es_ES
dc.subject Transformers es_ES
dc.subject Evaluación es_ES
dc.subject Comparativa. es_ES
dc.subject Generative models es_ES
dc.subject Diffusion models es_ES
dc.subject Evaluation es_ES
dc.subject Comparison. es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·ligència Artificial, Reconeixement de Formes i Imatge Digital es_ES
dc.title Estudio y comparativa de diferentes modelos de difusión para generación condicional de caras es_ES
dc.title.alternative Study and comparison of different diffusion models for conditional face generation es_ES
dc.title.alternative Estudi i comparativa de diferents models de difusió per a generació condicional de cares es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Juan González, J. (2023). Estudio y comparativa de diferentes modelos de difusión para generación condicional de caras. Universitat Politècnica de València. http://hdl.handle.net/10251/198454 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\158897 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem