Estudio y comparativa de diferentes modelos de difusión para generación condicional de caras

Juan González, Jorge

RiuNet repositorio UPV
:
Docencia
:
Trabajos académicos
:
Servicio de alumnado - Trabajos académicos
:
Ver ítem

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Estudio y comparativa de diferentes modelos de difusión para generación condicional de caras

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Juan - Estudio y ...

Tamaño: 7.031Mb

Formato: PDF

Abrir

dc.contributor.advisor	Paredes Palacios, Roberto	es_ES
dc.contributor.author	Juan González, Jorge	es_ES
dc.date.accessioned	2023-10-20T11:15:04Z
dc.date.available	2023-10-20T11:15:04Z
dc.date.created	2023-07-26
dc.date.issued	2023-10-20	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/198454
dc.description.abstract	[ES] El problema de la síntesis de imágenes ha ganado mucha atención en los últimos años por la aparición de modelos de difusión capaces de generar imágenes con una calidad y variedad sin precedentes. En este trabajo analizaremos qué son los modelos de difusión, cómo pueden generar imágenes, qué mecanismos existen para condicionar este tipo de modelos, qué papel juega la arquitectura Transformer en estos modelos y en su condicionamiento; y qué métricas se utilizan para evaluar modelos de difusión. Evaluaremos y compararemos el desempeño de diferentes modelos de difusión (DDPM condicionado por atributos y Stable Diffusion condicionado por texto) en la tarea de síntesis de imágenes, en concreto síntesis condicional de caras. Evaluaremos tanto la calidad de las imágenes generadas como la fidelidad con la que los distintos modelos de difusión se ajustan al condicionamiento. La métrica más utilizada para medir la calidad del condicionamiento en modelos generativos de imágenes es CLIP Score aunque esta métrica está limitada a modelos que generan imágenes a partir de texto y utiliza el modelo CLIP por lo que está sujeta al sesgo que pueda tener este modelo. Para reforzar los resultados de la evaluación entrenaremos un modelo que estime la condición usada a partir de la imagen generada con el objetivo de usar este modelo como métrica complementaria a CLIP Score.	es_ES
dc.description.abstract	[EN] The problem of image synthesis has gained much attention in recent years due to the emergence of diffusion models capable of generating images with unprecedented quality and variety. In this paper we will analyze what diffusion models are, how they can generate images, what mechanisms exist to condition this type of models, what role the Transformer architecture plays in these models and in their conditioning; and what metrics are used to evaluate diffusion models. We will evaluate and compare the performance of different diffusion models (attribute-conditioned DDPM and text-conditioned Stable Diffusion) on the task of image synthesis, specifically conditional face synthesis. We will evaluate both the quality of the generated images and the fidelity with which the different diffusion models match the conditioning. The most commonly used metric to measure the quality of conditioning in image generative models is CLIP Score although this metric is limited to models that generate images from text and uses the CLIP model so it is subject to the bias that this model may have. To strengthen the evaluation results we will train a model that estimates the condition used from the generated image in order to use this model as a complementary metric to CLIP Score.	es_ES
dc.format.extent	59	es_ES
dc.language	Español	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reserva de todos los derechos	es_ES
dc.subject	Modelos generativos	es_ES
dc.subject	Modelos de difusión	es_ES
dc.subject	Transformers	es_ES
dc.subject	Evaluación	es_ES
dc.subject	Comparativa.	es_ES
dc.subject	Generative models	es_ES
dc.subject	Diffusion models	es_ES
dc.subject	Evaluation	es_ES
dc.subject	Comparison.	es_ES
dc.subject.classification	LENGUAJES Y SISTEMAS INFORMATICOS	es_ES
dc.subject.other	Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·ligència Artificial, Reconeixement de Formes i Imatge Digital	es_ES
dc.title	Estudio y comparativa de diferentes modelos de difusión para generación condicional de caras	es_ES
dc.title.alternative	Study and comparison of different diffusion models for conditional face generation	es_ES
dc.title.alternative	Estudi i comparativa de diferents models de difusió per a generació condicional de cares	es_ES
dc.type	Tesis de máster	es_ES
dc.rights.accessRights	Abierto	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació	es_ES
dc.description.bibliographicCitation	Juan González, J. (2023). Estudio y comparativa de diferentes modelos de difusión para generación condicional de caras. Universitat Politècnica de València. http://hdl.handle.net/10251/198454	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\158897	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

Servicio de alumnado - Trabajos académicos [7391]

Mostrar el registro sencillo del ítem

Estudio y comparativa de diferentes modelos de difusión para generación condicional de caras

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Estudio y comparativa de diferentes modelos de difusión para generación condicional de caras

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)