- -

Synthetic data generation and data augmentation techniques for image captioning with Stable Diffusion and large language models.

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Synthetic data generation and data augmentation techniques for image captioning with Stable Diffusion and large language models.

Mostrar el registro completo del ítem

Prieto Medina, DA. (2024). Synthetic data generation and data augmentation techniques for image captioning with Stable Diffusion and large language models. Universitat Politècnica de València. http://hdl.handle.net/10251/210944

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/210944

Ficheros en el ítem

Metadatos del ítem

Título: Synthetic data generation and data augmentation techniques for image captioning with Stable Diffusion and large language models.
Otro titulo: Synthetic data generation and data augmentation techniques for image captioning with Stable Diffusion and large language models.
Generació de dades sintètiques i tècniques d'augmentació de dades per a descripció d'imatges amb Stable Diffusion i models de llenguatge de gran tamany.
Autor: Prieto Medina, Daniel Alejandro
Director(es): Domingo Ballester, Miguel
Entidad UPV: Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació
Fecha acto/lectura:
2024-09-27
Fecha difusión:
Resumen:
[ES] Conseguir a gran escala un conjunto de datos de calidad resulta ser una tarea costosa a nivel de recursos y tiempo, en especial cuando son necesarias anotaciones más elaboradas. Esto se ha vuelto un punto de cada vez ...[+]


[EN] To find a large quantity of high-quality data is a very expensive task on terms of both resources and time, specially when more elaborate annotations are needed. This has become a point of increasing relevance, given ...[+]
Palabras clave: Descripción de imágenes , Modelos de lenguaje , Stable diffusion , Image captioning , Large language models
Derechos de uso: Reconocimiento - No comercial (by-nc)
Editorial:
Universitat Politècnica de València
Titulación: Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·ligència Artificial, Reconeixement de Formes i Imatge Digital
Tipo: Tesis de máster

recommendations

 

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro completo del ítem