- -

VISMAID: Visual Impairment Support through Multimodal AI-driven Description

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

VISMAID: Visual Impairment Support through Multimodal AI-driven Description

Mostrar el registro completo del ítem

Camas Nájera, R. (2024). VISMAID: Visual Impairment Support through Multimodal AI-driven Description. Universitat Politècnica de València. http://hdl.handle.net/10251/209988

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/209988

Ficheros en el ítem

Metadatos del ítem

Título: VISMAID: Visual Impairment Support through Multimodal AI-driven Description
Otro titulo: ADVISIAM: Apoyo a la Discapacidad Visual con Inteligencia Artificial Multimodal
ADVISIAM: Suport a la Discapacitat Visual amb Intel·ligència Artificial Multimodal
Autor: Camas Nájera, Ramsés
Director(es): Casacuberta Nolla, Francisco
Entidad UPV: Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació
Fecha acto/lectura:
2024-09-25
Fecha difusión:
Resumen:
[ES] En estos días, la cantidad de personas de edad avanzada es cada vez mayor, y con la vejez vienen los problemas de salud, ese es el caso de la pérdida parcial o total de la visión, sólo en España 920,900 personas tiene ...[+]


[EN] On these days, the amount of people of advanced age is increasing, and with the elderly comes health issues, that is the case for partial or total loss of vision, only in Spain 920,900 people has low vision and 58,300 ...[+]
Palabras clave: Multimodalidad , Visual Question Answering , Mixture-of-Experts , Large Language Models , Small Large Language Models , Aplicación Móvil , Deep Learning , Grandes Modelos del lenguaje , Modelo Visual y de Lenguaje , Chatbot , Transformer , Aprendizaje Automático , Procesamiento de Lenguaje Natural , Reconocimiento Automático del Habla , Visión por Computadora , Multimodality , Mobile Application , Visual-Language Model , Machine Learning , Natural Language Processing , Automatic Speech Recognition , Computer Vision , ChatGPT
Derechos de uso: Reserva de todos los derechos
Editorial:
Universitat Politècnica de València
Titulación: Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·ligència Artificial, Reconeixement de Formes i Imatge Digital
Tipo: Tesis de máster

recommendations

 

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro completo del ítem