Exploring multimodal foundation models to improve interaction for people with speech impairments

Ferri Mollá, Isabel

RiuNet repositorio UPV
:
Docencia
:
Trabajos académicos
:
Servicio de alumnado - Trabajos académicos
:
Ver ítem

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Exploring multimodal foundation models to improve interaction for people with speech impairments

Mostrar el registro completo del ítem

Ferri Mollá, I. (2023). Exploring multimodal foundation models to improve interaction for people with speech impairments. Universitat Politècnica de València. http://hdl.handle.net/10251/197532

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/197532

Ficheros en el ítem

Nombre: Ferri - Exploring ...

Tamaño: 1.500Mb

Formato: PDF

Abrir/Preview

Metadatos del ítem

Título:

Exploring multimodal foundation models to improve interaction for people with speech impairments

Otro titulo:

Explorando modelos fundamentales multimodales para mejorar la interacción para personas con trastornos del habla
Explorant models fonamentals multimodals per millorar la interacció per a persones amb trastorns de la parla

Autor:

Ferri Mollá, Isabel

Director(es):

Linares Pellicer, Jordi Joan

Entidad UPV:

Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació

Fecha acto/lectura:

2023-09-19

Fecha difusión:

2023-10-04

Resumen:

[ES] Las personas con dificultades en la pronunciación, a menudo derivadas de patologías fisiológicas o cognitivas, enfrentan desafíos significativos al utilizar tecnologías de interacción por voz. Las tecnologías de ...[+]

[EN] People with pronunciation difficulties, often stemming from physiological or cognitive pathologies, face significant challenges when using voice interaction technologies. Current assistive technologies do not adequately ...[+]

Palabras clave:

Interacción Persona-Ordenador (HCI) , Modelo de lenguaje , Problemas de dicción , Descripción de imágenes , Foundation models , Pronunciation problems , Image captioning , Automatic Speech Recognition (ASR) , Language models

Derechos de uso:

Reserva de todos los derechos

Editorial:

Universitat Politècnica de València

Titulación:

Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·ligència Artificial, Reconeixement de Formes i Imatge Digital

Tipo:

Tesis de máster

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)

Servicio de alumnado - Trabajos académicos [7045]

Mostrar el registro completo del ítem

Exploring multimodal foundation models to improve interaction for people with speech impairments

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Exploring multimodal foundation models to improve interaction for people with speech impairments

Ficheros en el ítem

Metadatos del ítem

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)