- -

Automatic speaker diarization based on deep learning and its application to audiovisual subtitling

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Automatic speaker diarization based on deep learning and its application to audiovisual subtitling

Mostrar el registro completo del ítem

Cano Caravaca, V. (2023). Automatic speaker diarization based on deep learning and its application to audiovisual subtitling. Universitat Politècnica de València. http://hdl.handle.net/10251/197788

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/197788

Ficheros en el ítem

Metadatos del ítem

Título: Automatic speaker diarization based on deep learning and its application to audiovisual subtitling
Otro titulo: Diferenciació automàtica de locutors amb aprenentatge profund i aplicació a la subtitulació audiovisual
Automatic speaker diarization based on deep learning and its application to audiovisual subtitling
Autor: Cano Caravaca, Vicent
Director(es): Juan Císcar, Alfonso Silvestre Cerdà, Joan Albert
Entidad UPV: Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació
Fecha acto/lectura:
2023-09-21
Fecha difusión:
Resumen:
[ES] La diarizaci´on de locutores (SD, por su denominaci´on en ingl´es: Speaker Diarization) es una ´area de investigaci´on en constante evoluci´on. Se centra en el desarrollo de sistemas de segmentaci´on autom´atica de ...[+]


[CA] La diferenciació automàtica de locutors (SD, per la seua denominació en anglés: Speaker Diarization) és una àrea de recerca en constant evolució. Es centra en el desenvolupament de sistemes de segmentació automàtica ...[+]


[EN] Speaker Diarization is a constantly evolving research field. It focuses on the development of automatic systems capable of segmenting acoustic signals according to the speakers who intervene in them. This task is ...[+]
Palabras clave: Reconocimiento automático del habla (ASR) , Diferenciació automàtica de locutors , Aprenentatge automàtic , Aprenentatge profund. , Speaker diarization , Machine learning , Deep learning , Automatic Speech Recognition (ASR)
Derechos de uso: Reconocimiento - No comercial - Compartir igual (by-nc-sa)
Editorial:
Universitat Politècnica de València
Titulación: Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·ligència Artificial, Reconeixement de Formes i Imatge Digital
Tipo: Tesis de máster

recommendations

 

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro completo del ítem