- -

Automatic speaker diarization based on deep learning and its application to audiovisual subtitling

RiuNet: Institutional repository of the Polithecnic University of Valencia

Share/Send to

Cited by

Statistics

  • Estadisticas de Uso

Automatic speaker diarization based on deep learning and its application to audiovisual subtitling

Show full item record

Cano Caravaca, V. (2023). Automatic speaker diarization based on deep learning and its application to audiovisual subtitling. Universitat Politècnica de València. http://hdl.handle.net/10251/197788

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/197788

Files in this item

Item Metadata

Title: Automatic speaker diarization based on deep learning and its application to audiovisual subtitling
Secondary Title: Diferenciació automàtica de locutors amb aprenentatge profund i aplicació a la subtitulació audiovisual
Automatic speaker diarization based on deep learning and its application to audiovisual subtitling
Author: Cano Caravaca, Vicent
Director(s): Juan Císcar, Alfonso Silvestre Cerdà, Joan Albert
UPV Unit: Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació
Read date / Event date:
2023-09-21
Issued date:
Abstract:
[ES] La diarizaci´on de locutores (SD, por su denominaci´on en ingl´es: Speaker Diarization) es una ´area de investigaci´on en constante evoluci´on. Se centra en el desarrollo de sistemas de segmentaci´on autom´atica de ...[+]


[CA] La diferenciació automàtica de locutors (SD, per la seua denominació en anglés: Speaker Diarization) és una àrea de recerca en constant evolució. Es centra en el desenvolupament de sistemes de segmentació automàtica ...[+]


[EN] Speaker Diarization is a constantly evolving research field. It focuses on the development of automatic systems capable of segmenting acoustic signals according to the speakers who intervene in them. This task is ...[+]
Subjects: Reconocimiento automático del habla (ASR) , Diferenciació automàtica de locutors , Aprenentatge automàtic , Aprenentatge profund. , Speaker diarization , Machine learning , Deep learning , Automatic Speech Recognition (ASR)
Copyrigths: Reconocimiento - No comercial - Compartir igual (by-nc-sa)
Publisher:
Universitat Politècnica de València
degree: Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·ligència Artificial, Reconeixement de Formes i Imatge Digital
Type: Tesis de máster

recommendations

 

This item appears in the following Collection(s)

Show full item record