Europarl-ASR: A Large Corpus of Parliamentary Debates for Streaming ASR Benchmarking and Speech Data Filtering/Verbatimization

Garcés Díaz-Munío, Gonçal; Silvestre Cerdà, Joan Albert; Jorge-Cano, Javier; Giménez Pastor, Adrián; Iranzo-Sánchez, Javier; Baquero-Arnal, Pau; Roselló, Nahuel; Pérez-González de Martos, Alejandro Manuel; Civera Saiz, Jorge; Sanchis Navarro, José Alberto; Juan, Alfons

doi:10.21437/Interspeech.2021-1905

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Europarl-ASR: A Large Corpus of Parliamentary Debates for Streaming ASR Benchmarking and Speech Data Filtering/Verbatimization

Mostrar el registro completo del ítem

Garcés Díaz-Munío, G.; Silvestre Cerdà, JA.; Jorge-Cano, J.; Giménez Pastor, A.; Iranzo-Sánchez, J.; Baquero-Arnal, P.; Roselló, N.... (2021). Europarl-ASR: A Large Corpus of Parliamentary Debates for Streaming ASR Benchmarking and Speech Data Filtering/Verbatimization. International Speech Communication Association (ISCA). 3695-3699. https://doi.org/10.21437/Interspeech.2021-1905

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/192418

Ficheros en el ítem

Nombre: GarcesSilvestreJo ...

Tamaño: 189.0Kb

Formato: PDF

Descripción: Versión editorial

Abrir/Preview

Metadatos del ítem

Título:

Europarl-ASR: A Large Corpus of Parliamentary Debates for Streaming ASR Benchmarking and Speech Data Filtering/Verbatimization

Autor:

Garcés Díaz-Munío, Gonçal

Silvestre Cerdà, Joan Albert

Jorge-Cano, Javier Giménez Pastor, Adrián

Iranzo-Sánchez, Javier Baquero-Arnal, Pau Roselló, Nahuel

Pérez-González de Martos, Alejandro Manuel

Civera Saiz, Jorge

Sanchis Navarro, José Alberto

Juan, Alfons

Entidad UPV:

Universitat Politècnica de València. Escuela Politécnica Superior de Alcoy - Escola Politècnica Superior d'Alcoi
Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica

Fecha difusión:

2021-09-03

Resumen:

[EN] We introduce Europarl-ASR, a large speech and text corpus of parliamentary debates including 1300 hours of transcribed speeches and 70 million tokens of text in English extracted from European Parliament sessions. The ...[+]

[CA] "Europarl-ASR: Un extens corpus parlamentari de referència per a reconeixement de la parla i filtratge/literalització de transcripcions": Presentem Europarl-ASR, un extens corpus de veu i text de debats parlamentaris ...[+]

Palabras clave:

Automatic speech recognition , Speech corpus , Speech data filtering , Speech data verbatimization

Derechos de uso:

Reserva de todos los derechos

Fuente:

Proc. Interspeech 2021.

DOI:

10.21437/Interspeech.2021-1905

Editorial:

International Speech Communication Association (ISCA)

Versión del editor:

https://doi.org/10.21437/Interspeech.2021-1905

Título del congreso:

22nd Annual Conference of the International Speech Communication Association (INTERSPEECH 2021)

Lugar del congreso:

Brno, Czechia

Fecha congreso:

Agosto 30-Septiembre 03,2021

Código del Proyecto:

info:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020/RTI2018-094879-B-I00/ES/SUBTITULACION MULTILINGUE DE CLASES DE AULA Y SESIONES PLENARIAS/
...[+]

Agradecimientos:

This work has received funding from the EU's H2020 research and innovation programme under grant agreements 761758 (X5gon) and 952215 (TAILOR); the Government of Spain's research project Multisub (RTI2018-094879-B-I00, ...[+]

Tipo:

Comunicación en congreso

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro completo del ítem

Europarl-ASR: A Large Corpus of Parliamentary Debates for Streaming ASR Benchmarking and Speech Data Filtering/Verbatimization

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Europarl-ASR: A Large Corpus of Parliamentary Debates for Streaming ASR Benchmarking and Speech Data Filtering/Verbatimization

Ficheros en el ítem

Metadatos del ítem

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)

Ítems relacionados