- -

Europarl-ASR: A Large Corpus of Parliamentary Debates for Streaming ASR Benchmarking and Speech Data Filtering/Verbatimization

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Europarl-ASR: A Large Corpus of Parliamentary Debates for Streaming ASR Benchmarking and Speech Data Filtering/Verbatimization

Mostrar el registro completo del ítem

Garcés Díaz-Munío, G.; Silvestre Cerdà, JA.; Jorge-Cano, J.; Giménez Pastor, A.; Iranzo-Sánchez, J.; Baquero-Arnal, P.; Roselló, N.... (2021). Europarl-ASR: A Large Corpus of Parliamentary Debates for Streaming ASR Benchmarking and Speech Data Filtering/Verbatimization. International Speech Communication Association (ISCA). 3695-3699. https://doi.org/10.21437/Interspeech.2021-1905

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/192418

Ficheros en el ítem

Metadatos del ítem

Título: Europarl-ASR: A Large Corpus of Parliamentary Debates for Streaming ASR Benchmarking and Speech Data Filtering/Verbatimization
Autor: Garcés Díaz-Munío, Gonçal Silvestre Cerdà, Joan Albert Jorge-Cano, Javier Giménez Pastor, Adrián Iranzo-Sánchez, Javier Baquero-Arnal, Pau Roselló, Nahuel Pérez-González de Martos, Alejandro Manuel Civera Saiz, Jorge Sanchis Navarro, José Alberto Juan, Alfons
Entidad UPV: Universitat Politècnica de València. Escuela Politécnica Superior de Alcoy - Escola Politècnica Superior d'Alcoi
Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica
Fecha difusión:
Resumen:
[EN] We introduce Europarl-ASR, a large speech and text corpus of parliamentary debates including 1300 hours of transcribed speeches and 70 million tokens of text in English extracted from European Parliament sessions. The ...[+]


[Otros] "Europarl-ASR: Un extens corpus parlamentari de referència per a reconeixement de la parla i filtratge/literalització de transcripcions": Presentem Europarl-ASR, un extens corpus de veu i text de debats parlamentaris ...[+]
Palabras clave: Automatic speech recognition , Speech corpus , Speech data filtering , Speech data verbatimization
Derechos de uso: Reserva de todos los derechos
Fuente:
Proc. Interspeech 2021.
DOI: 10.21437/Interspeech.2021-1905
Editorial:
International Speech Communication Association (ISCA)
Versión del editor: https://doi.org/10.21437/Interspeech.2021-1905
Título del congreso: 22nd Annual Conference of the International Speech Communication Association (INTERSPEECH 2021)
Lugar del congreso: Brno, Czechia
Fecha congreso: Agosto 30-Septiembre 03,2021
Código del Proyecto:
info:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020/RTI2018-094879-B-I00/ES/SUBTITULACION MULTILINGUE DE CLASES DE AULA Y SESIONES PLENARIAS/
...[+]
info:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020/RTI2018-094879-B-I00/ES/SUBTITULACION MULTILINGUE DE CLASES DE AULA Y SESIONES PLENARIAS/
info:eu-repo/grantAgreement/ //FPU18%2F04135//AYUDA PREDOCTORAL FPU-IRANZO SANCHEZ. PROYECTO: NOVEL CONTRIBUTIONS TO NEURAL SPEECH TRANSLATION/
info:eu-repo/grantAgreement/EC/H2020/761758/EU
info:eu-repo/grantAgreement///PROMETEO%2F2019%2F111//CLASSROOM ACTIVITY RECOGNITION/
info:eu-repo/grantAgreement/EC/H2020/952215/EU
info:eu-repo/grantAgreement///ACIF%2F2017%2F055//AYUDA PREDOCTORAL CONSELLERIA-BAQUERO ARNAL/
info:eu-repo/grantAgreement/MECD//FPU14%2F03981/ES/FPU14%2F03981/
info:eu-repo/grantAgreement/UPV//PAID-01-17//Contratos Pre-Doctorales UPV 2017- Subprograma 1/
[-]
Agradecimientos:
This work has received funding from the EU¿s H2020 research and innovation programme under grant agreements 761758 (X5gon) and 952215 (TAILOR); the Government of Spain¿s research project Multisub (RTI2018-094879-B-I00, ...[+]
Tipo: Comunicación en congreso

recommendations

 

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro completo del ítem