Abstract:
|
[ES] El reconocimiento automático del habla (ASR, del inglés “Automatic Speech Recognition”)
es una de las áreas más activas dentro de la inteligencia artificial y
el aprendizaje automático. En esta área viene trabajando ...[+]
[ES] El reconocimiento automático del habla (ASR, del inglés “Automatic Speech Recognition”)
es una de las áreas más activas dentro de la inteligencia artificial y
el aprendizaje automático. En esta área viene trabajando activamente el grupo
de investigación "Machine Learning and Language Processing"(MLLP) del DSIC,
principalmente a través de los proyectos europeos FP7 transLectures (2011-2014)
y EMMA (2014-2016), el proyecto MINECO MORE (2016-2018), así como el proyecto
europeo H2020 X5gon, el cual se encuentra en su primer año de ejecución
(2017-2020). El trabajo desarrollado en estos proyectos ha dado lugar a sistemas
avanzados de ASR en diversas lenguas, los cuales están siendo utilizados en el subtitulado
automático de vídeos educativos del repositorio oficial de la UPV, “media
UPV”, así como de repositorios de otras instituciones académicas como, por ejemplo,
la Universidad Carlos III de Madrid, la Universidad de Lisboa y el Instituto
Hasso Plattner alemán. Si bien el grupo MLLP ha desarrollado sistemas avanzados
de ASR en diversas lenguas de la Unión Europea, tanto mayoritarias como
minoritarias, hasta el momento no dispone de un sistema de ASR en Rumano que
pudiera aplicarse a “media UP” u otros repositorios educativos. Una de las razones
por las cuales no se dispone de dicho sistema es la falta de recursos lingüísticos en
Rumano. Ahora bien, recientemente ha sido posible acceder a algunas fuentes de
recursos lingüísticos en Rumano, por lo que que ya es posible construir un sistema
de ASR en Rumano aceptablemente preciso. El trabajo que se propone, consiste
en construir un sistema de ASR en Rumano tan preciso como sea posible, siempre
dentro de las condiciones del TFG. Durante el TFG, se han realizado algunos
trabajos experimentales que han conducido a la construcción y la evaluación del
sistema ASR en Rumano objetivo del TFG.
[-]
[CA] El reconeixement automàtic de la parla(ASR, del anglès “Automatic Speech Recognition”)
es una de de les àrees més actives dins de la inteligència artificial i el
aprenentatge automàtic. En aquesta àrea ve treballant ...[+]
[CA] El reconeixement automàtic de la parla(ASR, del anglès “Automatic Speech Recognition”)
es una de de les àrees més actives dins de la inteligència artificial i el
aprenentatge automàtic. En aquesta àrea ve treballant activament el grup de investigació
“Machine Learning and Language Processing” (MLLP) del DSIC, principalment
a través dels projectes europeus FP7 transLectures (2011-2014) y EMMA
(2014-2016), el projecte MINECO MORE(2016-2018), així com el projecte europeu
H2020 X5gon, que es troba en el seu primer any de execució (2017-2020). El
treball desenvolupat en aquests projectes ha donat lloc a sistemes avançats d’ASR
en diverses llengües, els quals estàn siguent utilitzats en el subtitulat automàtic de
vídeos educatius del repositòri oficial de la UPV, “media UPV”, així com de repositoris
de altres institucions acadèmiques com, per exèmple, la Universitat Carlos
III de Madrid, la Universitat de Lisboa y el Institut Hasso Plattner alemany. Si bé
el grup MLLP ha desenvolupat sistemes avançats d’ASR en divèrses llengües de la
Unió Europea, tant majoritàries com minoritàries, fins el moment no disposa d’un
sistema d’ASR en Romanés que puguera aplicarse a “media UPV” o altres repositòris
educatius. Una de les raons per les quals no disposa d’un sistema semblant és
la falta de recursos llingüístics en Romanés. Ara bé, recentment ha sigut possible
accedir a algunes fonts de recursos llingüístics en Romanés, per lo que que ja és
possible construir un sistema d’ASR en Romanés acceptablement precís. El treball
que es proposa consisteix en construir un sistema d’ASR en Romanés tan precís
com siga possible, sempre dintre de les condicions del TFG. Durant el TFG, s’ha
portat a terme alguns treballs experimentals que han conduït a la construcció y
evaluació del sistema ASR en Romanés objectiu del TFG.
[-]
[EN] Automatic Speech Recognition, or ASR, is one of the most active areas in artifficial
intelligence and machine learning. The investigation group “Machine Learning
and Language Processing” (MLLP) from DSIC deparment ...[+]
[EN] Automatic Speech Recognition, or ASR, is one of the most active areas in artifficial
intelligence and machine learning. The investigation group “Machine Learning
and Language Processing” (MLLP) from DSIC deparment is actively mainly working
in this area through the european projects FP7 transLectures (2011-2014)
and EMMA (2014-2016), the MINECO MORE project (2016-2018), and the european
project H2020 X5gon, which is in it’s first year of execution (2017-2020).
The work developed in this projects led to advanced ASR systems in different
languages, which are used to subtitle educational videos automatically from the
official repository of the UPV, “media UPV”, and also other repositorys from other
institutions such as “Universidad Carlos III” from Madrid, Lisbon University
and the german Institute Hasso Plattner. Althought MLLP group has developed
advanced ASR systems for different majority and minority languages from the European
Union, it does not have any ASR system for Romanian language that can
be used for “media UPV” or other educational repositorys. One of the reasons why
this system is not available is because of the lack of Romanian linguistic resources.
However, recently it was possible to access a few Romanian linguistic resources, so
it is already possible to build an Romanian ASR system that is accurate enough.
The proposed project consists in building a Romanian ASR system as accurate as
possible inside the terms of the TFG. During the TFG, many experimental tasks
have been done that led to the building and evaluating the objective of the TFG
which is the Romanian ASR system
[-]
|