Sánchez Cortina, Isaías(Universitat Politècnica de València, 2012-11-26)
[ES] Novedoso sistema interactivo para la transcripción del habla que compensa el esfuerzo del usuario y el error máximo tolerado en las transcripciones resultantes.
Silvestre Cerdà, Joan Albert; Giménez Pastor, Adrián; Andrés Ferrer, Jesús; Civera Saiz, Jorge; Juan Císcar, Alfonso(Ramos Castro, Daniel, 2012-11-21)
This paper describes the audio segmentation system developed
by the PRHLT research group at the UPV for the Albayzin Audio
Segmentation Evaluation 2012. The PRHLT-UPV audio segmentation
system is based on a conventional ...
Almendros Cuquerella, Carlos(Universitat Politècnica de València, 2017-09-04)
[ES] En el presente trabajo se expone el proceso llevado a cabo para desarrollar
las estructuras de datos necesarias para que un reconocedor de voz basado en el
algoritmo de Viterbi pueda funcionar en tiempo real, junto ...
Almendros Cuquerella, Carlos(Universitat Politècnica de València, 2019-01-21)
En el presente trabajo se expone el proceso llevado a cabo para transformar un sistema de reconocimiento del habla con salida única en uno capaz de proporcionar un grafo de salida con múltiples posibles transcripciones ...
Ferreiros Lopez, Javier; Pardo Muñoz, José Manuel; Hurtado Oliver, Lluis Felip; Segarra Soriano, Encarnación; Ortega Giménez, Alfonso; Lleida, Eduardo; Torres, María Inés; Justo, Raquel(Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN), 2016-09)
[EN] Our intention is generating the right mixture of audio, speech and language
technologies with big data ones. Some audio, speech and language automatic technologies are
available or gaining enough degree of maturity ...
Mercier-Laurent, Eunika; Haddad, Rabih(Editorial Universitat Politècnica de València, 2019-07-05)
[EN] The potential drawbacks that globalization might have on education are increasing and becoming a main worry. The number of international students is increasing and students’ mobility is becoming a crucial phenomenon ...
[EN] In recent years, gesture recognition and speech recognition, as important input methods in Human-Computer Interaction (HCI), have been widely used in the field of virtual reality. In particular, with the rapid development ...
Colompar, Beniamin Cristian(Universitat Politècnica de València, 2018-10-23)
[ES] El reconocimiento automático del habla (ASR, del inglés “Automatic Speech Recognition”)
es una de las áreas más activas dentro de la inteligencia artificial y
el aprendizaje automático. En esta área viene trabajando ...
Fernández Pardo, Cristian(Universitat Politècnica de València, 2015-03-25)
[ES] El objetivo del presente trabajo es profundizar en los fundamentos teóricos
necesarios en el reconocimiento del habla y en el diseño e implementación
para el desarrollo de un asistente virtual que, mediante sencillas ...
Pérez Pérez, Marc(Universitat Politècnica de València, 2021-10-14)
[ES] Aunque las películas lo dan por hecho y las aplicaciones en los móviles nos han acostumbrado a
su disponibilidad, el uso de la voz como mecanismo de interacción entre el hombre y la
máquina no ha llegado con la misma ...
Font Vicedo, Andrés(Universitat Politècnica de València, 2020-10-13)
[ES] En este proyecto se van a extender las funcionalidades del plugin COPS, una
aplicación para facilitar la programación en el entorno Eclipse a personas con
diversidad funcional. Esto se va a conseguir mejorando por ...
[EN] Handwritten document transcription aims to obtain the contents of a document to provide efficient information access to, among other, digitised historical documents. The increasing number of historical documents ...
[EN] High-quality translation between any pair of languages can be achieved by human post-editing of the outputs of a MT system or by following the Interactive Machine Translation (IMT) approach. In the interactive pattern ...
Herráez Coll, José Vicente(Universitat Politècnica de València, 2024-10-17)
[ES] Este trabajo de grado aborda la integración multimodal en ROS2 mediante una estructura de nodos que facilita la comunicación entre los diferentes dispositivos de entrada y los robots. Se desarrolla una arquitectura ...
Dittrich, Toby; Star, Sequoia(Editorial Universitat Politècnica de València, 2018-07-02)
[EN] Voice Recognition (VR) software has now evolved to be fast and accurate enough to be useful in many educational settings. This paper describes two new uses for VR technology, both protected by patents, which can ...
Valor Miró, Juan Daniel; Baquero-Arnal, Pau; Civera Saiz, Jorge; Turró Ribalta, Carlos; Juan, Alfons(International Forum of Educational Technology & Society, 2018)
[EN] Massive Open Online Courses (MOOCs) and Open Educational Resources (OER) are rapidly growing, but are not usually offered in multiple languages due to the lack of cost-effective solutions to translate the different ...
Granell Romero, Emilio; Martínez Hinarejos, Carlos David(Institute of Electrical and Electronics Engineers (IEEE), 2017-02)
[EN] Transcription of handwritten documents is an important research topic for multiple applications, such as document classification or information extraction. In the case of historical documents, their transcription ...
Rosso, Paolo; Hurtado Oliver, Lluis Felip; Segarra Soriano, Encarnación; Sanchís Arnal, Emilio(Institute of Electrical and Electronics Engineers (IEEE), 2012-01)
[EN] Question answering (QA) is probably one of the most challenging tasks in the field of natural language processing. It requires search engines that are capable of extracting concise, precise fragments of text that ...