Buscar en RiuNet

Listar

Todo RiuNet

Mi cuenta

Acceder

Ayuda RiuNet

Admin. UPV

Listar por palabra clave "Speech recognition"

Mostrando ítems 1-20 de 26

Página siguiente

Advances in Interactive Speech Transcription

Sánchez Cortina, Isaías (Universitat Politècnica de València, 2012-11-26)

[ES] Novedoso sistema interactivo para la transcripción del habla que compensa el esfuerzo del usuario y el error máximo tolerado en las transcripciones resultantes.
Albayzin Evaluation: The PRHLT-UPV Audio Segmentation System

Silvestre Cerdà, Joan Albert; Giménez Pastor, Adrián; Andrés Ferrer, Jesús; Civera Saiz, Jorge; Juan Císcar, Alfonso (Ramos Castro, Daniel, 2012-11-21)

This paper describes the audio segmentation system developed by the PRHLT research group at the UPV for the Albayzin Audio Segmentation Evaluation 2012. The PRHLT-UPV audio segmentation system is based on a conventional ...
Análisis de la eficiencia de diferentes estructuras de datos en el algoritmo de decodificación de Viterbi aplicado a reconocimiento de voz y de escritura manuscrita

Almendros Cuquerella, Carlos (Universitat Politècnica de València, 2017-09-04)

[ES] En el presente trabajo se expone el proceso llevado a cabo para desarrollar las estructuras de datos necesarias para que un reconocedor de voz basado en el algoritmo de Viterbi pueda funcionar en tiempo real, junto ...
Análisis de la utilización de grafos de palabras como salida de un reconocedor de voz para representar pronunciaciones alternativas

Almendros Cuquerella, Carlos (Universitat Politècnica de València, 2019-01-21)

En el presente trabajo se expone el proceso llevado a cabo para transformar un sistema de reconocimiento del habla con salida única en uno capaz de proporcionar un grafo de salida con múltiples posibles transcripciones ...
ASLP-MULAN: Audio speech and language processing for multimedia analytics

Ferreiros Lopez, Javier; Pardo Muñoz, José Manuel; Hurtado Oliver, Lluis Felip; Segarra Soriano, Encarnación; Ortega Giménez, Alfonso; Lleida, Eduardo; Torres, María Inés; Justo, Raquel (Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN), 2016-09)

[EN] Our intention is generating the right mixture of audio, speech and language technologies with big data ones. Some audio, speech and language automatic technologies are available or gaining enough degree of maturity ...
Comparació de les eines informàtiques TLK i Kaldi per al desenvolupament de sistemes de reconeixement de la parla en català/valencià

Baquero Arnal, Pau (Universitat Politècnica de València, 2016-09-05)

[CA] En aquest treball es comparen les eines de reconeixement de la parla TLK i Kaldi per al desenvolupament de sistemes de reeconeixement en catalá.
Decision Support Systems Aiming in Reducing Globalization Burdens in Education

Mercier-Laurent, Eunika; Haddad, Rabih (Editorial Universitat Politècnica de València, 2019-07-05)

[EN] The potential drawbacks that globalization might have on education are increasing and becoming a main worry. The number of international students is increasing and students’ mobility is becoming a crucial phenomenon ...
Deep Learning for Intelligent Human-Computer Interaction

Lv, Zhihan; Poiesi, Fabio; Dong, Qi; Lloret, Jaime; Song, Houbing (MDPI AG, 2022-11)

[EN] In recent years, gesture recognition and speech recognition, as important input methods in Human-Computer Interaction (HCI), have been widely used in the field of virtual reality. In particular, with the rapid development ...
Desarrollo de un sistema de Reconocimiento Automático del Habla en Rumano para el subtitulado de vídeos educativos

Colompar, Beniamin Cristian (Universitat Politècnica de València, 2018-10-23)

[ES] El reconocimiento automático del habla (ASR, del inglés “Automatic Speech Recognition”) es una de las áreas más activas dentro de la inteligencia artificial y el aprendizaje automático. En esta área viene trabajando ...
Desarrollo e implementación de un asistente virtual para Linux

Fernández Pardo, Cristian (Universitat Politècnica de València, 2015-03-25)

[ES] El objetivo del presente trabajo es profundizar en los fundamentos teóricos necesarios en el reconocimiento del habla y en el diseño e implementación para el desarrollo de un asistente virtual que, mediante sencillas ...
Diseño e implementación de una aplicación con interfaz de voz

Pérez Pérez, Marc (Universitat Politècnica de València, 2021-10-14)

[ES] Aunque las películas lo dan por hecho y las aplicaciones en los móviles nos han acostumbrado a su disponibilidad, el uso de la voz como mecanismo de interacción entre el hombre y la máquina no ha llegado con la misma ...
Extensión de funcionalidades de una aplicación para la programación en Java para personas con diversidad funcional

Font Vicedo, Andrés (Universitat Politècnica de València, 2020-10-13)

[ES] En este proyecto se van a extender las funcionalidades del plugin COPS, una aplicación para facilitar la programación en el entorno Eclipse a personas con diversidad funcional. Esto se va a conseguir mejorando por ...
Image speech combination for interactive computer assisted transcription of handwritten documents

Granell, Emilio; Romero, Verónica; Martínez-Hinarejos, Carlos-D. (Elsevier, 2019)

[EN] Handwritten document transcription aims to obtain the contents of a document to provide efficient information access to, among other, digitised historical documents. The increasing number of historical documents ...
Incremental and Adaptive Learning for Interactive Machine Translation

Toselli, Alejandro Héctor; Vidal, Enrique; Casacuberta, Francisco; Ortiz Martínez, Daniel; García Varea, Ismael (Springer, 2011)

[EN] High-quality translation between any pair of languages can be achieved by human post-editing of the outputs of a MT system or by following the Interactive Machine Translation (IMT) approach. In the interactive pattern ...
Integración multimodal de entradas en ROS2 para control de múltiples robots: Desde teclado hasta comandos de voz

Herráez Coll, José Vicente (Universitat Politècnica de València, 2024-10-17)

[ES] Este trabajo de grado aborda la integración multimodal en ROS2 mediante una estructura de nodos que facilita la comunicación entre los diferentes dispositivos de entrada y los robots. Se desarrolla una arquitectura ...
Integration of Machine Learning and Language Processing Technologies into Video Lecture Platforms

Pérez González de Martos, Alejandro Manuel (Universitat Politècnica de València, 2015-07-17)

[EN] Integration of automatic speech recognition and machine translation technologies into multiple plataforms (poliMedia, VideoLectures.NET, Opencast Matterhorn)
Introducing Voice Recognition into Higher Education

Dittrich, Toby; Star, Sequoia (Editorial Universitat Politècnica de València, 2018-07-02)

[EN] Voice Recognition (VR) software has now evolved to be fast and accurate enough to be useful in many educational settings. This paper describes two new uses for VR technology, both protected by patents, which can ...
Multilingual videos for MOOCs and OER

Valor Miró, Juan Daniel; Baquero-Arnal, Pau; Civera Saiz, Jorge; Turró Ribalta, Carlos; Juan, Alfons (International Forum of Educational Technology & Society, 2018)

[EN] Massive Open Online Courses (MOOCs) and Open Educational Resources (OER) are rapidly growing, but are not usually offered in multiple languages due to the lack of cost-effective solutions to translate the different ...
Multimodal Crowdsourcing for Transcribing Handwritten Documents

Granell Romero, Emilio; Martínez Hinarejos, Carlos David (Institute of Electrical and Electronics Engineers (IEEE), 2017-02)

[EN] Transcription of handwritten documents is an important research topic for multiple applications, such as document classification or information extraction. In the case of historical documents, their transcription ...
On the voice-activated question answering

Rosso, Paolo; Hurtado Oliver, Lluis Felip; Segarra Soriano, Encarnación; Sanchís Arnal, Emilio (Institute of Electrical and Electronics Engineers (IEEE), 2012-01)

[EN] Question answering (QA) is probably one of the most challenging tasks in the field of natural language processing. It requires search engines that are capable of extracting concise, precise fragments of text that ...