Integración de reconocimiento de voz y transcripción de audio a texto para una aplicación .NET

Fernández Almendros, Raúl

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Integración de reconocimiento de voz y transcripción de audio a texto para una aplicación .NET

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Fernandez - Integ ...

Tamaño: 5.373Mb

Formato: PDF

Solicitar una copia al autor

dc.contributor.advisor	Letelier Torres, Patricio Orlando	es_ES
dc.contributor.author	Fernández Almendros, Raúl	es_ES
dc.date.accessioned	2023-09-15T07:55:32Z
dc.date.available	2023-09-15T07:55:32Z
dc.date.created	2023-07-13
dc.date.issued	2023-09-15	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/196552
dc.description.abstract	[ES] El presente trabajo tiene por finalidad desarrollar una integración de reconocimiento de voz y transcripción de audio a texto para una aplicación desarrollada en .NET. Dicha aplicación todavía se encuentra en fase de desarrollo y la integración de estas herramientas de inteligencia artificial supone un punto clave para ofrecer notables diferencias respecto a los competidores. En concreto, proporcionará la posibilidad de autenticarse en la aplicación mediante el reconocimiento de voz. Como también la transcripción de archivos de audio a texto. Estas funcionalidades ayudarán a aumentar la accesibilidad y la facilidad de uso. Este proyecto se ha llevado a cabo siguiendo una metodología ágil adaptada al contexto del desarrollo de software. De esta forma se ha podido realizar el desarrollo de la integración de manera incremental, verificando el correcto funcionamiento del producto software en un entorno real de ejecución. Además, ha permitido asegurar la calidad del código ya que se han ido descubriendo errores y mejoras a realizar durante el proceso. La tecnología utilizada para el desarrollo de la integración ha sido ASP.NET Core, para adaptar el microservicio ya existente, desarrollado en C#, permitiendo la comunicación con estas nuevas aplicaciones. Para ofrecer la funcionalidad externa de reconocimiento de voz y transcripción de audio a texto se han desarrollado servicios en Python que utilizan Whisper y Pyannote, dos librerías que proporcionan dicha funcionalidad.	es_ES
dc.description.abstract	[EN] The purpose of this work is to develop an integration of speech recognition and speech-to-text transcription for an application developed in .NET. This application is still in the development phase and the integration of these artificial intelligence tools is a key point to offer significant differences compared to competitors. Specifically, it will provide the possibility of being able to authenticate in the application through voice recognition. Also, the possibility of transcribing audio files to text. These functionalities will help to increase accessibility and ease of use. The project has been carried out following an agile methodology adapted to the context of software development. In this wat, it has been possible to carry out the development of the integration in an incremental way, verifying the correct functionality of the software product in a real execution environment. Furthermore, it has allowed to ensure the quality of the code since errors have been discovered and improvements during the development process. The technology used for the development of the integration has been ASP.NET Core, to adapt the existing microservice, developed in C#, allowing communication with these new applications. To offer the external functionality of speech recognition and speech-to-text transcription, services have been developed in Python that use Whisper and Pyannote, two libraries that provide such functionality.	es_ES
dc.description.abstract	[CA] El present treball té per finalitat desenvolupar una integració de reconeixement de veu i transcripció d'àudio a text per a una aplicació desenvolupada en .NET. Aquesta aplicació encara es troba en fase de desenvolupament i la integració d'aquestes eines d'intel·ligència artificial suposa un punt clau per a oferir notables diferències respecte als competidors. En concret, proporcionarà la possibilitat de autenticar-se en l'aplicació mitjançant el reconeixement de veu. També serà possible la transcripció de fitxers de àudio a text. Aquestes funcionalitats ajudaràn a augmentar l'accessibilitat i la facilitat d'ús. Aquest projecte s'ha dut a terme seguint una metodologia àgil adaptada al context del desenvolupament de software. D'aquesta manera s'ha pogut realitzar el desenvolupament de la integració de manera incremental, verificant el correcte funcionament del producte software en un entorn real d'execució. A més, ha permés assegurar la qualitat del codi ja que s'han anat descobrint errors i millores a realitzar durant el procés. La tecnologia utilitzada per al desenvolupament de la integració ha sigut ASP.NET Core, per a adaptar el microservei ja existent, desenvolupat en C#, permetent la comunicació amb aquestes noves aplicacions. Per a oferir la funcionalitat externa de reconeixement de veu i transcripció d'àudio a text s'han desenvolupat serveis en Python que utilitzen Whisper i Pyannote, dues llibreries que proporcionen aquesta funcionalitat.	es_ES
dc.format.extent	74	es_ES
dc.language	Español	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reserva de todos los derechos	es_ES
dc.subject	Integración	es_ES
dc.subject	Microservicios	es_ES
dc.subject	Metodologías Ágiles	es_ES
dc.subject	.NET	es_ES
dc.subject	C#	es_ES
dc.subject	Python	es_ES
dc.subject	Inteligencia Artificial	es_ES
dc.subject	Reconocimiento de Voz	es_ES
dc.subject	Transcripción de Audio a Texto	es_ES
dc.subject	Integration	es_ES
dc.subject	Microservices	es_ES
dc.subject	Agile methodology	es_ES
dc.subject	Artificial intelligence	es_ES
dc.subject	Speech-recognition	es_ES
dc.subject	Speech-to-text transcription	es_ES
dc.subject.classification	LENGUAJES Y SISTEMAS INFORMATICOS	es_ES
dc.subject.other	Grado en Ingeniería Informática-Grau en Enginyeria Informàtica	es_ES
dc.title	Integración de reconocimiento de voz y transcripción de audio a texto para una aplicación .NET	es_ES
dc.title.alternative	Integration of speech recognition and audio-to-text transcription for a .NET application	es_ES
dc.title.alternative	Integració de reconeixement de veu i transcripció d'àudio a text per a una aplicació .NET	es_ES
dc.type	Proyecto/Trabajo fin de carrera/grado	es_ES
dc.rights.accessRights	Cerrado	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica	es_ES
dc.description.bibliographicCitation	Fernández Almendros, R. (2023). Integración de reconocimiento de voz y transcripción de audio a texto para una aplicación .NET. Universitat Politècnica de València. http://hdl.handle.net/10251/196552	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\155290	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

ETSINF - Trabajos académicos [5160]
Escola Tècnica Superior d'Enginyeria Informàtica

Mostrar el registro sencillo del ítem

Integración de reconocimiento de voz y transcripción de audio a texto para una aplicación .NET

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Integración de reconocimiento de voz y transcripción de audio a texto para una aplicación .NET

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)