- -

Desenvolupament de constructors de grafs de fonemes

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Desenvolupament de constructors de grafs de fonemes

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Gómez Adrian, Jon Ander es_ES
dc.contributor.author Fabra Boluda, Raül es_ES
dc.date.accessioned 2013-07-17T09:52:34Z
dc.date.available 2013-07-17T09:52:34Z
dc.date.created 2013-07-10
dc.date.issued 2013-07-17
dc.identifier.uri http://hdl.handle.net/10251/31184
dc.description.abstract El problema a resoldre en aquest projecte pertany a l'àmbit del Reconeixement Automàtic de la Parla. Donada una seqüència d'àudio degudament preprocessada i descodificada a nivell acústic-fonètic, el mòdul a desenvolupar ha de reconèixer els distints fonemes que un locutor ha pronunciat al llarg del seu discurs. A més, també ha de determinar en quin instant de temps comença a pronunciar-se cada fonema i en quin instant de temps acaba la seua pronunciació. El senyal d'àudio inicial necessita ser preprocessat amb la finalitat d'eliminar la informació que no resulte útil o discriminant per a la tasca de reconeixement. El mòdul encarregat d'aquesta feina és el Parametritzador i produeix com eixida una seqüència de vectors o frames acústics que serveixen com entrada al següent mòdul, l'Estimador de Probabilitats Fonètiques. Rebent com entrada els vectors acústics generats pel Parametritzador, l'Estimador de Probabilitats Fonètiques s'encarrega, com el seu nom indica, de generar una sèrie de vectors de probabilitats fonètiques. Aquestos vectors són de dimensió igual al nombre d'unitats fonètiques que s'estan contemplant en la tasca de reconeixement, i cada element representa la probabilitat de què un fonema haja sigut pronunciat. La seqüència de vectors de probabilitats generada per l'Estimador de Probabilitats Fonètiques serveix com entrada a distints mòduls del sistema i és enviada mitjançant cues FIFO controlades per semàfors. Un dels mòduls que rep aquesta seqüència de vectors és el Constructor de Grafs de Fonemes. Aquest mòdul és la part central d'aquest projecte. es_ES
dc.format.extent 69 es_ES
dc.language Catalán es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento - No comercial - Sin obra derivada (by-nc-nd) es_ES
dc.subject Reconeixement automàtic de la parla es_ES
dc.subject Àudio es_ES
dc.subject Acústic es_ES
dc.subject Fonètic es_ES
dc.subject Pronunciació es_ES
dc.subject Descodificació es_ES
dc.subject Unitat fonètica es_ES
dc.subject.other Ingeniería Informática-Enginyeria Informàtica es_ES
dc.title Desenvolupament de constructors de grafs de fonemes es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Fabra Boluda, R. (2013). Desenvolupament de constructors de grafs de fonemes. http://hdl.handle.net/10251/31184. es_ES
dc.description.accrualMethod Archivo delegado es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem