Out of vocabulary words are still an open problem in translation systems. The aim of this work is trying to solve the problem of a limited vocabulary using translation levels smaller than words (e.g: characters). We want ...[+]
Out of vocabulary words are still an open problem in translation systems. The aim of this work is trying to solve the problem of a limited vocabulary using translation levels smaller than words (e.g: characters). We want to take advantage of characteristics like word compounding, morphological and semantical properties to try to translate unknown words from sub-word units already known. This way the translation model is not only able to deal with unseen words but also it will be capable of generating new words not seen during the training phase.
[-]
Las palabras fuera de vocabulario siguen siendo un problema por resolver en los sistemas de traducción actuales. El objetivo de este trabajo es tratar de solucionar el problema de un vocabulario limitado empleando niveles ...[+]
Las palabras fuera de vocabulario siguen siendo un problema por resolver en los sistemas de traducción actuales. El objetivo de este trabajo es tratar de solucionar el problema de un vocabulario limitado empleando niveles de traducción más pequeños que las palabras (e.g: caracteres). Se busca aprovechar características como la composición de palabras, propiedades morfológicas y semánticas para tratar de traducir palabras desconocidas a partir de sub-unidades sí conocidas. De este modo el modelo de traducción no sólo es capaz de lidiar con palabras desconocidas si no que también sería posible traducir generando nuevas palabras no vistas durante la fase de entrenamiento.
[-]
[CA]
Les paraules fora de vocabulari continuen sent un problema per resoldre en
els sistemes de traducció actuals. L’objectiu d’aquest treball es tractar de solucionar
el problema d’un vocabulari limitat emprant nivells ...[+]
[CA]
Les paraules fora de vocabulari continuen sent un problema per resoldre en
els sistemes de traducció actuals. L’objectiu d’aquest treball es tractar de solucionar
el problema d’un vocabulari limitat emprant nivells de traducció més menuts
que les paraules (e.g: caràcters). Es busca aprofitar característiques com la
composició de paraules, propietats morfològiques y semàntiques per a tractar de
traduir paraules desconegudes mitjançant sub-unitats sí conegudes. D’aquesta
manera el model de traducció no només és capaç de bregar amb paraules desconegudes
sinó que també seria possible traduir a paraules no vistes durant la fase
d’entrenament.
[-]
|