- -

An Empirical Analysis of Data Selection Techniques in Statistical Machine Translation

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

An Empirical Analysis of Data Selection Techniques in Statistical Machine Translation

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.author Chinea Ríos, Mara es_ES
dc.contributor.author Sanchis Trilles, Germán es_ES
dc.contributor.author Casacuberta Nolla, Francisco es_ES
dc.date.accessioned 2016-05-17T11:42:50Z
dc.date.available 2016-05-17T11:42:50Z
dc.date.issued 2015-09
dc.identifier.issn 1135-5948
dc.identifier.uri http://hdl.handle.net/10251/64250
dc.description.abstract [EN] Domain adaptation has recently gained interest in statistical machine translation. One of the adaptation techniques is based in the selection data. Data selection aims to select the best subset of the bilingual sentences from an available pool of sentences, with which to train a SMT system. In this paper, we study how affect the bilingual corpora used for the data selection methods in the translation quality es_ES
dc.description.abstract [ES] La adaptación de dominios genera mucho interés dentro de la traducción automática estadística. Una de las técnicas de adaptaciión esta basada en la selecciión de datos que tiene como objetivo seleccionar el mejor subconjunto de oraciones bilingües de un gran conjunto de oraciones. En este artículo estudiamos como afectan los corpus bilingües empleados por los métodos de selección de frases en la calidad de las traducciones. es_ES
dc.description.sponsorship The research leading to these results has received funding from the European Union Seventh Framework Programme (FP7/2007-2013) under grant agreement No. 287576 (CasMaCat). Also funded by the Generalitat Valenciana under grant Prometeo/2009/014.
dc.language Inglés es_ES
dc.publisher Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN) es_ES
dc.relation.ispartof Procesamiento del Lenguaje Natural es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Statistical machine translation, domain adaptation, bilingual sentence selection, infrequent n-gram, cross-entropy es_ES
dc.subject Statistical machine translation es_ES
dc.subject Domain adaptation es_ES
dc.subject Bilingual sentence selection es_ES
dc.subject Infrequent n-gram es_ES
dc.subject Cross-entropy es_ES
dc.subject Traducción automática estadística es_ES
dc.subject Adaptación dominios es_ES
dc.subject Selección de frases bilingües es_ES
dc.subject n-gramas infrecuentes es_ES
dc.subject Entropía cruzada es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.title An Empirical Analysis of Data Selection Techniques in Statistical Machine Translation es_ES
dc.title.alternative Análisis empírico de técnicas de selección de datos en traducción automática estadística
dc.type Artículo es_ES
dc.relation.projectID info:eu-repo/grantAgreement/Generalitat Valenciana//PROMETEO09%2F2009%2F014/ES/Adaptive learning and multimodality in pattern recognition (Almapater)/ es_ES
dc.relation.projectID info:eu-repo/grantAgreement/EC/FP7/287576/EU/Cognitive Analysis and Statistical Methods for Advanced Computer Aided Translation/ es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Chinea Ríos, M.; Sanchis Trilles, G.; Casacuberta Nolla, F. (2015). An Empirical Analysis of Data Selection Techniques in Statistical Machine Translation. Procesamiento del Lenguaje Natural. (55):101-108. http://hdl.handle.net/10251/64250 es_ES
dc.description.accrualMethod S es_ES
dc.relation.publisherversion http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/issue/view/215 es_ES
dc.description.upvformatpinicio 101 es_ES
dc.description.upvformatpfin 108 es_ES
dc.type.version info:eu-repo/semantics/publishedVersion es_ES
dc.description.issue 55 es_ES
dc.relation.senia 293283 es_ES
dc.contributor.funder European Commission
dc.contributor.funder Generalitat Valenciana


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem