Extracción de Corpus Paralelos de la Wikipedia basada en la Obtención de Alineamientos Bilingües a Nivel de Frase

Silvestre Cerdà, Joan Albert; Garcia Martinez, Maria Mercedes; Barrón Cedeño, Luis Alberto; Civera Saiz, Jorge; Rosso ., Paolo

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Extracción de Corpus Paralelos de la Wikipedia basada en la Obtención de Alineamientos Bilingües a Nivel de Frase

Mostrar el registro completo del ítem

Silvestre Cerdà, JA.; Garcia Martinez, MM.; Barrón Cedeño, LA.; Civera Saiz, J.; Rosso ., P. (2011). Extracción de Corpus Paralelos de la Wikipedia basada en la Obtención de Alineamientos Bilingües a Nivel de Frase. CEUR Workshop Proceedings. 824:14-21. http://hdl.handle.net/10251/27930

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/27930

Ficheros en el ítem

Nombre: art-CEUR-824-pape ...

Tamaño: 563.6Kb

Formato: PDF

Abrir/Preview

Metadatos del ítem

Título:

Extracción de Corpus Paralelos de la Wikipedia basada en la Obtención de Alineamientos Bilingües a Nivel de Frase

Otro titulo:

Extracting Parallel Corpora from Wikipedia on the basis of Phrase Level Bilingual Alignment

Autor:

Silvestre Cerdà, Joan Albert Garcia Martinez, Maria Mercedes Barrón Cedeño, Luis Alberto

Civera Saiz, Jorge

Rosso ., Paolo

Entidad UPV:

Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació

Fecha difusión:

2011

Resumen:

[EN] This paper presents a proposal for extracting parallel corpora from Wikipedia on the basis of statistical machine translation techniques. We have used word-level alignment models from IBM in order to obtain phrase-level ...[+]

[ES] Este art'¿culo presenta una nueva t'ecnica de extracci'on de corpus paralelos de la Wikipedia mediante la aplicaci'on de t'ecnicas de traducci'on autom'atica estad'¿stica. En concreto, se han utilizado los modelos ...[+]

Palabras clave:

Corpus comparables , Extracción de oraciones paralelas , Traducción automática estadística , Comparable corpora , Parallel sentences extraction , Statistical machine translation

Derechos de uso:

Reserva de todos los derechos

Fuente:

CEUR Workshop Proceedings. (issn: 1613-0073 )

Editorial:

CEUR Workshop Proceedings

Versión del editor:

http://ceur-ws.org/Vol-824/paper2.pdf

Título del congreso:

Iberian Cross-Language Natural Language Processing Tasks (ICL 2011)

Lugar del congreso:

Huelva, Spain

Fecha congreso:

September 7, 2011

Código del Proyecto:

info:eu-repo/grantAgreement/MICINN//TIN2009-13391-C04-03/ES/Text-Enterprise 2.0: Tecnicas De Comprension De Textos Aplicadas A Las Necesidades De La Empresa 2.0/
...[+]

Agradecimientos:

Este trabajo se ha llevado a cabo en el marco del VLC/CAMPUS Microcluster on Multimodal Interaction in Intelligent Systems, financiado parcialmente por parte de la EC (FEDER/FSE; WIQEI IRSES no. 269180 / FP 7 Marie Curie ...[+]

Tipo:

Artículo Comunicación en congreso

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro completo del ítem

Extracción de Corpus Paralelos de la Wikipedia basada en la Obtención de Alineamientos Bilingües a Nivel de Frase

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Extracción de Corpus Paralelos de la Wikipedia basada en la Obtención de Alineamientos Bilingües a Nivel de Frase

Ficheros en el ítem

Metadatos del ítem

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)