Novel statistical approaches to text classification, machine translation and computer-assisted translation

Civera Saiz, Jorge

doi:10.4995/Thesis/10251/2502

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Novel statistical approaches to text classification, machine translation and computer-assisted translation

Mostrar el registro completo del ítem

Civera Saiz, J. (2008). Novel statistical approaches to text classification, machine translation and computer-assisted translation [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/2502

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/2502

Ficheros en el ítem

Nombre: tesisUPV2831.pdf

Tamaño: 941.8Kb

Formato: PDF

Abrir/Preview

Nombre: tesisUPV2831_Engl ...

Tamaño: 3.449Kb

Formato: Fichero de texto

Abrir

Nombre: tesisUPV2831_Indi ...

Tamaño: 13.54Kb

Formato: PDF

Abrir/Preview

Nombre: tesisUPV2831_Resu ...

Tamaño: 4.344Kb

Formato: Fichero de texto

Abrir

Nombre: tesisUPV2831_Resu ...

Tamaño: 4.152Kb

Formato: Fichero de texto

Abrir

Metadatos del ítem

Título:

Novel statistical approaches to text classification, machine translation and computer-assisted translation

Autor:

Civera Saiz, Jorge

Director(es):

Juan Císcar, Alfonso

Casacuberta Nolla, Francisco

Entidad UPV:

Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació

Fecha acto/lectura:

2008-06-27

Fecha difusión:

2008-07-04

Resumen:

Esta tesis presenta diversas contribuciones en los campos de la clasificación automática de texto, traducción automática y traducción asistida por ordenador bajo el marco estadístico. En clasificación automática de texto, se propone una nueva aplicación llamada clasificación de texto bilingüe junto con una serie de modelos orientados a capturar dicha información bilingüe. Con tal fin se presentan dos aproximaciones a esta aplicación; la primera de ellas se basa en una asunción naive que contempla la independencia entre las dos lenguas involucradas, mientras que la segunda, más sofisticada, considera la existencia de una correlación entre palabras en diferentes lenguas. La primera aproximación dió lugar al desarrollo de cinco modelos basados en modelos de unigrama y modelos de n-gramas suavizados. Estos modelos fueron evaluados en tres tareas de complejidad creciente, siendo la más compleja de estas tareas analizada desde el punto de vista de un sistema de ayuda a la indexación de documentos. La segunda aproximación se caracteriza por modelos de traducción capaces de capturar correlación entre palabras en diferentes lenguas. En nuestro caso, el modelo de traducción elegido fue el modelo M1 junto con un modelo de unigramas. Este modelo fue evaluado en dos de las tareas más simples superando la aproximación naive, que asume la independencia entre palabras en differentes lenguas procedentes de textos bilingües. En traducción automática, los modelos estadísticos de traducción basados en palabras M1, M2 y HMM son extendidos bajo el marco de la modelización mediante mixturas, con el objetivo de definir modelos de traducción dependientes del contexto. Asimismo se extiende un algoritmo iterativo de búsqueda basado en programación dinámica, originalmente diseñado para el modelo M2, para el caso de mixturas de modelos M2. Este algoritmo de búsqueda n [-]

Palabras clave:

Mixture modelling , Em algorithm , Bilingual text classification , Machine-aided indexing , Statistical machine translation , Stochastic finite-state transducer , Computer-assisted translation , Word-based translation models , N-gram language models , Interactive and predictive machine translation

Código UNESCO:

120304 - Inteligencia artificial
120317 - Informática

Derechos de uso:

Reserva de todos los derechos

DOI:

10.4995/Thesis/10251/2502

Editorial:

Universitat Politècnica de València

Tipo:

Tesis doctoral

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)

Tesis doctorales [5452]

Mostrar el registro completo del ítem

Novel statistical approaches to text classification, machine translation and computer-assisted translation

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Novel statistical approaches to text classification, machine translation and computer-assisted translation

Ficheros en el ítem

Metadatos del ítem

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)

Ítems relacionados