- -

Novel statistical approaches to text classification, machine translation and computer-assisted translation

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Novel statistical approaches to text classification, machine translation and computer-assisted translation

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Juan Císcar, Alfonso es_ES
dc.contributor.advisor Casacuberta Nolla, Francisco es_ES
dc.contributor.author Civera Saiz, Jorge es_ES
dc.date.accessioned 2008-07-04T12:01:44Z
dc.date.available 2008-07-04T12:01:44Z
dc.date.created 2008-06-27T08:00:00Z es_ES
dc.date.issued 2008-07-04T12:01:34Z es_ES
dc.identifier.uri http://hdl.handle.net/10251/2502
dc.description.abstract Esta tesis presenta diversas contribuciones en los campos de la clasificación automática de texto, traducción automática y traducción asistida por ordenador bajo el marco estadístico. En clasificación automática de texto, se propone una nueva aplicación llamada clasificación de texto bilingüe junto con una serie de modelos orientados a capturar dicha información bilingüe. Con tal fin se presentan dos aproximaciones a esta aplicación; la primera de ellas se basa en una asunción naive que contempla la independencia entre las dos lenguas involucradas, mientras que la segunda, más sofisticada, considera la existencia de una correlación entre palabras en diferentes lenguas. La primera aproximación dió lugar al desarrollo de cinco modelos basados en modelos de unigrama y modelos de n-gramas suavizados. Estos modelos fueron evaluados en tres tareas de complejidad creciente, siendo la más compleja de estas tareas analizada desde el punto de vista de un sistema de ayuda a la indexación de documentos. La segunda aproximación se caracteriza por modelos de traducción capaces de capturar correlación entre palabras en diferentes lenguas. En nuestro caso, el modelo de traducción elegido fue el modelo M1 junto con un modelo de unigramas. Este modelo fue evaluado en dos de las tareas más simples superando la aproximación naive, que asume la independencia entre palabras en differentes lenguas procedentes de textos bilingües. En traducción automática, los modelos estadísticos de traducción basados en palabras M1, M2 y HMM son extendidos bajo el marco de la modelización mediante mixturas, con el objetivo de definir modelos de traducción dependientes del contexto. Asimismo se extiende un algoritmo iterativo de búsqueda basado en programación dinámica, originalmente diseñado para el modelo M2, para el caso de mixturas de modelos M2. Este algoritmo de búsqueda n es_ES
dc.language Inglés es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.source Riunet
dc.subject Mixture modelling es_ES
dc.subject Em algorithm es_ES
dc.subject Bilingual text classification es_ES
dc.subject Machine-aided indexing es_ES
dc.subject Statistical machine translation es_ES
dc.subject Stochastic finite-state transducer es_ES
dc.subject Computer-assisted translation es_ES
dc.subject Word-based translation models es_ES
dc.subject N-gram language models es_ES
dc.subject Interactive and predictive machine translation es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.title Novel statistical approaches to text classification, machine translation and computer-assisted translation
dc.type Tesis doctoral es_ES
dc.subject.unesco 120304 - Inteligencia artificial es_ES
dc.subject.unesco 120317 - Informática es_ES
dc.identifier.doi 10.4995/Thesis/10251/2502 es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Civera Saiz, J. (2008). Novel statistical approaches to text classification, machine translation and computer-assisted translation [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/2502 es_ES
dc.description.accrualMethod Palancia es_ES
dc.type.version info:eu-repo/semantics/acceptedVersion es_ES
dc.relation.tesis 2831 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem