RESUMEN Esta tesis presenta diversas contribuciones en los campos de la traducción automática estadística y la traducción interactiva desde un enfoque estadístico. En el campo de la traducción automática estadística, se presentan contribuciones en relación a los tres problemas fundamentales a abordar en dicha disciplina: el problema del modelado, el problema del entrenamiento y el problema de la búsqueda. Respecto al problema del modelado, se propone una derivación alternativa de los modelos de secuencias de palabras. Dicha derivación introduce un conjunto de submodelos probabilísticos que gobiernan diversos aspectos del proceso de traducción. Adicionalmente, los submodelos que se obtienen pueden introducirse como componentes de un modelo log-lineal. Con respecto al problema del entrenamiento, se describe una técnica alternativa de estimación de modelos de secuencias de palabras que trata de reducir la fuerte componente heurística de las técnicas de entrenamiento estándar. La técnica de estimación propuesta considera los pares de secuencias de palabras que componen el modelo como parte de bisegmentaciones completas de las frases origen y destino. Se demuestra tanto teórica como empíricamente que la nueva técnica de estimación puede ejecutarse eficientemente. Resultados experimentales obtenidos con la herramienta de estimación de libre uso THOT presentada en esta tesis, demuestran que la técnica de estimación propuesta obtiene modelos con menor perplejidad que los obtenidos con la técnica de estimación estándar. Pese a ello, no se han conseguido mejoras en los resultados de traducción. Para abordar el problema de la búsqueda se propone el uso de un algoritmo basado en el paradigma de ramificación y poda. El algoritmo propuesto generaliza distintas estrategias de búsqueda a las que se accede modificando los parámetros de entrada. El rendimiento de las distintas variantes de funcionamiento que presenta el algoritmo de búsqueda generalizado fue evaluado empíricamente. Además de lo anterior, también se aborda una modificación del problema de la búsqueda que consiste en la obtención del mejor alineamiento a nivel de secuencias de palabras para un par de frases. Para resolver este nuevo problema se aplican técnicas de suavizado sobre los modelos de secuencias de palabras y se modifica el algoritmo de búsqueda definido inicialmente para que pueda explorar el espacio de posibles alineamientos. Resultados experimentales demuestran que las técnicas propuestas son capaces de generar alineamientos de forma eficiente y robusta. Un inconveniente del uso de modelos de secuencias de palabras es su enorme tamaño cuando se estiman a partir de corpus muy grandes. En la tesis se proponen técnicas para aliviar este problema, tanto en la fase de estimación como en la fase de decodificación. Para ello se transforman requerimientos de memoria en requerimientos de disco duro. Resultados empíricos demuestran que los accesos a disco no degradan apreciablemente la eficiencia del sistema. En el campo de la traducción interactiva desde un enfoque estadístico, se presentan, en primer lugar, técnicas alternativas para implementar sistemas de traducción interactiva. En segundo lugar, también se describe una propuesta de sistema de traducción interactiva capaz de aprender de las traducciones validadas por el usuario mediante técnicas de aprendizaje online. Con respecto a las técnicas alternativas de traducción interactiva, se proponen dos técnicas diferentes. La primera de ellas se basa en la generación de alineamientos parciales a nivel de secuencias de palabras. Este enfoque constituye una aplicación de la generación de alineamientos a nivel de secuencias de palabras también descrito en esta tesis. La segunda de las técnicas propuestas aborda el proceso de traducción interactiva con la ayuda de grafos de palabras y modelos correctores de errores estocásticos. El enfoque propuesto difiere de otros sistemas de traducción interactiva basados en grafos de palabras en que introduce el proceso de corrección de errores dentro del marco estadístico. Ambas técnicas de traducción interactiva se han evaluado mediante experimentos, demostrando ser competitivas con sistemas de traducción interactiva del estado del arte. Además, dichas técnicas se han usado para implementar un prototipo de traducción interactiva basado en la arquitectura cliente-servidor. Finalmente, el sistema de traducción interactiva con aprendizaje online que se mencionaba anteriomente, se basa en el uso de modelos estadísticos actualizables de manera incremental. El principal obstáculo a la hora de obtener versiones incrementales de los modelos estadísticos involucrados en el proceso de traducción aparece cuando dichos modelos se estiman por medio del algoritmo expectation-maximisation. Para resolver este problema se propone la aplicación de la visión incremental de dicho algoritmo. El sistema de traducción interactiva con aprendizaje online fue evaluado experimentalmente, demostrándose que es capaz de aprender tanto a partir de modelos previamente estimados como de modelos vacíos. Los resultados de los experimentos también demuestran que el rendimiento del sistema que se propone es significativamente mejor que otros sistemas del estado del arte descritos en la literatura.