RESUM Aquesta tesi presenta diverses contribucions als camps de la traducció automàtica estadística i la traducció interactiva des d'un enfocament estadístic. Al camp de la traducció automàtica estadística, es presenten contribucions en relació als tres problemes fonamentals a abordar en aquesta disciplina: el problema del modelatge, el problema de l'entrenament i el problema de la cerca. Respecte el problema del modelatge, es proposa una derivació alternativa dels models de seqüències de paraules. Aquesta derivació introdueix un conjunt de submodels probabilístics que governen diversos aspectes del procés de traducció. Addicionalment, els submodels que s'obtenen poden introduir-se com a components d'un model log-lineal. Respecte al problema de l'entrenament, es descriu una tècnica alternativa d'estimació de models de seqüències de paraules que tracta de reduir la forta component heurística de les tècniques d'entrenament estàndard. La tècnica d'estimació proposada considera els parells de seqüències de paraules que componen el model com a part de bisegmentacions completes de les frases origen i destí. Es demostra tant teòrica com empíricament que la nova tècnica d'estimació pot executar-se eficientment. Resultats experimentals obtinguts amb la ferramenta d'estimació de lliure ús THOT presentada en aquesta tesi, demostren que la tècnica d'estimació proposada obté models amb menor perplexitat que els obtinguts amb la tècnica d'estimació estàndard. No obstant això, no s'han aconseguit millores en els resultats de traducció. Per a abordar el problema de la cerca es proposa l'ús d'un algorisme basat en el paradigma de ramificació i poda. L'algorisme proposat generalitza distintes estratègies de cerca a les quals s'accedeix modificant els paràmetres d'entrada. El rendiment de les distintes variants de funcionament que presenta l'algorisme de cerca generalitzat s'avaluà empíricament. A més a més, també s'aborda una modificació del problema de la cerca que consisteix en l'obtenció del millor alineament a nivell de seqüències de paraules per a un parell de frases. Per resoldre aquest nou problema s'apliquen tècniques de suavitzat sobre els models de seqüències de paraules i es modifica l'algorisme de cerca definit inicialment perquè puga explorar l'espai de possibles alineaments. Els resultats experimentals demostren que les tècniques proposades són capaces de generar alineaments de forma eficient i robusta. Un inconvenient de l'ús de models de seqüències de paraules és el seu enorme tamany quan s'estimen a partir de corpus molt grans. En la tesi es proposen tècniques per a alleugerir aquest problema, tant en la fase d'estimació com en la fase de decodificación. Amb aquesta finalitat es transformen els requeriments de memòria en requeriments de disc dur. Els resultats empírics demostren que els accessos a disc no degraden apreciablement l'eficiència del sistema. Al camp de la traducció interactiva des d'un enfocament estadístic, es presenten, en primer lloc, tècniques alternatives per a implementar sistemes de traducció interactiva. En segon lloc, també es descriu una proposta de sistema de traducció interactiva capaç d'aprendre de les traduccions validades per l'usuari mitjançant tècniques d'aprenentatge online. Respecte a les tècniques alternatives de traducció interactiva, es proposen dues tècniques diferents. La primera d'elles es basa en la generació d'alineaments parcials a nivell de seqüències de paraules. Aquest enfocament constitueix una aplicació de la generació d'alineaments a nivell de seqüències de paraules també descrit en aquesta tesi. La segona de les tècniques proposades aborda el procés de traducció interactiva amb l'ajuda de grafs de paraules i models correctors d'errades estocàstics. L'enfocament proposat difereix d'altres sistemes de traducció interactiva basats en grafs de paraules en que introdueix el procés de correcció d'errades dins del marc estadístic. Ambdues tècniques de traducció interactiva s'han avaluat mitjançant experiments, demostrant ser competitives amb sistemes de traducció interactiva de l'estat de l'art. A més a més, aquestes tècniques s'han usat per a implementar un prototip de traducció interactiva basat en l'arquitectura client-servidor. Finalment, el sistema de traducció interactiva amb aprenentatge online que es mencionava anterioment, es basa en l'ús de models estadístics actualizables de manera incremental. El principal obstacle a l'hora d'obtenir versions incrementales dels models estadístics involucrats en el procés de traducció apareix quan aquests models s'estimen per mitjà de l'algorisme expectation-maximisation. Per a resoldre aquest problema es proposa l'aplicació de la visió incremental d'aquest algorisme. El sistema de traducció interactiva amb aprenentatge online s'avaluà experimentalment, demostrant-se que és capaç d'aprendre tant a partir de models prèviament estimats com de models buits. Els resultats dels experiments també demostren que el rendiment del sistema que es proposa és significativament millor que altres sistemes de l'estat de l'art descrits en la literatura.