Aquesta tesi presenta diverses contribucions als camps de la classificació automàtica de text, traducció automàtica i traducció assistida per ordinador sota el marc estadístic. En classificació automàtica de text, es proposa una nova aplicació anomenada classificació de text bilingüe juntament amb una sèrie de models orientats a capturar aquesta informació bilingüe. Amb aquest fi es presenten dues aproximacions a aquesta aplicació; la primera d'elles es fonamenta en una assumpció naive que contempla la independència entre les dues llengües involucrades, mentre que la segona, més sofisticada, considera l'existència d'una correlació entre paraules en diferents llengües. La primera aproximació donà lloc al desenvolupament de cinc models fonamentats en models d'unigrama i models de llenguatge de n-grames suavitzats. Aquests models van ser avaluats en tres tasques de complexitat creixent, sent la més complexa d'aquestes tasques analitzada des del punt de vista d'un sistema d'ajuda a la indexació de documents. La segona aproximació es caracteritza per models de traducció capaços de capturar la correlació entre paraules en diferents llengües. En el nostre cas, el model de traducció elegit va ser el model M1 juntament amb un model d'unigrames. Aquest model va ser avaluat en dos de les tasques més simples superant l'aproximació naive, que assumeix la independència entre paraules en differents llengües procedents de textos bilingües. En traducció automàtica, els models estadístics de traducció basats en paraules M1, M2 i HMM són estesos sota el marc de la modelització mitjançant mixtures, amb l'objectiu de definir models de traducció dependents del context. En el cas del model M2, també es va estendre per al cas de mixtures un algorisme de cerca iteratiu basat en programació dinàmica per a aquest model. Aquest algorisme de cerca ens permet avaluar directament la qualitat de la traducció del model de mixtures de M2 en una tasca controlada i semiartificial, obtenint millores estadísticament significatives sobre el model M2 convencional. A més a més, aquests tres models van ser sotmesos a una àmplia avaluació experimental portada a terme en dues tasques de referència per a la comunitat de traducció automàtica estadística. Aquestes dues tasques van ser utilitzades per avaluar d'una banda, la qualitat dels alineaments obtinguts com a subproducte dels models M1, M2 i HMM i d'altra banda, la qualitat de les traduccions d'un sistema de traducció estadística basat en segments generat a partir d'aquests alineaments. Com a resultat d'aquesta avaluació, es van obtenir millores significatives en la qualitat dels alineaments del model de mixtures de M2 respecte al model M2 convencional. L'avaluació de la qualitat de la traducció va desvetlar millores menors, però sistemàtiques en la qualitat de la traduccions oferides per aquests tres models, aconseguint resultats a l'altura de l'estat de l'art per al model de mixtures de HMM. Finalment, vam presentar un sistema interactiu i predictiu d'ajuda a la traducció basat en transductors estocàstics d'estats finits. Aquest sistema integra algorismes d'anàlisi eficients per a la correcció d'errors i el càlcul de les millors traduccions, que són adaptats i implementats per garantir un temps de resposta baix, alhora que es preserva una qualitat de traducció adequada. El sistema presentat va ser avaluat automàticament en dos corpora, un d'ells consistent en una col·lecció de manuals tècnics d'usuari, i l'altre format per butlletins de la Unió Europea. El primer dels corpora va ser utilitzat per a una avaluació manual portada a terme per agències de traducció al marc del projecte europeu TransType2. Tant l'avaluació manual com l'automàtica, van proporcionar reduccions significatives en l'esforç necessari per traduir aquests textos, accelerant el procés de traducció, i aconseguint, d'aquesta forma, l'objectiu final dels sistemes d'ajuda a la traducció.