Aquesta tesi reuneix algunes contribucions al reconeiximent de formes estadístic i més específicament a diverses tasques del processament del llenguatge natural. Diverses tècniques estadístiques ben conegudes són revisades en aquesta tesi: estimació paramètrica, disseny de la funció de pèrdua i modelatge estadístic. Les tècniques anteriors s'apliquen a diverses tasques del processament del llenguatge natural com ara classificació de documents, modelatge estadístic del llenguatge i traducció automàtica estadística. En relació amb l'estimació paramètrica, portem a cap el problema del suavitzat proposant una tècnica d'estimació per màxima versemblança amb domini restringit (CDMLE). La tècnica CDMLE evita la necessitat de l'etapa de suavitzat que afavoreix la pèrdua de les bones propietats de l'estimador per màxima versemblança. Aquesta tècnica s'aplica a classificació de documents mitjançant el classificador Naive Bayes. Més tard, la tècnica CDMLE s'exten a l'estimació per màxima versemblança amb ``leaving-one-out'', i aleshores, s'aplica al suavitzat de models de llenguatge. Els resultats obtinguts en diverses tasques de modelat del llenguatge mostren una millora en perplexitat. En el diseny de la funció de pèrdua, s'estudia cuidadosament el diseny de funcions de pèrdua diferents a la 0-1. L'estudi es centra en aquelles funcions de pèrdua que retenen una complexitat de decodificació semblant a la funció 0-1 però proporcionant una major flexibilitat. Analitzem i presentem diverses funcions de pèrdua en diverses tasques de traducció automàtica amb diversos models de traducció. Tambè analitzem algunes regles de traducció que destaquen per causes pràctiques com ara la regla de traducció directa; i axí mateixa, s'aprofundeix en la comprensió dels models log-linear, que son de fet casos particulars d'aquestes funcions de pèrdua. Finalment, es proposen diversos models de traducció monòtons basats en tècniques del modelatge estadístic ben conegudes. En primer lloc, es proposa una extensió a la tècnida de GIATI per a inferir transductors d'estats finits. Més tard, es proposa un model de traducció basat en sequències de paraules i inspirat en els models ocults de Markov. En darrer lloc, es presenta un model de traducció basat en sequències de paraules i en semi-models de Markov. Aquest darrer model produiex millores en certes circumstàncies.