L'objectiu general de tot sistema de Processament del Llenguatge Natural (PLN) és el d'obtindre alguna representació del missatge contingut de les frases. el tractament automàtic d'una llengua és un problema de gran complexitat en què intervenen diverses i complexes fonts de coneixement: fonètica, morfologia, sintaxi, semàntica, pragmàtica, coneixement del món, etc. Encara que en alguns casos estes fonts d'informació es poden considerar independents, en general, presenten una interrelació, sense la qual, no se pot aconseguir una correcta interprestació del significat i de la funció de les paraules d'una oració. A causa d'esta complexitat, per a abordar el problema de comprensió d'una llengua se sol seguir una de les següents vies: 1) Es resolen certs subproblemes més senzills que, en alguns casos, han d'aportar simplificacions per a poder ser tractats de manera automàtica, tals com:anàlisi morfològica, etiquetatge lèxic de textos, anàlisi sintàctic superficial d'oracions lligament preposicional, sesambiguación del sentit de les paraules, tractament de fenòmens lingüistícos específics com l'anàfora, el·lipsi, etc. 2)Es simplifica el llenguatge considerant tasques restringidasm en la talla del vocabulari, la complexitat de les estructures sintàctiques utilitzades o el domini semàntic de la aplicació. Durant els últims anys podem trobar una gran quantitat d'exemples que prenen alguna de les vies comentades. En reconeixement del parla hi ha aplicacions que es restringixen a vocabularis tancats, sonsultas a bases de dades específiques, sistemes de diàleg sobre tasques concretes, etc. En altres camps, més directament relacionats amb el PLN, trobem aplicacions de traducció automàtica, extracció i recuperació d'informació, resums de textos, etc, en les que, en major o menor mesura, es restringixen a dominis específics per a sonseguir resultats acceptables. D'altra banda, el tire de disposar de grans corpus de dades, textuals o orals, anotats amb informació lingüística de diferent naturalesa- informació morfosintàctica, anàlisi sintàctic total o parcial, informació semàntica - junt amb operatius, ha proporcionat l'aparició i ús de aproximacions inductives o mètodes basats en corpus, dins del camp de la Lingüística Computacional, que apliquem a diferents tasques de PLN obtenen un alt grau de prestacions. Les aproximacions inductives, amb informació o sense estadística, resulten de gran interés per a aconseguir la desambiguación del Llenguatge Natural (LN) ja que, a més de proporcionar resultats acceptables, utilitzen models relativament senzills i els seus paràmetres es poden estimar a partir de dades. Açò les fa especialment atractives, lloc que en el canvi d'una tasca a una altra, o inclús de llengua, se reduïx substancialment la intervenció humana. No obstant, alguns casos d'ambigüitat no poden ser resolts d'esta forma i s'ha de recórrer a un expert humà per a introduir, per exemple, certes regles o restriccions que ajuden al seu resolució.