Resum En aquesta tesi doctoral es descriuen les investigacions realitzades amb l'objectiu de determinar les millors técniques per a construir un Reconeixedor d'Entitats Nomenades en Árab. Tal sistema tindria l'habilitat d'identificar i classificar les entitats nomenades que es troben en un text árab de domini qualsevol. La tasca de Reconeixement d'Entitats Nomenades (REN) ajuda a altres tasques de Processament del Llenguatge Natural (per exemple, Recuperació d'Informació Recerca de Respostes, Traducció Autom_atica, etc.) a assolir millors resultats grácies a l'enriquiment que afegeix al text. En la literatura existeixen diversos treballs que investiguen la tasca de REN per a un idioma especific o des d'una perspectiva independiente del llenguatge. No obstant aixó, fins al moment, s'han publicat molt pocs treballs que investiguen aquesta tasca per a l'_arab. L'árab té una ortografia especial i una morfologia complexa que aporten nous desaaments per a investigar en la tasca de REN. Una investigaci_o completa del REN per a l'árab aportaria la técnica necessária per a aconseguir un alt rendiment, ó també proporcionaria una análisi dels errors i una discussió sobre els resultats, per a beneficiar amb tal estudi a la comunitat d'investigadors del REN. L'objectiu principal d'aquesta tesi és satisfer aqueixa necessitat. Per a aixó hem: 1. Elaborat un estudi dels diferents aspectes de l'árab relacionats amb aquesta tasca; 2. Analitzat l'estat de l'art del REN; 3. Portat a terme una comparativa dels resultats obtinguts per diferents t_ecniques d'aprenentatge automátic; 4. Desenvolupat un métode basat en la combinació de diferents classificadors, on cada classi_cador tracta amb una sola classe d'entitats nomenades i empra el conjunt de característiques i la técnica d'aprenentatge automátic més adequats per a la classe d'entitats nomenades en qestió. Els nostres experiments han estat avaluats sobre nou conjunts de test de diferents tipus (articles de diari, notícies transcrites, documents del Arabic Treebank i weblogs). Els nostres resultats mostren que la técnica basada en diversos classi_cadors ajuda a obtenir els millors resultats en tots els tipus de dades.