Linguistic-based Patterns for Figurative Language Processing: The Case of Humor Recognition and Irony Detection 
Resum 
El llenguatge figurat constitueix una de les tasques més difícils del processament del llenguatge natural. A diferència del llenguatge literal, el llenguatge figurat fa ús de recursos lingüístics com la ironia, l'humor, el sarcasme, la metàfora, l'analogia, entre d'altres, per comunicar significats indirectes que la majoria de vegades no es poden interpretar només amb informació sintàctica o semàntica. Contràriament, el llenguatge figurat reflexa patrons de pensament que adquireixen ple significat en contextos comunicatius i socials, cosa que fa que tant la seva representació lingüística com el seu processament computacional siguin tasques difícils. 
En aquest context, en aquesta tesi de doctorat s'aborda una problemàtica relacionada amb el processament del llenguatge figurat a partir de patrons lingüístics. En particular, els nostres esforços se centren en la creació d'un sistema capaç de detectar automàticament instàncies d’humor i d’ironia en textos extrets de mitjans socials. La nostra hipòtesi principal es basa en la premissa que el llenguatge reflecteix patrons de conceptualització; és a dir, quan estudiem el llenguatge, estudiem aquests patrons. Per tant, en analitzar aquests dos dominis del llenguatge figurat, pretenem donar arguments respecte de com la gent els concep i, sobretot, com aquesta concepció fa que tant l’humor com la ironia siguin verbalitzats de manera particular en diversos mitjans socials. En aquest context, un dels nostres majors interessos és demostrar com el coneixement que prové de l'anàlisi de diferents nivells d'estudi lingüístics pot representar un conjunt de patrons rellevants per identificar automàticament usos figurats del llenguatge. Cal destacar que, al contrari de la majoria d'aproximacions que han estudiat el llenguatge figurat, en la nostra investigació, no pretenem donar arguments basats únicament en exemples prototípics, sinó en exemples provinents de textos les característiques intrínseques dels quals són molt diferents de les descrites en la literatura especialitzada; per exemple, blogs, comentaris web, tweets, etc. 
A més d'aportar un repertori de patrons lingüístics per detectar humor i ironia a nivell textual, en aquesta investigació, fem èmfasi en el fet de considerar les etiquetes generades pels mateixos usuaris amb la finalitat de crear recursos destinats al processament del llenguatge figurat, per exemple, la construcció automàtica de corpus especialitzats, en els quals ja no és necessària la intervenció d'anotadors humans per etiquetar les dades. 
Finalment, descrivim com avaluem els models proposats en termes de la seva capacitat i rellevància per identificar de manera correcta instàncies d'humor i ironia, respectivament. Amb aquest fi, duem a terme diversos experiments tenint en compte diferents conjunts de dades, així com diferents escenaris d'aplicabilitat. Els resultats obtinguts mostren que el processament del llenguatge figurat (especialment, l'humor i la ironia) pot aportar coneixement rellevant per a tasques tan diverses com l'anàlisi de sentiments, la mineria d'opinions, la recuperació d'informació o el descobriment de les tendències dels usuaris.