Linguistic-based Patterns for Figurative Language Processing: The Case of Humor Recognition and Irony Detection Resumen El lenguaje figurado representa una de las tareas más difíciles del procesamiento del lenguaje natural. A diferencia del lenguaje literal, el lenguaje figurado hace uso de recursos lingüísticos tales como la ironía, el humor, el sarcasmo, la metáfora, la analogía, entre otros, para comunicar significados indirectos que la mayoría de las veces no son interpretables sólo en términos de información sintáctica o semántica. Por el contrario, el lenguaje figurado refleja patrones del pensamiento que adquieren significado pleno en contextos comunicativos y sociales, lo cual hace que tanto su representación lingüística, como su procesamiento computacional, se vuelvan tareas por demás complejas. Dentro de este contexto, en esta tesis de doctorado se aborda una problemática relacionada con el procesamiento del lenguaje figurado a partir de patrones lingüísticos. En particular, nuestros esfuerzos se centran en la creación de modelos capaces de detectar de manera automática instancias de humor e ironía en textos extraídos de medios sociales. Nuestra hipótesis principal se basa en la premisa de que el lenguaje refleja patrones de conceptualización; es decir, al estudiar el lenguaje, estudiamos tales patrones. Por tanto, al analizar estos dos dominios del lenguaje figurado, pretendemos dar argumentos respecto a cómo la gente los concibe, y sobre todo, a cómo esa concepción hace que tanto humor como ironía sean verbalizados de manera particular. En este sentido, uno de nuestros mayores intereses es demostrar cómo el conocimiento que proviene del análisis de diferentes niveles de estudio lingüístico puede representar un conjunto de patrones relevantes para identificar automáticamente usos figurados del lenguaje. Cabe destacar que contrario a la mayoría de aproximaciones que se han enfocado en el estudio del lenguaje figurado, en nuestra investigación no buscamos dar argumentos basados únicamente en ejemplos prototípicos, sino en textos cuyas características intrínsecas son muy distintas de las descritas en la literatura especializada; por ejemplo, en blogs, comentarios web, tweets, etc. Además de aportar un repertorio de patrones lingüísticos para detectar humor e ironía a nivel textual, en esta investigación hacemos énfasis en el hecho de considerar las etiquetas generadas por los mismos usuarios con el fin de crear recursos destinados al procesamiento del lenguaje figurado; por ejemplo, en la construcción automática de corpora especializados, en los cuales ya no es necesaria la intervención de anotadores humanos para etiquetar los datos. Finalmente, describimos cómo evaluamos los modelos propuestos en términos de su capacidad y relevancia para identificar de manera correcta instancias de humor e ironía, respectivamente. Para ello, ejecutamos varios experimentos tomando en cuenta diferentes conjuntos de datos, así como diferentes escenarios de aplicabilidad. Los resultados obtenidos muestran que el procesamiento del lenguaje figurado (en especial, el humor y la ironía) puede aportar conocimiento relevante para tareas tan diversas como el análisis de sentimientos, el minado de opiniones, la recuperación de información o el descubrimiento de las tendencias de los usuarios.