La detección automática de texto reutilizado consiste en determinar si un texto ha sido producido considerando otro como fuente. Quizás el plagio, la reutilización de texto sin el crédito adecuado, sea el tipo más famoso. Los casos de plagio se han incrementado de manera dramática en los últimos años, en parte debido a la facilidad con la que es posible acceder a la información a través de medios electrónicos. Ello ha motivado que expertos en análisis de textos presten atención a este fenómeno. Con base en las tecnologías de procesamiento de lenguaje natural y recuperación de información, los métodos de detección automática de texto reutilizado comparan miles de documentos en busca de la posible fuente de un texto presumiblemente reutilizado. En aquellos casos en los que se desea descubrir casos de reutilización entre lenguas, se puede recurrir a técnicas de traducción automática. Gracias a toda esta tecnología es viable realizar miles de comparaciones exhaustivas incluso entre documentos en distintas lenguas, algo imposible de llevar a cabo de manera manual. En esta tesis nos enfocamos principalmente en tres tipos de reutilización: (i) reutilización de texto translingüe, (ii) reutilización de texto con paráfrasis, y (iii) reutilización monolingüe y translingüe dentro y desde Wikipedia. En el caso de la reutilización de texto translingüe, proponemos un modelo para medir la similitud entre textos basado en traducción automática estadística. El modelo es comparado con algunos otros de los disponibles a la fecha de manera exhaustiva, mostrando ser una de las mejores opciones en aquellos casos en los que se buscan traducciones exactas, sin importar si éstas han sido generadas automática o manualmente. En el caso de la paráfrasis, el núcleo del plagio, investigamos los tipos de paráfrasis que son más difíciles de detectar. Nuestro análisis de la tarea de detección de plagio desde la perspectiva de la paráfrasis representa una investigación que nunca antes se había llevado a cabo. Entre nuestros descubrimientos, cabe destacar que las estrategias de paráfrasis que más comúnmente se aplican son cambios léxicos. Dichos descubrimientos deberían ser considerados en la próxima generación de detectores de plagio. Finalmente, exploramos a Wikipedia como un marco en el que interactúan infinidad de autores; en el que los contenidos son reutilizados en la generación de nuevas versiones de un artículo y también saltan de una lengua a otra. Nuestro análisis de plurilingüismo muestran que aquellas ediciones de Wikipedia en lenguas con menos recursos tienden a estar mejor relacionadas con otras. También investigamos qué tan factible es extraer fragmentos paralelos de Wikipedia con el objetivo de (i) detectar casos de reutilización translingüe en la enciclopedia y (ii) enriquecer nuestro modelo para medir la similitud de textos en distintas lenguas. Con el objetivo de probar nuestros modelos empíricamente, realizamos millones de comparaciones, tanto monolingües como translingües, con base en diversas técnicas de representación y medidas de similitud. En muchos casos, nuestros experimentos son realizados considerando corpus desarrollados por nosotros mismos, los cuales están ya disponibles para cualquier investigador interesado de manera gratuita.