RESUMEN Según el historiador griego Heródoto, hacia el año 3050 antes de Cristo los antiguos faraones Egipcios recopilaron datos referentes a la población y riqueza del país con el objeto de preparar la construcción de las pirámides, lo que corresponde quizá al inicio histórico de la estadística, y al reconocimiento de la necesidad humana de recopilar y almacenar gran cantidad y diversidad de información. Por otra parte, la utilización de técnicas avanzadas en el tratamiento y manejo de datos conocida con el término minería de datos, se acuña a principios de los años 90 del siglo pasado, basado en los campos de la ciencia y el conocimiento de: las bases de datos; la recuperación de información; la estadística clásica; el aprendizaje automático; los sistemas para la toma de decisión; la visualización de datos; la computación paralela y distribuida; y otros cómo, el lenguaje natural; el análisis de imágenes; el procesamiento de señales; los gráficos por computadora, etc. En esta tesis, de forma general, se realiza un planteamiento sobre el tratamiento y manejo de datos aplicado a los sistemas de abastecimiento de agua; con éste fin, se hace uso del paradigma del descubrimiento de conocimiento en bases de datos (KDD, de sus siglas en inglés) y se aplican específicamente algunos métodos de minería de datos (Data Mining). Debido a la diversidad de problemáticas que pueden y deben ser resueltas, y tomando como base la información (datos) con la que se cuenta en las diferentes etapas del diseño, operación y gestión de un sistema de abastecimiento de agua, consideramos que éste es un campo apropiado para la aplicación y desarrollo de estas metodologías. Muchas otras ramas de la ciencia y del conocimiento han sido exploradas por medio de estos métodos. El agua es un recurso natural vital que aunque se renueva naturalmente, presenta dotaciones limitadas en cantidad y calidad para cada lugar y momento concretos. Actualmente, hay un interés creciente más no suficiente, hacia la promulgación y el avance en la utilización de técnicas novedosas en el manejo de la información por parte de la comunidad científica de ingenieros del agua, así como de los entes encargados del manejo y gestión de los sistemas de abastecimiento. Por tanto, como aporte a la divulgación se ha desarrollado esta tesis, cuidando con rigor que los planteamientos y las discusiones aquí expuestas, permitan vislumbrar la contribución de la utilización de estas técnicas avanzadas hacia la gestión de los sistemas de abastecimiento de agua. Concretamente, a partir de la información disponible y las herramientas seleccionadas, se generó un modelo de gestión basado en reglas de decisión, para tratar los daños ocasionados y reportados en una red de abastecimiento de agua. La metodología seguida consistió en realizar un amplio estudio del marco teórico del descubrimiento de conocimiento en bases de datos y como aporte presentarlo en idioma español, teniendo en cuenta que la mayor parte de las investigaciones y desarrollos del tema se han hecho en inglés, por lo cual es escasa la información en lengua Castellana. A continuación, se realiza un estudio exhaustivo del estado del arte acerca de las investigaciones y trabajos realizados sobre la utilización, aplicación, y desarrollo de los temas expuestos en el marco teórico de los sistemas de abastecimiento de agua, detallando con profundidad algunos de ellos como base. Posteriormente se presenta una aplicación práctica real, consistente en encontrar las posibles causas de los daños ocurridos durante el año 2006 en la red del sistema de abastecimiento de agua potable del municipio de Calarcá, que se encuentra ubicado en la región cafetera de Colombia. Estos daños fueron reportados por la empresa que gestiona el abastecimiento. Para el desarrollo de esta aplicación se buscaron las posibles relaciones entre las diferentes variables encontradas con base en la información disponible en tales reportes, en el modelo hidráulico del abastecimiento, y en planos temáticos de factores de riesgo por causas naturales importantes en esta región del país. Parte de la información utilizada para esta aplicación práctica nos fue suministrada por la empresa de capital mixto Multipropósito de Calarcá S.A. ESP, quien gestiona el abastecimiento de agua en el municipio. Después de realizar los pasos pertinentes para el desarrollo de la metodología de KDD y de escoger los modelos apropiados, se hace uso de las siguientes herramientas de minería de datos: árboles de regresión y clasificación, redes neuronales y redes de Kohonen, con apoyo del programa Clementine 9.0 de SPSS para encontrar las relaciones entre las variables. Los mejores resultados se obtuvieron con los algoritmos de clasificación y regresión y, aunque con éstos no se llega a tener deducciones que concluyan relaciones fuertes de dependencia que permitan extraer causalidades entre los diferentes daños reportados y las diferentes variables tenidas en cuenta, sí es cierto que, con estos resultados y los desarrollos futuros propuestos, se puede contar con una herramienta que permita ayudar en el diseño, operación y manejo de los sistemas de abastecimiento de agua, basándose en la información que va generando el propio sistema. Los resultados obtenidos, aparte de su gran potencial de aplicabilidad en sistemas de abastecimiento de agua potable, pueden ser mejorados si se cuenta con una información básica tomada para este fin, tal como se plasma en las recomendaciones finales. La metodología seguida y el modelo práctico estudiado presentan las ventajas de poder ser realimentados continuamente, así como tomar decisiones en tiempo real por parte del gestor de la red de abastecimiento, lo cual indudablemente proporciona una útil y poderosa herramienta de gestión; y lo más interesante, a partir de la propia información real de la red de abastecimiento, lo cual salva la problemática de las incertidumbres presentes al momento de plantearse el modelado de la red de abastecimiento de agua potable, así como la valoración subjetiva de parámetros incluidos en estas formulaciones. Para finalizar, se proponen algunas líneas futuras de actuación sobre la mejora de la información disponible y en general, la investigación a seguir para mejorar los resultados obtenidos hasta el momento.