Resumen:
|
In the field of learning models from data, the quality of models depends to a large extent on the quality of the training data. That is the reason why the preparation and cleaning of data is one of the stages of the knowledge ...[+]
In the field of learning models from data, the quality of models depends to a large extent on the quality of the training data. That is the reason why the preparation and cleaning of data is one of the stages of the knowledge extraction process in which more time is investing. In fact, the most common scenario in the model training phase is that models be created under almost "perfect" conditions (and using "perfect" training data). However, the situation is often quite different during the model deployment phase, since, in the "real world", data usually contain noise, there may are missing or incorrect values, or even be uncertain, in the sense that we do not know their exact value, we only have an approximate knowledge of its value.
In this Master Thesis, we will study how to apply the learning models to uncertain data. We will focus on classification problems in which uncertainty is only present in numerical attributes.
[-]
En el ámbito del aprendizaje de modelos a partir de datos, la calidad de los modelos depende en gran medida de la calidad de los datos usados en su entrenamiento. Es por ello, que de las etapas de que consta cualquier ...[+]
En el ámbito del aprendizaje de modelos a partir de datos, la calidad de los modelos depende en gran medida de la calidad de los datos usados en su entrenamiento. Es por ello, que de las etapas de que consta cualquier proceso de extracción de conocimiento, la de preparación y limpieza de los datos es la que ocupa un tiempo mayor. De hecho, es habitual que los modelos se generen con datos ¿limpios¿ bajo condiciones casi ¿perfectas¿. Sin embargo, la situación suele ser bastante diferente durante la etapa de aplicación del modelo, ya que los datos reales suelen contener ruido, puede haber valores faltantes, erróneos, o incluso ser inciertos en el sentido de que no conocemos su valor exacto, sino que solo tenemos un conocimiento aproximado de su valor.
En este TFM vamos a estudiar este último caso, cómo aplicar modelos a datos inciertos. Vamos a centrarnos en problemas de clasificación en los que la incertidumbre solo está presente en atributos numéricos.
[-]
|