Mostrar el registro sencillo del ítem
dc.contributor.advisor | Civera Saiz, Jorge | es_ES |
dc.contributor.advisor | Lagergren, Jens | es_ES |
dc.contributor.author | Ferrando Huertas, Jaime | es_ES |
dc.date.accessioned | 2018-09-04T11:05:31Z | |
dc.date.available | 2018-09-04T11:05:31Z | |
dc.date.created | 2018-07-20 | |
dc.date.issued | 2018-09-04 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/106545 | |
dc.description.abstract | [EN] Machine learning has becoming a trending topic in the last years, being now one of the most demanding careers in computer science. This growing has lead to more complex models capable of driving a car or cancer detection, however this models improvements are also thanks to the improvements in computational power. In this study we investigate a data exploration technique for creating synthetic data, a field of Machine learning that does not have as much improvements in the last years. Our project comes from a industrial process where data is a valuable asset, this process has both computational power and power full models but struggles with the availability of the data. In response for this a model for generating data is proposed, aiming to fill the lack of data during data exploration and training of this industrial process. This model consist of a Hidden Markov Model where states represent different distributions the data follows, data is created by traveling through this states with an algorithm that uses the prior distribution of these states in a Dirichlet distribution. The method to infer data distributions from the given data and create this Hidden Markov Model model has been explained along with the technique used to travel between states. Results have been presented showing how the data inferring performed and how the synthetic data reproduces the original one, taking special care for the reproduction of specific features in the original data. To get a better perspective of the data we created we tricked the states for our model, creating data from all of the states or from the states with less prior probability. Results showed that the model is capable of creating data similar to the real one but it struggled with data with a small amount of significant outliers. In conclusion a model to create reliable data have been introduced along with a list of possible improvements. | es_ES |
dc.description.abstract | [ES] Hoy en día un gran número de empresas están integrando técnicas de aprendizaje computacional en su modelo de negocio. Estas técnicas requieren de grandes cantidades de datos, lo cual no es siempre el caso para todas las empresas. Para dar solución a este problema real, se plantea la posibilidad de desarrollar un generador de datos sintéticos. En este proyecto se estudia un método fiable para generar datos sintéticos a partir de una colección de datos ya existente, de forma que los datos sintéticos se asemejen a la colección de datos dada. Para ello analizaremos las distribuciones estadísticas que siguen la colección de datos dada y estimaremos sus parámetros para crear un modelo oculto de Markov en el que cada estado contendrá los parámetros de cada distribución, que será inferida a partir de la colección de datos dada. Una vez derivado el modelo oculto de Markov se desarrollará un algoritmo de generación de datos sintéticos que transite entre los estados del modelos de Markov entrenado. Por último, analizaremos la validez de estos datos sintéticos con un detector de comportamiento anormal basado en máquinas de vectores soporte y/o redes neuronales recurrentes. | es_ES |
dc.format.extent | 38 | es_ES |
dc.language | Inglés | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | Markov models | es_ES |
dc.subject | Synthetic data | es_ES |
dc.subject | Detection of abnormal behaviour | es_ES |
dc.subject | Modelo de Markov | es_ES |
dc.subject | Datos sintéticas | es_ES |
dc.subject | Detección comportamiento anormal | es_ES |
dc.subject.classification | LENGUAJES Y SISTEMAS INFORMATICOS | es_ES |
dc.subject.other | Grado en Ingeniería Informática-Grau en Enginyeria Informàtica | es_ES |
dc.title | Generation of synthetic data based on hidden Markov models | es_ES |
dc.title.alternative | Generación de datos sintéticos basada en modelos ocultos de Markov | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica | es_ES |
dc.description.bibliographicCitation | Ferrando Huertas, J. (2018). Generation of synthetic data based on hidden Markov models. http://hdl.handle.net/10251/106545 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\88403 | es_ES |