Resumen:
|
[ES] El presente trabajo consiste en realizar modelos de regresión que logren predecir el nivel de percepción que tienen los ciudadanos de la inseguridad de la provincia donde habitan, en los años 2017 y 2018; y realizar ...[+]
[ES] El presente trabajo consiste en realizar modelos de regresión que logren predecir el nivel de percepción que tienen los ciudadanos de la inseguridad de la provincia donde habitan, en los años 2017 y 2018; y realizar comparaciones de los modelos obtenidos, respecto a la capacidad de predicción y variables más importantes.
Para ello se ha tomado como fuente de información censos de diferentes tipos, realizados entre los años 2011 y 2017, los cuales han sido seleccionados, limpiados, combinados y ordenados para generar una única base de datos que sirvió como línea base para realizar el análisis.
Por la naturaleza de los datos obtenidos fue necesario crear una base de datos adicional donde se promediaron los valores de algunas variables y realizó la imputación de la información de 26 variables utilizando regresiones por mínimos cuadrados parciales, para obtener una base de datos sin valores ausentes y con menor cantidad de variables, esto con el fin de poder aplicar la técnica de regresión lineal múltiple. También se usó el análisis de componentes principales para una fase exploratoria de los datos, donde se encontraron relaciones entre variables y provincias. Se aplicaron modelos de regresión por componentes principales, mínimos cuadrados parciales y regresión lineal múltiple y se compararon los resultados obtenidos y variables importantes en ambas bases de datos.
Se lograron resultados satisfactorios en la predicción de la percepción de la inseguridad, siendo el mejor modelo para el año 2017 la regresión por componentes principales que obtuvo en el set de validación un valor de 0.112. Las variables más importantes están relacionadas a el porcentaje de varones, confianza en la policía nacional , confianza en el gobierno regional, porcentaje de afiliados al seguro social y delitos contra la ecología.
En la predicción del nivel de percepción de la seguridad en el año 2018 se tuvo como mejor modelo a la regresión lineal múltiple, con un error residual estándar de 0.102.Las variables más importantes en l modelo fueron porcentaje de varones, confianza en las fuerzas armadas, nivel de victimización y porcentaje de afiliados al seguro social.
Estos resultados, que logran cuantificar el efecto de indicadores de un grupo social, sobre la sensación de temor asociada a recorrer el hábitat cotidianamente, pueden ser tomados como herramientas para evaluar políticas de mejoramiento del bienestar y calidad de vida de la población basado en información empírica comprobable y no en especulaciones.
[-]
[EN] The present work consists of carrying out regression models that predict the level of perception that citizens have of the insecurity of the province where they live, in the years 2017 and 2018; and make comparisons ...[+]
[EN] The present work consists of carrying out regression models that predict the level of perception that citizens have of the insecurity of the province where they live, in the years 2017 and 2018; and make comparisons of the models obtained, regarding the prediction capacity and most important variables.
For this purpose, censuses of different types have been taken as a source of information, carried out between 2011 and 2017, which have been selected, cleaned, combined and sorted to generate a single database that served as the baseline for the analysis.
Due to the nature of the data obtained, it was necessary to create an additional database where the values ¿¿of some variables were averaged and the imputation of the information of 26 variables was used using partial least squares regressions, to obtain a database without missing values ¿¿and With fewer variables, this in order to apply the multiple linear regression technique. The principal component analysis was also used for an exploratory phase of the data, where relationships between variables and provinces were found. Regression models by main components, partial least squares and multiple linear regression were applied and the results obtained and important variables in both databases were compared.
Satisfactory results were achieved in predicting the perception of insecurity, with the best model for 2017 being the regression by main components that obtained a value of 0.112 in the validation set. The most important variables are related to the percentage of men, trust in the national police, trust in the regional government, percentage of social security affiliates and crimes against ecology.
In the prediction of the level of perception of security in 2018, the multiple linear regression model was the best model, with a standard residual error of 0.102.The most important variables in the model were percentage of men, confidence in the armed forces , level of victimization and percentage of social security affiliates.
These results, which quantify the effect of indicators of a social group, on the sensation of fear associated with traveling the habitat on a daily basis, can be taken as tools to evaluate policies to improve the well-being and quality of life of the population based on empirical information. verifiable and not in speculation.
[-]
|