- -

Inteligencia de negocios aplicada al sector automovilístico

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Inteligencia de negocios aplicada al sector automovilístico

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Guijarro Martínez, Francisco es_ES
dc.contributor.author Rueda Soler, Jorge es_ES
dc.date.accessioned 2021-09-13T15:19:28Z
dc.date.available 2021-09-13T15:19:28Z
dc.date.created 2021-07-27
dc.date.issued 2021-09-13 es_ES
dc.identifier.uri http://hdl.handle.net/10251/172285
dc.description.abstract [ES] La motivación principal de este trabajo es informar a los consumidores de cuáles son los aspectos más relevantes a la hora de comprar un coche para que puedan elegir mejor en función de las conclusiones de este estudio. Todo este trabajo ha sido realizado con el software R Studio, el código de programación estará oculto por razones visuales, no obstante, se incluye en los anexos del trabajo. Para lograr los diferentes objetivos, se realizan diferentes secciones, cada una acorde a los distintos objetivos del trabajo, los cuáles serán desarrollados en el siguiente punto. En primer lugar, se determina la tipología de variables, es decir, identificar cuáles son numéricas y cuáles de ellas son categóricas. La principal diferencia entre estos tipos de variables es que las categóricas identifican la clase de la observación, por ejemplo, una persona puede ser hombre o mujer, mientras que las numéricas determinan un valor numérico de una variable, por ejemplo, la altura de una persona. Se realiza un análisis exploratorio de las variables con el fin de conocer mejor la base de datos. Una vez hecho este análisis, se comprueba que no haya variables constantes en las observaciones, porque como el propio nombre indica son variables, si fueran constantes habría que eliminarlas. También serán eliminadas aquellas que presenten un exceso de valores inconsistentes. Se define como valor inconsistente a la observación que tiene un valor que está muy distante al resto y que no es lógico. Además, serán eliminadas aquellas variables u observaciones que tengan un porcentaje de valores faltantes (NA: Not Available) superior al 20%. Este porcentaje se toma como referencia, ya que supondría que una de cada cinco observaciones tendría un NA en esa variable o que la observación tendría una de cada cinco variables en NA. Como ya se ha comentado, se toma como referencia, pero hay que tener en cuenta que cada base de datos es distinta y a pesar de que este porcentaje se utilice como referencia, siempre dependerá de la persona que trata la base de datos (más o menos estricta) y de la base datos (número de observaciones y de variables). Tras esto, con la librería Van Buuren and Groothuis-Oudshoorn (2011), se imputarán dichos valores faltantes en caso de que no superen el porcentaje marcado. Imputar significa estimar qué valor tendría la observación faltante basándose en el resto de las características que tiene esa observación. Esas características las compartirá con otras observaciones de la base de datos, y de esta forma se podrá estimar. Existen también procesos alternativos para las variables numéricas como la sustitución del dato faltante por la media de las observaciones con datos. Finalmente, tras haber preparado la base de datos, se realizan relaciones entre variables de las cuáles se pueda obtener información relevante. Al acabar estos primeros pasos, se realiza un método de aprendizaje no supervisado, el cual tiene como fin principal ver las relaciones entre todas las variables numéricas. El método escogido es el Análisis de Componentes Principales (PCA). De esta forma se consigue eliminar el posible efecto de correlación que pudieran tener las variables entre sí. Este efecto de correlación se verá más adelante en estudios individualizados entre variables. A continuación, se realizarán diversos métodos de aprendizaje supervisado para ver que variables son las más influyentes a la hora de predecir si un coche estará por encima de 30.000$. Este valor es la mediana del precio en esta base de datos. Se escoge este valor ya que 30.000 $ es un precio considerable para un coche y de esta forma se divide en dos la base de datos, dividendo justo por la mitad de las observaciones. Se podría dividir por la media, pero valores extremos en el precio (coches de más de 2.000.000 $) hacen que este valor sea elevado y por tanto haya más cantidad de coches por debajo de la media. Con el uso de la mediana se evita este efecto y se busca predecir qué características tendrá un coche para estar en un grupo u otro. La principal diferencia entre estos métodos es el objetivo, el aprendizaje supervisado busca predecir, mientras que el aprendizaje no supervisado busca obtener información útil a partir de la base de datos. es_ES
dc.format.extent 74 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject R Studio es_ES
dc.subject Base de datos es_ES
dc.subject Coches es_ES
dc.subject Sector automovilístico es_ES
dc.subject Valoración es_ES
dc.subject Vehículos es_ES
dc.subject Inteligencia de Negocios es_ES
dc.subject.classification ECONOMIA FINANCIERA Y CONTABILIDAD es_ES
dc.subject.other Grado en Administración y Dirección de Empresas-Grau en Administració i Direcció d'Empreses es_ES
dc.title Inteligencia de negocios aplicada al sector automovilístico es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Facultad de Administración y Dirección de Empresas - Facultat d'Administració i Direcció d'Empreses es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Economía y Ciencias Sociales - Departament d'Economia i Ciències Socials es_ES
dc.contributor.affiliation Universitat Politècnica de València. Instituto Universitario de Matemática Pura y Aplicada - Institut Universitari de Matemàtica Pura i Aplicada es_ES
dc.description.bibliographicCitation Rueda Soler, J. (2021). Inteligencia de negocios aplicada al sector automovilístico. Universitat Politècnica de València. http://hdl.handle.net/10251/172285 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\140999 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem