Resumen:
|
[ES] El presente Trabajo Fin de Máster (TFM) tiene como objetivo mejorar el actual sistema de predicción de la caducidad y de detección de defectos de una empresa del sector alimentario en un producto vegetal (lechuga tipo ...[+]
[ES] El presente Trabajo Fin de Máster (TFM) tiene como objetivo mejorar el actual sistema de predicción de la caducidad y de detección de defectos de una empresa del sector alimentario en un producto vegetal (lechuga tipo Iceberg) mediante la metodología Seis Sigma Multivariante de mejora de procesos.
La motivación de este TFM surge debido a la existencia de lotes de producto fresco que no cumplen los requerimientos de calidad establecidos. Se dispone de una base de datos que contiene información de espectros NIR (infrarrojo cercano) de bandejas del producto.
De las cinco etapas de las que consta la metodología Seis Sigma Multivariante (definir, medir, analizar, mejorar y controlar), en el presente trabajo, realizado en colaboración con la empresa proveedora de los datos, se han desarrollado solo las cuatro primeras, quedando pendiente por completar la fase de control.
Las herramientas estadísticas aplicadas en este TFM se pueden clasificar en tres grupos: herramientas de análisis exploratorio, herramientas de predicción y clasificación, y herramientas de detección y monitorización.
En el primer grupo de herramientas se ha usado el Análisis de Componentes Principales (PCA), lo que ha permitido realizar un análisis exploratorio de los datos, detectar anomalías y/o diferencias entre los distintos espectros y comprender las relaciones existentes entre las distintas variables.
Como herramientas de predicción se han empleado tanto técnicas estadísticas (Regresión Lineal Múltiple (RLM), Regresión de Mínimos Cuadrados Parciales (PLS) y Regresión en Componentes Principales (PCR)) como herramientas de Machine Learning (Random Forest, Máquinas de Soporte Vectorial, Árbol de regresión, Vecino más próximo y Redes Neuronales) con el fin de comparar y seleccionar el mejor modelo para predecir la fecha de caducidad del producto. Por su parte, también se ha pretendido construir modelos para clasificar entre bandejas de producto fresco y producto degradado, para lo cual se ha empleado tanto PLS-DA (versión discriminante del PLS) como algunas de las herramientas de Machine Learning anteriormente comentadas.
Por último, mediante el uso de imágenes RGB se ha propuesto un modelo de monitorización multivariante basado en PCA con el objetivo de detectar defectos (zonas de la bandeja con producto estropeado) en las muestras de producto.
[-]
[EN] The aim of this Master's Thesis (MT) is to improve the current expiration prediction and defect detection system of a company in the food sector in a vegetable product (Iceberg-type lettuce) through the Six Sigma ...[+]
[EN] The aim of this Master's Thesis (MT) is to improve the current expiration prediction and defect detection system of a company in the food sector in a vegetable product (Iceberg-type lettuce) through the Six Sigma Multivariate methodology for improving processes.
The motivation of this MT arises due to the existence of batches of fresh product that do not meet the established quality requirements. The available database contains information on NIR (near infrared) spectra of product trays.
Of the five stages that the Multivariate Six Sigma methodology consists of (define, measure, analyze, improve and control), in this work, carried out in collaboration with the data provider company, only the first four have been developed, leaving pending to complete the control phase.
The statistical tools applied in this MT can be classified into three groups: exploratory analysis tools, prediction and classification tools, and detection and monitoring tools.
In the first group of tools, Principal Component Analysis (PCA) has been used, which has made it possible to carry out an exploratory analysis of the data, detect anomalies and/or differences between the different spectra, and understand the relationships between the different variables.
Statistical techniques have been used as prediction tools (Multiple Linear Regression (MLR), Partial Least Squares Regression (PLS) and Principal Component Regression (PCR)) as well as Machine Learning tools (Random Forest, Support Vector Machines, Tree of regression, Nearest Neighbor and Neural Networks) in order to compare and select the best model to predict the expiration date of the product. For its part, it has also been attempted to build models to classify between trays of fresh product and degraded product, for which both PLS-DA (discriminant version of PLS) and some of the previously mentioned Machine Learning tools have been used.
Finally, through the use of RGB images, a multivariate monitoring model based on PCA has been proposed with the aim of detecting defects (areas of the tray with spoiled product) in the product samples.
[-]
|