Resumen:
|
[ES] El presente trabajo fin de máster tiene como principal objetivo analizar la viabilidad de incorporar
funcionalidades relacionadas con la detección y el reconocimiento facial en un videoportero
comercial. En los ...[+]
[ES] El presente trabajo fin de máster tiene como principal objetivo analizar la viabilidad de incorporar
funcionalidades relacionadas con la detección y el reconocimiento facial en un videoportero
comercial. En los últimos años, los avances en el campo de la inteligencia artificial han impulsado
significativamente las capacidades de la visión por computador. Los logros obtenidos con la
creación de algoritmos y modelos basados en técnicas de aprendizaje profundo han revolucionado
la forma en la que procesamos y analizamos imágenes, mejorando notablemente el rendimiento
y abriendo nuevas posibilidades en áreas como el reconocimiento de objetos, la detección de
patrones, etc. Al considerar la integración de las funcionalidades mencionadas en el videoportero
comercial, es importante tener en cuenta que, debido a la naturaleza del dispositivo, existirán
limitaciones computacionales inherentes a los sistemas embebidos. Por tanto, uno de los
principales objetivos del proyecto se basa en conseguir resultados que velen por una positiva
experiencia del usuario a expensas de las limitaciones mencionadas.
El trabajo constará de diversas fases claramente diferenciables. En primer lugar, se llevará a cabo
un estudio tanto de las últimas técnicas y modelos para la visión por computador, como de las
principales herramientas de código abierto (bibliotecas, marcos de trabajo, etc.) para el
procesamiento de dichos modelos. Una vez finalizada la etapa de análisis e investigación, se
realizará una preselección de aquellas herramientas y modelos que, en primera instancia, cumplan
con los requisitos establecidos por el sistema objetivo (sistema Linux embebido con arquitectura
ARM). A continuación, se llevará a cabo la integración de las herramientas en el sistema, además
del diseño de las pruebas para evaluar el rendimiento de los modelos en el videoportero. Una vez
realizadas las pruebas, se analizarán los resultados y se determinará la viabilidad de incluir las
funcionalidades de detección y reconocimiento facial en el videoportero comercial.
Finalmente, debemos destacar que en este trabajo también se abordará las preocupaciones y
cuestiones éticas que surgen a raíz de la integración de técnicas como la detección y el
reconocimiento facial en sistemas comerciales. Por un lado, el uso de estas tecnologías podría
mejorar significativamente la seguridad de un edificio, reduciendo el riesgo de intrusiones a
personas no autorizadas. Sin embargo, la falta de transparencia en muchas ocasiones sobre la
gestión realizada con los datos personales de los usuarios suele provocar el rechazo por parte de
estos. Por otro lado, también hay que tener en cuenta que los modelos de reconocimiento pre
entrenados que se seleccionen pueden estar sesgados dependiendo de si los datos con los que han
sido entrenados son o no lo suficientemente representativos. Esto puede producir decisiones
erróneas por parte del sistema, provocando la discriminación de algunos usuarios según sus
rasgos.
[-]
[EN] The main objective of this master's thesis is to analyze the potential of incorporating
functionalities related to face detection and recognition in a commercial video door entry system.
In recent years, advances ...[+]
[EN] The main objective of this master's thesis is to analyze the potential of incorporating
functionalities related to face detection and recognition in a commercial video door entry system.
In recent years, advances in the field of artificial intelligence have significantly boosted the
capabilities of computer vision. The achievements obtained with the creation of algorithms and
models based on deep learning techniques have revolutionized the way in which we process and
analyze images, significantly improving performance and opening new possibilities in areas such
as object recognition, pattern detection, etc. When considering the integration of the mentioned
functionalities in the commercial video door entry system, it is important to keep in mind that,
due to the nature of the device, there will be computational limitations inherent to embedded
systems. Therefore, one of the main objectives of the project is based on achieving results that
ensure a positive user experience at the expense of the limitations.
The work will consist of several clearly distinguishable phases. First, a study of the latest
techniques and models for computer vision, as well as of the main open-source tools (libraries,
frameworks, etc.) for the processing of these models will be carried out. Once the analysis and
research stage are completed, a pre-selection of those tools and models that, in the first instance,
meet the requirements established by the target system (embedded Linux system with ARM
architecture) will be made. Next, the integration of the tools into the system will be carried out,
in addition to the design of the tests to evaluate the performance of the models in the video door
entry system. Once the tests have been carried out, the results will be analyzed and the potential
of including the facial detection and recognition functionalities in the commercial video door
entry system will be determined.
Finally, we should note that this paper will also address the concerns and ethical issues that arise
from the integration of techniques such as face detection and recognition into commercial
systems. On the one hand, the use of these technologies could significantly improve the security
of a building, reducing the risk of intrusion by unauthorized persons. However, the lack of
transparency in many cases about the management of users' personal data often leads to their
rejection. On the other hand, it must also be considered that the pre-trained recognition models
that are selected may be biased depending on whether the data with which they have been trained
are sufficiently representative. This can lead to erroneous decisions by the system, causing
discrimination of some users based on their features.
[-]
|