Resumen:
|
[ES] La motivación del presente TFM surge a raíz del trabajo realizado por el alumnos durante su periodo de prácticas en la compañía Visualfy. Ésta trabaja en un dispositivo inteligente capaz de procesar el audio del entorno ...[+]
[ES] La motivación del presente TFM surge a raíz del trabajo realizado por el alumnos durante su periodo de prácticas en la compañía Visualfy. Ésta trabaja en un dispositivo inteligente capaz de procesar el audio del entorno y detectar determinados eventos sonoros, como puede ser el llanto de un bebe, una alarma de incendios o humos, un timbre, etc. y notificarlo al usuario/s. Actualmente estos dispositivos se emplean tanto en espacios públicos como privados, haciéndolos totalmente accesibles, en especial para personas con pérdida auditiva.
El problema radica en que la amplia casuística del entorno en el que puede trabajar el dispositivo dificulta, en ciertas ocasiones, la correcta clasificación de los eventos sonoros. Por este motivo, surge la necesidad de investigar y desarrollar una nueva funcionalidad que complemente y mejore a la ya existente.
De este modo, el trabajo que se propone tiene como objetivo el desarrollo de un sistema que permita captar y tratar varias señales de audio en tiempo real, con el fin de estimar la dirección de llegada de las distintas fuentes sonoras. Para ello, se implementarán distintos enfoques de algoritmos que permiten obtener dicha estimación, a modo de escoger el que arroje estimaciones más robustas.
Así, el dispositivo podría conocer además del tipo de sonido, la posición de la que proviene, de modo similar a como lo hace nuestro oído. Siendo capaz de discriminar sonidos a priori iguales, pero que provienen de distintos puntos del espacio.
Cabe destacar que, dada la limitación del hardware existente, no es posible la ampliación de la funcionalidad del producto. Por ello será necesario también analizar distintas opciones de tarjetas embebidas como Beeaglebone, Raspberry, Arduino, etc. También se estudiarán las distintas opciones del periférico encargado de capturar el audio, ya que se requiere de un array o matriz de micrófonos físicamente espaciados.
Con todo esto, se pretende obtener una versión mejorada del producto Visualfy, con un hardware con mayor capacidad de cómputo y un funcionamiento en su conjunto mucho más robusto.
[-]
[EN] The motivation for this work arises from my time at the Visualfy company, during my internship.
This company works on an intelligent device capable of processing the surrounding audio and
detecting certain sound ...[+]
[EN] The motivation for this work arises from my time at the Visualfy company, during my internship.
This company works on an intelligent device capable of processing the surrounding audio and
detecting certain sound events, such as the cry of a baby, a fire or smoke alarm, a bell, etc. and
notify the user / s. Currently these devices are used in both public and private spaces, making
them fully accessible, especially for people with hearing loss.
However, the wide casuistry of the environment in which the device can work makes it difficult,
on certain occasions, to correctly classify sound events. For this reason, the need arises to
research and develop a new functionality that complements and improves the existing one.
The proposed document aims to develop a system that allows capturing and treating the
different audio signals in real time, in order to estimate the direction of arrival of the different
sound sources. To do this, different algorithmic approaches will be implemented that allow
obtaining said estimate, to choose the one that shows the most robust estimates.
In this way, the device will be able to know, in addition to the type of sound, the position from
which it comes, in a similar way to how our ear does. Being able to discriminate a priori equal
sounds, but that come from different points in space.
It should be noted that, given the limitation of the existing hardware, it is not possible to extend
the functionality of the product. For this reason, different options of embedded cards such as
Beeaglebone, Raspberry, Arduino will be analyzed. The different options of the peripheral in
charge of capturing the audio will also be studied, since it requires an array of physically spaced
microphones.
With all this, it is intended to obtain an improved version of the starting product, with hardware
with greater computing capacity and a more robust operation.
[-]
|