Resumen Les persones invidents i amb discapacitat visual han demandat durant molts anys un dispositiu que faça possible una certa independència en la seua mobilitat. El disseny i desenrotllament d'un dispositiu de navegació com el citat suposaria un gran fita en el camp de l'enginyeria i de la investigació en general. En este context, durant estes últimes dècades, diversos investigadors han aprofundit en diferents mètodes de representació de l'entorn de cara a la seua implementació en dispositius electrònics que faciliten la mobilitat a persones invidents i amb problemes visuals. La present tesi proposa el disseny, modelació, implementació, experimentació i anàlisi d'un dispositiu de navegació i detecció d'obstacles fàcil d'utilitzar, ideat per a persones invidents. Este dispositiu porta el nom de Sistema d'Assistència Cognitiu per a les Persones Cegues (Cognitive AID System for Blind People – CASBliP en anglés). El dispositiu CASBliP constituïx un sistema Electrònic d'Ajuda a la Mobilitat (Electronic Travel AID – ETA en anglés), l'objectiu principal de la qual és ajudar les persones invidents a moure's independentment i de forma segura en diferents entorns, tant interiors com exteriors. En este context, la tesi s'inicia amb l'elaboració d'un detallat estat de l'art sobre els diversos dispositius de navegació existents i en desenrotllament, destinats a persones invidents. La revisió efectuada comprén dispositius desenrotllats des de la Segona Guerra Mundial, moment en què la construcció d'este tipus de dispositius va començar a jugar un paper més important en la vida diària, fins hui en dia. En este capítol inicial, es realitza una classificació dels sistemes de navegació basant-se en el tipus de dispositiu. Més de quaranta equips diferents són descrits en este capítol. No obstant això, a pesar del coneixement i utilització creixent dels dispositius de navegació basats en sensors, encara no ha sigut possible el desenrotllament d'un sistema universal de navegació i detecció d'objectes, que posseïsca una precisió prou elevada. A fi d'aconseguir els objectius plantejats en la tesi, el dispositiu ha sigut dissenyat de manera que inclou dos sistemes d'entrada, una eixida, un portàtil i un FPGA com a unitats de processament, que poden funcionar independentment. El sistema d'entrada està basat en una matriu de sensors CMOS Time of Flight de 64?1, implementats en unes ulleres i dos càmeres estèreo muntades en un casc. El sistema d'eixida esta compost per un parell d'auriculars estèreo, a través dels quals l'usuari percebrà els objectes i camins lliures de l'entorn. L'objectiu del sistema d'entrada és capturar la informació de l'entorn en la direcció frontal a l'usuari. A partir de la informació 3D de l'entorn percebuda pel sistema d'entrada, es construeixen els objectes en moviment, es detecten tots els objectes mòbils i estàtics i els camins lliures, utilitzant per a això els mapes de profunditat, els algoritmes de segmentació i els algoritmes de detecció de moviment. La imatge d'alta resolució del sistema d'entrada és projectada en sons acústics d'alta qualitat, a través del mètode basat en els criteris de navegació i models de convolució amb la denominada Funció de Transferència Relativa al Cap (Head-Related Transfer Function HRTF, en anglés). El dispositiu implementa un mètode de simulació que és capaç de generar una sèrie de sons a partir d'objectes de l'entorn, de manera que estos sons siguen capaços de representar la informació de l'entorn amb elevada precisió. La idea és generar en l'usuari una percepció correcta de les fonts sonores virtuals emeses per la superfície dels objectes, de manera que el cervell humà es puga crear una imatge perceptual en tres dimensions dels objectes, com estos apareixen en el món real. Utilitzant esta idea, es pretén crear una percepció global del so, permetent a les persones invidents percebre i crear-se una imatge global de l'entorn circumdant, així com el mapa de com estan organitzats els objectes en temps real. És ben sabut que els sers humans utilitzen una gran varietat d'informació per a la navegació en l'entorn, que obtenen a través de la vista, l'olfacte, l'oïda, etc. Quan es danya el sistema de visió humà (ceguera o pèrdua parcial de visió), el sistema auditiu agafa el comandament pel que fa a la navegació. En este cas, és molt important i necessari analitzar i definir els aspectes que definixen l'escena visual, ja que constituïxen les característiques més importants per a la navegació i la detecció d'objectes, a fi de representar la presència dels estos i determinar la seua posició en l'espai. En el capítol tres es descriu, en línies generals, el sistema auditiu, fent referència als seus components bàsiques, així com a l'organització auditiva. Açò proporciona una informació preliminar sobre localització de sons per mitjà dels paràmetres acústics (paràmetres monaurals i biaurals, diferència interaural de temps i diferència interaural de nivell, efecte de reverberació, con de confusió, efecte de precedència i model de correlació encreuada). Esta introducció pretén donar una idea general del nivell de precisió necessari en la localització de sons, així com introduir la base del capítol següent, en el que s'analitzen les propietats de la localització de sons. Per a la consecució dels objectius de la tesi, és preceptiva la creació d'un mapa acústic per a representar els objectes detectats; en esta línia, a partir dels fonaments bàsics de funcionament del sistema auditiu i de l'estudi dels factors auditius que contribuïxen en la localització de fonts sonores, en el capítol quatre es descriuen dos mètodes per a l'audició espacial humana i localització de sons en el cas de múltiples fonts sonores. El mètode aplicat es basa en l'aplicació de HRTFs no individuals per a localització de sons estàtics i en moviment a través d'auriculars. Enfront d'altres mètodes existents, basats en la localització de fonts sonores per mitjà de HRTFs no individuals, l'enfocament utilitzat en la tesi es basa en l'estudi de l'evolució de la característica del temps entre dos sons i la seua importància en la localització de fonts sonores a través d'auriculars. La funció HRTF es calcula i es mesura utilitzant un maniquí KEMAR i després es convolucionen amb els sons a través d'un programari, sent finalment assajats amb subjectes reals. En referència a les propietats de localització de sons espacials es descriuen dos conjunts d'experiments amb sons simples de banda ampla. Els dos experiments analitzen la precisió de localització d'un so i d'un tren de sons en condicions de laboratori, de cara a una posterior implementació en el sistema de navegació. Estos experiments demostren que la font de so resulta clau per a la localització tridimensional. La idea consistix a presentar els sons desplaçats en el temps i veure com l'interval temporal entre dos sons influïx en la seua localització. S'ha provat que amb els trens de sons s'obtenen millors resultats en localització de fonts sonores que per al cas d'un so simple. Així mateix, s'analitza també el límit de percepció. En el segon estudi, s'analitza la localització d'un so en moviment, tant en distància com en azimut. Els resultats obtinguts demostren que per a un interval de temps de 150ms, s'aconseguix una millor localització de sons. Convé ressaltar que si es comparen la precisió en distància i azimut, s'obtenen millors resultats en azimut. També es veu en este capítol que les diferències interaurals en temps i nivell juguen un paper molt important en la localització espacial. Els paràmetres interaurales apareixen a causa de la separació de les orelles humanes, que proporciona informació sobre la posició lateral del so. En el capitule cinc es desenrotllen una sèrie d'experiments amb persones invidents, amb el propòsit de mesurar la seua eficiència quant a la detecció d'objectes i la seua localització, quan intervenen distintes fonts sonores. L'objectiu general de tals assajos és presentar diferents objectes a fi d'observar l'habilitat de l'usuari per a la detecció d'objectes i per a l'externalització de sons en distintes situacions. La localització d'objectes via senyals acústics s'aconseguix a causa de l'assimilació del procés d'externalització de sons, que proporciona la informació sobre la posició espacial de l'objecte font del so. Es descriuen tres sèries d'experiments relatius a la detecció d'objectes i navegació via sons. En la primera sèrie d'experiments, es desenrotllen un conjunt de set exercicis amb distints nivells de dificultat (detecció d'un obstacle, detecció de dos obstacles, identificació del buit entre dos obstacles, detecció d'una paret, detecció d'un obstacle davant a una paret, etc…). S'ha provat que els usuaris invidents són capaços d'externalitzar amb gran precisió els sons reproduïts pel sistema de navegació i rebuts via auriculars, així com localitzar els objectes en l'entorn real. En el segon grup d'experiments, s'ha analitzat la tasca de navegació. Per a aconseguir este objectiu s'ha preparat un escenari consistent en 8 columnes construïdes a base de caixes de cartó, separades una distància de 2,5m, disposades en dos línies formant un laberint. Del dit experiment s'han aconseguit notables resultats, tant pel que fa a la detecció d'objectes com en navegació, a pesar de l'elevat nombre de sons reproduïts simultàniament. S'han detectat xicotets errors quant a la precisió en la navegació mentres els subjectes avançaven pel trajecte disposat. No obstant això, la tasca de navegació s'ha desenrotllat, en termes generals, satisfactòriament; pel que fa a la localització d'objectes, els subjectes perceben una lleugera desviació en la localització lateral dels mateixos, és a dir, alguns subjectes han tingut problemes amb la determinació del volum dels objectes. El propòsit de forçar al subjecte a circular entre els objectes era comprovar si era capaç de detectar els obstacles i sortejar-los. Els errors poden tindre la seua explicació en la interferència causada per la reproducció de múltiples sons que representaven els diferents objectes situats en l'àrea de visió; el subjecte havia de detectar cada so i precisar d'on provenia. En el tercer grup d'experiments, el subjecte havia de navegar per escenaris controlats i no controlats en un entorn obert (com ara el pati d'una escola per a persones invidents, interseccions de carrers amb bars, terrasses, restaurants, pàrquings, quioscos, etc…). A pesar dels sons exteriors provinents de senyals de ciruculació, cotxes, música, conversacions humanes, etc…, s'han obtingut grans resultats tant en localització d'objectes com en la navegació. Els subjectes han sigut capaços de detectar i esquivar tots els objectes i navegar amb confiança en uns entorns tan complexos com els mencionats. En general, els experiments desenrotllats han demostrat que la representació de l'entorn per mitjà de sons constituïx un dels mètodes de navegació més fiables. S'ha corroborat que les persones invidents posseïxen una gran habilitat per a percebre l'entorn, a través del sistema auditiu. Són capaços d'adaptar-se ràpidament al sistema i utilitzar-lo com un sistema de navegació complementari al bastó o al gos guia. El sistema de navegació acústic els proporciona major confiança i seguretat en la navegació; el sistema els dóna molta més informació sobre l'entorn, informació que el bastó o altres sistemes convencionals no poden detectar. A causa de la naturalesa dels sons seleccionats, el sistema quasi no interferix amb sons externs. La precisió de la navegació depén de l'entrenament i la pràctica amb el dispositiu i no dels sons. Els resultats obtinguts vénen en bona part influenciats pel feedback amb usuari final, que pot donar idees molt útils quant a refinament, canvis i possibles millores. Com a conseqüència del treball desenrotllat en la present tesi, s'han obtingut les publicacions següents: Publicacions en revista: 1. Dunai L., Peris F. G., Garcia B.D., Santiago P. V., Dunai I. (2010) “The influence of the inter-click interval on moving sound source localization for navigation systems”. Applied Physics Journal, 56 (3), pp. 370-375 2. Dunai L., Peris F. G., Defez B. G., Ortigosa A.N., Brusola S F. (2009). “Perception of the sound source position”, Applied Physics Journal, 55 (3), pp. 448-451 Publicacions en congressos internacionals: 1. Peris F. G., Dunai L., Santiago P. V., Dunai I. (2010). “CASBliP - a new cognitive object detection and orientation aid system for blind people”, CogSys2010 Conference, Zurich 2. Nuria Ortigosa, Samuel Morillas, Guillermo Peris-Fajarnés and Larisa Dunai. (2010), Disparity maps for free path detection, VISAPP 2010 Conference 3. Dunai L., Peris F G., Defez B. G., Ortigosa A.N., (2009). “Acoustical Navigation System for Visual Impaired People”, LivingAll European Conference 4. Ortigosa A. N., Dunai L., Peris F. G., Dunai I., Santiago P. V. (2009). “A multiple sensory prototype for visually impaired subject mobility assistance using sound map generation”, LivingAll European Conference 5. Santiago P. V., Ortigosa A.N., Dunai L., Peris F. G., (2009). “Cognitive aid system for blind people (CASbliP)”, INGEGRAF 2009 Conference 6. Ortigosa A. N., Dunai L., Peris. F.G., (2008). Sound map generation for a prototype blind mobility system using multiple sensors”. ABLETECH 08 Conference 7. Fernandes T. M.M., Peris F.G., Dunai L., Redondo J. (2007). “Convolution application in environment sonification for blind people” VII Applied mathematics workshop Valencia 8. Dunai L., Peris F.G., Fernandes T.M.M., Oliver M.J. (2007). “Spatial sound localization base don Fourier Transform”, VII Applied mathematics workshop Valencia 9. Javier Oliver, Alberto Albiol, Guillermo Peris, Larisa Dunai. (2007). “HOG descriptor improvement in person detection by means of the reduction of the space dimensions”., Proceedings of VIII Jornadas de Matemáticas Aplicada, UPV, Spain Paraules clau: persones invidents, navegació independent, detecció d'objectes, moviment de l'objecte, percepció de font sonora, interval entre clics.