Investigadores de la Universidad de Jaén mejoran la capacidad de interacción con personas en robots de uso social

El grupo ‘Multimedia and Multimodal Processing’ de la UJA diseña un modelo de procesado de información para ayudar al robot a “interpretar” las señales audio-visuales que registra a través de cámaras de vídeo y sensores de audio.

151
miembros grupo de investigación UJA

Investigadores de la Universidad de Jaén diseñan un nuevo modelo de interacción con personas para mejorar los mecanismos de atención en robots de uso social. El objetivo del equipo es diseñar un sistema de procesado de la información que permita al robot “atender” a una persona, es decir, reconocer quién está hablando dentro de una habitación, seguirla con la mirada y, en definitiva, interactuar con ella.

Se trata del grupo de investigación TIC-227 ‘Multimedia and Multimodal Processing’ (M2P), uno de los grupos más jóvenes de la UJA, formado por ingenieros, físicos e informáticos que trabajan principalmente en el Campus Científico-Tecnológico de Linares. El equipo jiennense participa a través de esta investigación en un proyecto conjunto con las universidades de Málaga, Extremadura, Castilla La Mancha y la Universidad Carlos III de Madrid. La finalidad de dicho convenio es crear un robot que trabaje con personas mayores.

Dentro de este proyecto, el grupo de la UJA se ocupa concretamente de diseñar el software que dote al robot de los mecanismos necesarios para “prestar atención” y poder comunicarse con sus usuarios. “Lo que hacemos básicamente es trabajar en el procesado multimodal para permitir que el robot pueda procesar distintos tipos de información, audio y visual, y así mejorar su capacidad de interacción”, explica Pedro Jesús Reche, miembro del grupo. Para ello, los investigadores trabajan en un sistema de procesado que fusiona la información visual que recibe el robot a través de las cámaras con la información auditiva que recibe a través de los micrófonos. “La idea es que el robot tenga comportamientos socialmente aceptables”, añade.

La capacidad de interacción social como meta

Según señala Pedro Reche, dependiendo del uso que se vaya a hacer del robot, éste puede incorporar una o varias cámaras de vídeo, así como uno o diversos sensores de audio. “Si quieres que el robot pueda tener conciencia de la profundidad que hay en el espacio no vale con una sola cámara, se necesitan al menos dos, al igual que el ser humano tiene dos ojos para calcular mejor el espacio”, destaca el investigador. En este sentido, los ingenieros de la UJA se inspiran en la propia biología humana para conseguir estas habilidades, aunque la manera de conseguirlo, desde el punto de vista tecnológico, es distinta y a veces permite incluso superar las dotes humanas.

De esta manera, el diseño de este modelo de procesado de información permite al robot “interpretar” lo que ve y lo que oye, y por lo tanto interactuar con las personas. La meta, a largo plazo, es conseguir que este robot trabaje con personas mayores dentro de un entorno inteligente dotado con sensores y otros mecanismos que lo ayuden a desenvolverse. “En robótica hemos avanzado mucho, pero aún queda trabajo por hacer y a veces hay expectativas muy altas de lo que se puede conseguir. Todos hemos visto películas que pueden tender a la confusión”, recalca el experto. Así, uno de los principales retos para la robótica es precisamente mejorar su capacidad de interacción social, algo que en la práctica se consigue dotando al autómata de “sentidos”, para poder registrar lo que ve y escucha, y de “inteligencia”, para poder interpretarlo.