Salir
  • Logo Objetivos Desarrollo Sostenible
  • Logo campus IBERUS
  • Logo UNITA

Reconocimiento internacional para dos jóvenes investigadores del I3A por su innovadora técnica de visión por computador

El trabajo de Lorenzo Mur y María Santos ha sido premiado en el Computer Vision and Pattern Recognition (CVPR), imponiéndose a más de 40 equipos
Ambos investigan en el campo de la visión egocéntrica, la visión desde un punto de vista de primera persona
Su técnica permite identificar objetos desde cámaras móviles y fijas con alta precisión
visión egocéntrica

Zaragoza, lunes 30 de junio de 2025.- Lorenzo Mur y María Santos, dos jóvenes investigadores del I3A han sido este año los ganadores del primer premio en la conferencia más prestigiosa actualmente en el campo de la visión por computador, el Computer Vision and Pattern Recognition (CVPR), por su participación en el Second Joint Egocentric Vision Workshop, celebrado recientemente en Estados Unidos. Con su trabajo, lograron imponerse a más de 40 equipos internacionales.

Un reconocimiento “muy importante para nosotros, nos motiva a seguir investigando con más fuerza en el campo de la visión egocéntrica o visión desde un punto de vista de primera persona, para ayudar a personas”, explican. Además, subrayan el hecho de que, a veces, “no es necesario disponer de mucha capacidad computacional, sino que, con introducir estrategias inteligentes, incluso con recursos académicos, se puede lograr una contribución en nuestro campo”.

Ambos forman parte del Grupo de Robótica, Visión por Computador e Inteligencia Artificial (Ropert). Lorenzo Mur ya fue premiado el año pasado en este mismo congreso, el más relevante a nivel internacional en visión por computador.

Un trabajo sobre visión egocéntrica

En la propuesta que presentaron, partían de dos cámaras, una que se mueve, que podría ser la de un robot o una persona, con las nuevas gafas con cámaras, y otra que está fija, como una cámara de vigilancia, otro robot, un asistente, etc. A partir de ese momento, son capaces de identificar un objeto de una cámara en la otra. “Por ejemplo, si una persona está mirando un objeto concreto, somos capaces de identificarlo en la cámara fija y viceversa. Esto que podría parecer fácil, es bastante complicado ya que un objeto puede estar medio tapado o deformado en una de las cámaras. También puede haber varios objetos parecidos y que no sea fácil saber cuál es cuál. Además, la cámara que lleva la persona se mueve continuamente, con lo que muchos objetos aparecen borrosos”.

Su investigación en visión por computador, les permite identificar el objeto a nivel de pixel, es decir, saber exactamente qué punto de la imagen pertenece al objeto y cual no. “Nuestra estrategia, como muchas otras que han utilizado los competidores, se basa en que sistemas de inteligencia artificial (redes neuronales) aprendan a base de mostrar miles de videos, pero a diferencia de otros, nosotros hemos usado otras redes neuronales para ayudar a nuestro sistema a aprender y luego a deducir la respuesta correcta. Además, hemos inventado una técnica para ayudar a diferenciar objetos cercanos entre sí”, explican María Santos y Lorenzo Mur.

Más de 1000 horas de vídeo

El año pasado se publicó el conjunto de videos más grande y completo (tiene más de 1000 horas) que existe en visión egocéntrica, EgoExo4D. “Tiene muchísima información útil y al ser tan relevante y con tanto potencial, decidimos aprovecharlo al máximo para avanzar en nuestra investigación. Cuando anunciaron el challenge, ya llevábamos tiempo trabajando en esa tarea por lo que nos animamos a participar”, apuntan.

En total, han participado unos 40 equipos de distintos países. El desafío al que se enfrentaron “fue muy emocionante, hasta el último día no sabías en qué posición estabas o si había algún equipo mucho mejor en otra parte del mundo. Cada día, nuestros resultados iban mejorando, pero sin saber si eran suficientes para ganar, ya que competíamos con algunos de los mejores laboratorios de investigación del mundo, de universidades y centros tecnológicos muy punteros, que también están trabajando en este tipo de tecnologías”.

Lorenzo Mur y María Santos estudiaron el grado de Ingeniería de Tecnologías Industriales en la Universidad de Zaragoza, él hizo el máster de Robótica, Gráficos y Visión por Computador y ella, el máster de Ingeniería Industrial. Actualmente, realizan el doctorado en el programa de Ingeniería de Sistemas e Informática, supervisados por José J. Guerrero y por Rubén Martínez-Cantín. En el trabajo que han llevado al Congreso de Visión por Computador, han participado también Alejandro Pérez-Yus y Jesús Bermúdez-Cameo.

De cara al futuro, ambos tienen intención de seguir en el mundo de la investigación. “Ahora mismo, nuestro objetivo principal es terminar la tesis y seguir desarrollando nuestro trabajo en esta línea”.

Consideran su experiencia en el grupo de investigación RoPeRT y en el I3A “muy enriquecedora. Es un entorno con gente muy implicada y con grandes ansias de seguir en formación constante, siempre al tanto de nuevos avances en nuestro campo. Contamos con la supervisión de investigadores que además de tener mucha experiencia son cercanos y valoran a las personas, lo que permite trabajar en un ambiente seguro y motivador. Eso nos está permitiendo crecer mucho tanto a nivel técnico como personal”, subrayan.

Es el segundo año que el grupo de investigación de Robótica, Visión por Computador e Inteligencia Artificial (RoPeRT) obtiene este reconocimiento internacional en el Congreso de Visión Por Computador, el más importante del mundo en este ámbito.