¿A qué estás mirando? Mirando los ojos

Villanueva Larre, Arantxa

Telekomunikazio Ingeniaritzan doktorea

Nafarroako Unibertsitate Publikoa

Aunque la investigación sobre los sistemas de seguimiento de la mirada comenzó hace décadas, entonces, en torno a finales de los 60, el poder controlar un ordenador con el ojo era un sueño totalmente inimaginable para sus primeros admiradores. Sin embargo, desde entonces estos sistemas se han desarrollado con gran rapidez y han hecho cada vez más clara la vía para hacer realidad esas intenciones que parecían inaccesibles. Los desarrollos y aplicaciones del sistema de seguimiento del ojo, eye tracking, han despertado cierto interés en los últimos años.
¿A qué estás mirando? Mirando los ojos
01/04/2007 | Villanueva Larre, Arantxa | Doctor en Ingeniería de Telecomunicaciones por la Universidad Pública de Navarra

(Foto: De archivo)
La tecnología de seguimiento ocular abarca desde la informática hasta la psicología. El proceso de la imagen, la electrónica, la óptica y el análisis de los procesos cognitivos tienen que ver con el diseño y uso de estos sistemas. Pero... ¿qué objetivo puede tener seguir la mirada de un ser humano y analizarla?... ¿Qué tipo de sistemas y técnicas permiten conocer el movimiento de los ojos de una persona? Vamos a responder lentamente a estas preguntas.

Aplicaciones de sistemas observacionales

En lo que respecta a las aplicaciones de estos sistemas, se puede clasificar en usos con fines diagnósticos y usos con fines interactivos.

Usos diagnósticos

La atención o atención es un proceso que focaliza la capacidad de entender nuestro entorno en un estímulo concreto. Tiene que ver directamente con nuestra parte cognitiva y conocer el movimiento de los ojos ayuda en gran medida a comprender estos mecanismos. La utilización de un sistema eye tracking como herramienta diagnóstica ha generado herramientas para medir la relación entre el movimiento de los ojos y la atención. Se pueden aplicar en psicología pero también en otros ámbitos, sobre todo en el de marketing y publicidad.

Se han realizado trabajos interesantes en este campo. Recientemente se han obtenido resultados diagnósticos relevantes en neurociencia y psicología. Uno de los apartados más estudiados es el de los movimientos oculares en los procesos de lectura de textos. El análisis de los movimientos oculares durante la lectura ayuda a detectar ciertos errores y patologías, siendo la dislexia una de las más conocidas. El objetivo de los sistemas de eye tracking en este campo sería registrar la trayectoria visual de la persona ante el texto para que la psicóloga o el especialista correspondiente interprete los datos. De la misma manera, los estudios y trabajos realizados consideran el estudio de los movimientos oculares como una valiosa herramienta para el diagnóstico precoz de la esquizofrenia y el estrabismo.

Los puntos azules representan los puntos de vista registrados sobre el texto.
D. Salvucci/Drexel Univ.

Continuando con las aplicaciones diagnósticas, también se han encontrado trabajos más complejos que exploran entornos inteligentes. Cada ser humano sigue un patrón al explorar su entorno. El análisis de los movimientos oculares en la percepción libre tiene consecuencias positivas para comprender los mecanismos que utilizamos para asimilar el medio ambiente.

Puntos observados por un especialista al analizar una mamografía y recorrido con los ojos.
C.E. Nodine et al./Pendergrass Lab. y Estudio de Mama por Imagen en la Univ. de Pennsylvania

En general, estos sistemas son una potente herramienta para comprender y medir la inteligencia humana. En función de la aplicación, las consecuencias pueden modificar positivamente el comportamiento del ser humano en ciertas acciones. Es sabido que la falta de atención provoca accidentes en la conducción. En los últimos tiempos se han realizado importantes esfuerzos en automoción. Sin duda, el análisis de los movimientos oculares del conductor es una herramienta perfecta para detectar la falta de atención y el sueño del conductor. Los resultados experimentales servirán para conseguir coches más seguros en el futuro.

Similares usos se pueden encontrar en la industria y en la medicina. En la industria, el registro y control de calidad de los productos se realiza a menudo a través de la vista, y un mal análisis puede tener consecuencias graves. Sin embargo, puede ser más grave que un especialista explore poco una resonancia u otras imágenes médicas. El análisis de los movimientos oculares, tanto en la industria como en los estudios de imágenes médicas, puede ser utilizado para detectar estrategias de inspección repetitivas o escasas del ser humano.

En los dos anuncios de la izquierda, los puntos azules más grandes son los que más atención han despertado. En la imagen de la derecha aparecen marcadas las partes más exploradas de una página web.
Instituto de Investigación de Marketing de Consumo de Japón; M. Russel/Laboratorio de Investigación de Software Accesible/Unidad Estatal de Wichita.
Por último, pero quizás con mayor fuerza, se ha abierto un amplio campo alrededor del mundo de la publicidad y el marketing. La mirada del consumidor es una fuente de información de gran valor. En la publicidad, el camino recorrido por los ojos es un dato innegable para saber si se ha visto y asimilado una parte determinada del anuncio.

En la misma línea, los estudios sobre las páginas web ya han comenzado a asentar ciertos principios de diseño. Según los estudios realizados, en general, en la página web se explora en primer lugar el apartado superior izquierdo. Los resultados indican que tratamos de buscar letras mayúsculas, que parecen estar normalmente en esa zona.

Usos interactivos

Los usos interactivos de los sistemas eye tracking deben entenderse dentro del contexto de comunicación hombre-ordenador. En este sentido, en algunas situaciones en las que no es posible utilizar las manos se presentan como una opción interesante.

La capacidad motriz del ser humano, es decir, el control motor, se ve afectada por numerosas enfermedades y patologías como la esclerosis múltiple, la esclerosis lateral amiotrófica, la parálisis cerebral, el daño de la médula y el infarto cerebral, entre otras. A pesar de sus peculiaridades, independientemente de su origen, tienen como característica destacable la reducción de la capacidad motriz. A menudo, este deterioro puede llegar a las máximas medidas, provocar la inmovilidad total y convertir al hombre en prisionero de su cuerpo.

Sin embargo, normalmente, incluso en etapas avanzadas de la enfermedad, el movimiento ocular controlado se mantiene intacto y se convierte en una única vía de comunicación. En estos casos, la ubicación anterior de la pantalla de la mirada puede utilizarse como instrucción para el ordenador. Con este objetivo se han creado numerosos software específicos. Las aplicaciones más conocidas son los llamados teclados virtuales. En ellas, el usuario del sistema eye tracking puede seleccionar letras y palabras mirando en el teclado que aparece en la pantalla y completar así las frases. Esto permitiría, en gran medida, superar sus dificultades de comunicación.

En la figura se muestra un ejemplo sencillo. Gracias al sistema eye tracking, la película se detiene cuando el espectador lleva la mirada fuera de la pantalla, porque el sistema entiende que el espectador llama la atención en otra cosa.
Human Media Lab. Univ. de Queens

La aplicación de los sistemas de eye tracking es amplia en el ámbito de las discapacidades y cada día aparecen nuevas posibilidades.

Sin embargo, existen usos interactivos no relacionados con la inmovilidad. Su base es la relación entre el punto en el que se corrige la mirada en la pantalla y el interés del usuario. Estas se denominan Gaze Contingent Display (GCD) o interfase bajo vigilancia. En ellos se puede adaptar el entorno de la pantalla explorada al usuario, por ejemplo, mostrar más detalles, utilizar un zoom automático o crear nueva información relacionada con el anterior.

Del mismo modo, resulta interesante la aplicación de estas técnicas a la realidad virtual y al mundo de los dibujos animados. Es sabido que este tipo de trabajos suponen una gran carga de computación. Producir imágenes de calidad no es un proceso tan simple. El objetivo de los sistemas de eye tracking sería adivinar cuál es la parte de la imagen que el espectador observa para mostrar este elemento con mejor definición y más detalle. En el resto de partes, sin embargo, se perdería la calidad, facilitando así la reproducción de la imagen.

Técnicas y sistemas de seguimiento de la mirada

Con lo anterior, se puede decir que los sistemas eye tracking tienen cierta aplicación… pero ¿qué es un sistema eye tracking? ¿En qué consiste su funcionamiento? El trabajo de Young y Sheena resume perfectamente los recursos que ofrece la tecnología para seguir la mirada. En realidad, existen diversas tecnologías que permiten analizar la mirada del ser humano, siendo las más conocidas la electrooculografía (EOG) y la videooculografía (VOG).

Ejemplo de sistema OMR.
Metro Vision
Las técnicas del primer grupo fueron ampliamente aceptadas hace unos cuarenta años. Su fundamento es medir los cambios de tensión eléctrica que produce el cuerpo al mover el ojo. Para registrar estos cambios de señal eléctrica es necesario pegar electrodos alrededor del ojo. Estas variaciones se producen entre 15-200V. Se asume una variación media de 20V al girar un grado por el ojo.

Los contrarios a esta técnica utilizan como argumento de oposición interferencias. Es innegable que los movimientos musculares que hay alrededor tienen una influencia notable en la señal. Además, la dependencia de la anchura de la pupila de la luz altera el funcionamiento de los electrodos. En consecuencia, esta técnica requiere condiciones muy especiales para que los resultados obtenidos sean datos representativos de lo ocurrido.

Las técnicas videoculográficas utilizan una cámara para grabar las imágenes del ojo. La base es simple: la imagen del ojo cambia a medida que cambia la mirada. En cuanto a estos sistemas, las fuentes de luz que operan en el infrarrojo cercano (750-880 nm) tienen un uso notable. La capacidad de visión del ser humano alcanza los 700 nm, por lo que este tipo de luz es invisible, es decir, no apreciamos el efecto producido en el ojo. El objetivo de la luz es, por un lado, generar imágenes oculares de una calidad aceptable y, por otro, provocar peculiaridades concretas en la imagen, que se generen reflejos en la superficie de la córnea.

Ejemplo de sistema VOG. La cámara graba la imagen del ojo. A la derecha, imagen de la pupila. En este caso se ven claramente dos reflejos en la imagen.
IRISCOM; Univ. de Navarra Público

Normalmente, utilizando técnicas de proceso propias de la imagen, en las imágenes grabadas se buscan características especiales como la forma de la pupila, la disposición de los reflejos, etc. Los cambios en estas características están directamente relacionados con la variación de la mirada.

Ejemplo de un sistema que se coloca arriba como gafas en la cabeza. Abajo, un sistema que sujeta la cabeza de forma fija mediante un soporte.
SR Research Eyelink; Laboratorio de percepción visual. Instituto de Tecnología Rochester; Tecnologías Fourward.

Uno de los grandes límites de estos sistemas es el movimiento de la cabeza. El usuario debe mantener la cabeza fija en una zona para no ir fuera de la cámara. A pesar de la escasa importancia de esta barrera en el ámbito de la inmovilidad, en algunos usuarios y aplicaciones no es tarea fácil, ya que las lentes y objetivos de campo que utilizan estos sistemas dejan poco espacio a la libertad. Con el objetivo de superar esta barrera, varios investigadores han propuesto nuevas soluciones. Los más conocidos son los sistemas que se aplican directamente sobre la cabeza, como un casco o una gafa. La cabeza puede moverse libremente, ya que la cámara se mueve con ella.

También disponemos de sistemas que mantienen la cabeza fija mediante un soporte. El problema desaparece porque se puede aceptar que la cabeza se queda quieta. Por parte del usuario se pierde comodidad.

Ejemplo de un sistema de eye tracking multicámara.
T. Ohno/NTT Cyber Solutions lab./ Corporación NTT
En la última década muchos investigadores han tratado de superar las barreras y limitaciones que estos sistemas generan. En este sentido, los resultados más destacados han sido los sistemas de eye tracking multicámara o estéreo. Por un lado, la posición de la cabeza se determina mediante dos cámaras de campo amplio, situadas en la imagen (izquierda, abajo) sobre la pantalla. Si se coloca la cabeza en el espacio, la otra cámara que sigue el ojo, la parte inferior de la pantalla, se enfoca hacia ese punto utilizando motores especiales para obtener una imagen adecuada para su procesado.

Con lo anterior, podemos afirmar que el futuro de los sistemas de eye tracking está asegurado. A medida que se mejoren las técnicas empleadas, podemos esperar una mayor escucha de estos aparatos.

Cuidado, por tanto, cuando te pones delante del escaparate de una tienda... ¡Alguien mira a ti!

Atención
(Foto: Unidad Inst. Investigación Aplicaciones Visuales/Derby)
Hace cuatro años se realizó un interesante experimento en la National Gallery de Londres. David Wooding, conocido investigador que murió hace un par de años, registró movimientos oculares de personas ante cuadros utilizando un sistema de eye tracking. Los datos almacenados serían una medida directa del interés de la persona. En el ejemplo, el recorrido de un espectador con el ojo se representa por rayas y puntos. Se puede considerar que los tramos más observados son los que han prestado mayor atención.
(Foto: Human Media Lab./Univ. de Queens.)
También se han realizado trabajos curiosos en este campo. Uno de los más curiosos es Auramirror, del equipo dirigido por Roel Vertegal en la Universidad de Queens en Canadá. El objetivo es medir, a través de los movimientos de los ojos, la atención entre el oyente y el ponente en una conferencia o entrevista. Según los investigadores, el contacto ocular podría mostrar cierto interés mutuo y la duración de este contacto sería la medida de la atención. Esta atención se manifiesta mediante una “nube” virtual.
Fundamentos de técnicas videooculográficas
Al margen de los aspectos matemáticos más complejos, las técnicas videooculográficas pueden clasificarse en varios criterios. Una de las más conocidas es la de los sistemas que utilizan una pupila clara y una pupila oscura. La diferencia entre estas técnicas radica en la posición de la fuente luminosa respecto a la cámara. Si la fuente luminosa se sitúa en el eje de simetría de la cámara, en la imagen aparece la luz pupila. Tiene la misma base que un efecto frecuente en la utilización del flash en las fotos, el efecto de los ojos rojos. Como el flash está cerca de la cámara, toda la luz reflejada en la retina del ojo vuelve directamente a la imagen y se representa con una pupila roja destacada. En el caso de los sistemas eye tracking, ya que trabajan con imágenes en blanco y negro, el efecto se refleja en un gris claro. No es necesario decir que este efecto desaparece si la fuente de luz se coloca lejos del eje, entonces la pupila aparece más oscura en la imagen.
(Foto: Univ. de Navarra Público; Centro de Investigación de Almadas de IBM)
Bibliografía
Chapman, P. Underwood, G.
Eye Guidance in Reading and Scene Perception.
Elsevier, Oxford, England, 1998.
------
Duchowski, T.
The Eye tracking Methodology. Theory and Practice.
Springer-Verlag Londres Ltd. 2003.
------
Henderson, J.M. Ferreira, F.
The interface of Language, Vision, and Action.
Psychology Press, Nueva York, 2004.
------
Young, L.R. y Sheena, D.
Survey of eye movement recording methods.
Methods Designs, Behavior Research Methods and Instrumentation, 7, 5, 1975, 397-429.
Villanueva Larre, Arantxa
Servicios
Más información
2007
Seguridad
041
Premios; Software; Tecnología; Comunicación
Dossier
Servicios
Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila