La visión artificial analiza los elementos presentes en una imagen. Su objetivo es conocerla, pero conocerla… para ayudarla. Ayudar a un ciego a leer la marca de la leche que está comprando, a un médico a tener una radiografía de mayor calidad, o a un fabricante de tornillos para que tengan una medida exacta para que un robot la inserte en un coche.
Parte de este campo tecnológico es el conocimiento del color. En muchas tareas, la información que transporta el color es imprescindible: por ejemplo, para conocer el grado de madurez de la fruta, si las revistas se han impreso correctamente o si las latas de refresco han sido litografiadas correctamente.
Cuando trabajamos con colores, creemos que se pueden evaluar fácilmente. Nosotros lo hacemos en todo momento: acercamos el cuaderno rojo o miramos el coche azul. Pero para un sistema artificial este trabajo es muy difícil. La primera dificultad es que las cámaras trabajan únicamente con tres colores: rojo, verde y azul; se llama RGB (teniendo en cuenta las palabras de red , green y blue en inglés). Y la segunda es que el color no es la característica inmutable de un objeto. Si vemos una hoja de papel al sol nos parecerá blanca, pero si miramos en una habitación con una luz roja nos parecerá roja. Al ver el color la luz influye mucho. También es importante lo que tienen a su alrededor: en la imagen de la página siguiente tenemos dos cuadros del mismo color rodeados de diferentes colores, nuestros ojos nos dicen que los colores del cuadro son diferentes.
Con el objetivo de determinar el comportamiento del color, los investigadores vienen trabajando desde hace tiempo. Newton dio sus primeros pasos, analizando cómo se descomponía la luz al atravesar un prisma. Le sigue J.C. Maxwell y T. Por ejemplo, Young siguió la misma línea, a los que debemos lo que hoy sabemos sobre el color, que básicamente es una percepción humana. Es decir, el color existe porque nosotros vemos el mundo y asociamos colores a lo que vemos. Lo mismo ocurre con las lenguas: aunque una palabra tiene un sonido propio, tiene sentido porque nosotros le damos significado.
Siendo el color una característica de la percepción humana, empezamos a analizar cómo lo vemos. Para ello era necesario conocer la forma de trabajar de nuestro sistema visual. La neurociencia es una disciplina que estudia nuestro sistema nervioso y en la que se encuentra la visión. Los neuroinvestigadores parten de diferentes enfoques: biológico, médico, farmacológico... La neurociencia computacional estudia la forma de trabajar de nuestro sistema neurológico para crear sistemas artificiales basados en sistemas biológicos.
Los ojos son el acceso a la visión humana. Son un tesoro, un tesoro que todos tenemos, y nada más empezar a analizarlo nos damos cuenta de la complejidad del sistema. Los humanos tenemos dos ojos con más de 100 millones de fotorreceptores (conos y bastones). Dicho de otro modo, tenemos una cámara de 100 megapíxeles en cada ojo, con cámaras digitales actuales entre 5 y 20 megapíxeles. Pero además tenemos un pequeño ordenador: la retina. Este ordenador está formado por 6 capas ordenadas. Cada capa de la retina es realizada por diferentes células.
Para poder analizar cómo trabajamos los seres humanos el color, hemos desarrollado un modelo matemático representando el funcionamiento de la retina. Para la construcción de esta estructura hemos recopilado y analizado los datos de la investigación anatómica y neurofisiológica. Comienza con la definición de cada una de las capas que componen el modelo. Definiremos la localización de cada célula de cada capa para definir el nivel de cubierta y las zonas de captación. Además, las células están conectadas a otro tipo de células, recibiendo señales de entrada y emitiendo señales de salida, simulando conexiones dendríticas y axónicas. Por último, la integración de las señales recibidas por las células y la generación de señales de salida mediante shunts o conexiones unificadoras han sido otras de las áreas que hemos trabajado.
Por tanto, para poder construir el modelo es necesario determinar dónde está cada célula, con qué y cómo se comunica y qué tipo de trabajo realiza.
En total se han tomado como modelo 4 tipos de células y 24 subtipos. Los canales de salida del sistema son células ganglionares que, una vez codificados los pulsos nerviosos, transmiten la información a través del nervio óptico.
Hemos definido un sistema que calcula el color de una imagen combinando los canales de información que genera cada grupo de células ganglionadas. Para ello nos hemos basado en el cálculo de los atributos de colores propuestos por la ciecam02 (Comission Internationale de l'Eclairage 2002). Uniendo el sistema inventado y el ciecam02a, hemos conseguido un sistema bioinspirado capaz de distinguir los colores de la manera que las personas distinguen. El modelo de color de una imagen calcula, para cada punto, el tono, la blancura, la luminosidad, la saturación, el croma y la cromática, así como los parámetros de detección de aristas, tanto en componentes cromáticos como no cromáticos. El modelo matemático inventado en el trabajo de investigación obtiene mejores resultados que el último modelo propuesto por el CIE al utilizar las bases de datos de colores Munsell. Además, el modelo CIE se utiliza únicamente con muestras de laboratorio, mientras que el modelo presentado es capaz de trabajar con imágenes reales. En la imagen superior se muestran las imágenes generadas por los diferentes tipos de células del modelo, así como las características de color de cada píxel. Este sistema abre las puertas a los avances en visión artificial y mejora los resultados obtenidos hasta el momento. Se podrá utilizar tanto para mejorar la calidad de vida de las personas como en la industria.
Agradecimientos: Gracias a FUNDACIÓN TECNALIA por su colaboración y gracias al GOBIERNO VASCO por la concesión de subvenciones a través del programa ETORTEK para investigaciones realizadas en el Instituto Tecnológico de Massachusetts y en la Universidad de Cambridge.