A visión artificial analiza os elementos presentes nunha imaxe. O seu obxectivo é coñecela, pero coñecela… paira axudala. Axudar a un cego a ler a marca do leite que está a comprar, a un médico a ter una radiografía de maior calidade, ou a un fabricante de parafusos para que teñan una medida exacta para que un robot insíraa nun coche.
Parte deste campo tecnolóxico é o coñecemento da cor. En moitas tarefas, a información que transporta a cor é imprescindible: por exemplo, paira coñecer o grao de madurez da froita, si as revistas hanse impreso correctamente ou si as latas de refresco foron litografiadas correctamente.
Cando traballamos con cores, creemos que se poden avaliar facilmente. Nós facémolo en todo momento: achegamos o caderno vermello ou miramos o coche azul. Pero paira un sistema artificial este traballo é moi difícil. A primeira dificultade é que as cámaras traballan unicamente con tres colorees: vermello, verde e azul; chámase RGB (tendo en conta as palabras de rede , green e blue en inglés). E a segunda é que a cor non é a característica inmutable dun obxecto. Si vemos una folla de papel ao sol pareceranos branca, pero se miramos nunha habitación cunha luz vermella pareceranos vermella. Ao ver a cor a luz inflúe moito. Tamén é importante o que teñen ao seu ao redor: na imaxe da páxina seguinte temos dous cadros do mesma cor rodeados de diferentes cores, os nosos ollos dinnos que as cores do cadro son diferentes.
Co obxectivo de determinar o comportamento da cor, os investigadores veñen traballando desde hai tempo. Newton deu os seus primeiros pasos, analizando como se descompuña a luz ao atravesar un prisma. Séguelle J.C. Maxwell e T. Por exemplo, Young seguiu a mesma liña, aos que debemos o que hoxe sabemos sobre a cor, que basicamente é una percepción humana. É dicir, a cor existe porque nós vemos o mundo e asociamos cores ao que vemos. O mesmo ocorre coas linguas: aínda que una palabra ten un son propio, ten sentido porque nós dámoslle significado.
Sendo a cor una característica da percepción humana, empezamos a analizar como o vemos. Paira iso era necesario coñecer a forma de traballar do noso sistema visual. A neurociencia é una disciplina que estuda o noso sistema nervioso e na que se atopa a visión. Os neuroinvestigadores parten de diferentes enfoques: biolóxico, médico, farmacolóxico... A neurociencia computacional estuda a forma de traballar do noso sistema neurológico paira crear sistemas artificiais baseados en sistemas biolóxicos.
Os ollos son o acceso á visión humana. Son un tesouro, un tesouro que todos temos, e nada máis empezar a analizalo dámosnos/dámonos conta da complexidade do sistema. Os humanos temos dous ollos con máis de 100 millóns de fotorreceptores (conos e bastóns). Dito doutro xeito, temos una cámara de 100 megapíxeles en cada ollo, con cámaras dixitais actuais entre 5 e 20 megapíxeles. Pero ademais temos un pequeno ordenador: a retina. Este computador está formado por 6 capas ordenadas. Cada capa da retina é realizada por diferentes células.
Paira poder analizar como traballamos os seres humanos a cor, desenvolvemos un modelo matemático representando o funcionamento da retina. Paira a construción desta estrutura recompilamos e analizado os datos da investigación anatómica e neurofisiológica. Comeza coa definición de cada una das capas que compoñen o modelo. Definiremos a localización de cada célula de cada capa paira definir o nivel de cuberta e as zonas de captación. Ademais, as células están conectadas a outro tipo de células, recibindo sinais de entrada e emitindo sinais de saída, simulando conexións dendríticas e axónicas. Por último, a integración dos sinais recibidos polas células e a xeración de sinais de saída mediante shunts ou conexións unificadoras foron outras das áreas que traballamos.
Por tanto, paira poder construír o modelo é necesario determinar onde está cada célula, con que e como se comunica e que tipo de traballo realiza.
En total tomáronse como modelo 4 tipos de células e 24 subtipos. As canles de saída do sistema son células ganglionares que, una vez codificados os pulsos nerviosos, transmiten a información a través do nervio óptico.
Definimos un sistema que calcula a cor dunha imaxe combinando as canles de información que xera cada grupo de células ganglionadas. Paira iso baseámonos no cálculo dos atributos de cores propostas pola ciecam02 (Comission Internationale de l'Eclairage 2002). Unindo o sistema inventado e o ciecam02a, conseguimos un sistema bioinspirado capaz de distinguir as cores da maneira que as persoas distinguen. O modelo de cor dunha imaxe calcula, paira cada punto, o ton, a blancura, a luminosidade, a saturación, o croma e a cromática, así como os parámetros de detección de arestas, tanto en compoñentes cromáticos como non cromáticos. O modelo matemático inventado no traballo de investigación obtén mellores resultados que o último modelo proposto polo CIE ao utilizar as bases de datos de cores Munsell. Ademais, o modelo CIE utilízase unicamente con mostras de laboratorio, mentres que o modelo presentado é capaz de traballar con imaxes reais. Na imaxe superior móstranse as imaxes xeradas polos diferentes tipos de células do modelo, así como as características de cor de cada píxel. Este sistema abre as portas aos avances en visión artificial e mellora os resultados obtidos até o momento. Poderase utilizar tanto paira mellorar a calidade de vida das persoas como na industria.
Agradecementos: Grazas a FUNDACIÓN TECNALIA pola súa colaboración e grazas ao GOBERNO VASCO pola concesión de subvencións a través do programa ETORTEK paira investigacións realizadas no Instituto Tecnolóxico de Massachusetts e na Universidade de Cambridge.