Ikusmen artifizialak irudi batean dauden elementuak aztertzen ditu. Ezagutzea da haren helburua, baina ezagutzea... laguntzeko. Itsu bati, erosten ari den esnearen marka irakurtzen lagundu; sendagile bati, kalitate handiagoko erradiografia izaten; edota torlojuak egiten dituenari, torloju horiek neurri zehatza izan dezaten, robot batek kotxe batean txertatzeko.
Arlo teknologiko honen atal bat kolorea jakitea da. Eginkizun ugaritan, koloreak garraiatzen duen informazioa behar-beharrezkoa da: esaterako, frutaren heldutasunaren maila jakiteko, aldizkariak egoki inprimatu diren ala ez ikusteko, edo freskagarri-latak modu egoki batez litografiatuak izan diren aztertzeko.
Koloreekin lan egiten dugunean, uste izaten dugu modu erraz batez ebaluatu daitezkeela. Guk uneoro egiten dugu: hurbildu koaderno gorria, edo, begira kotxe urdina. Baina sistema artifizial batentzat lan hori oso zaila da. Lehenengo zailtasuna da kamerek hiru kolorerekin bakarrik lan egiten dutela: gorria, berdea eta urdina; RGB esaten zaio ( red , green eta blue ingelesezko hitzak aintzat harturik). Eta bigarrena da kolorea ez dela objektu baten ezaugarri aldaezina. Paperezko orri bat eguzkitan ikusten badugu, zuria irudituko zaigu, baina gela batean argi gorri batekin begiratzen badiogu gorria irudituko zaigu. Kolorea ikustean argiak eragin handia du. Inguruan daukatena ere garrantzitsua da: hurrengo orriko irudian, kolore bereko bi lauki dauzkagu kolore ezberdinez inguraturik; gure begiek laukiko koloreak desberdinak direla esaten digute.
Kolorearen portaera zehaztu nahian, ikertzaileek aspaldidanik lanean dihardute. Newtonek eman zituen lehendabiziko urratsak, prisma bat zeharkatzean argia nola deskonposatzen zen aztertuz. Haren atzetik, J.C. Maxwellek eta T. Youngek, esaterako, ildo beretik jarraitu zuten; haiei zor diegu koloreari buruz gaur egun dakiguna: funtsean gizakien pertzepzio bat baino ez dela. Hau da, kolorea existitzen da guk mundua ikusten dugulako eta ikusten dugunari koloreak lotzen dizkiegulako. Hizkuntzekin gauza bera gertatzen da: hitz batek soinu propioa izan arren, zentzua du guk geuk esanahia ematen diogulako.
Kolorea gizakien pertzepzioaren ezaugarri bat izanik, nola ikusten dugun aztertzen hasi ginen. Horretarako beharrezkoa zen jakitea gure ikusmen-sistemaren lan egiteko era. Neurozientzia gure nerbio-sistema aztertzen duen diziplina da, eta ikusmena sistema horren barruan dago. Neuroikertzaileak ikuspuntu ezberdinetatik abiatzen dira: biologikoa, medikoa, farmakologikoa... Neurozientzia konputazionalak gure sistema neurologikoaren lan egiteko era aztertzen du, sistema artifizialak sortu ahal izateko, sistema biologikoetan oinarriturik.
Begiak dira gizakien ikusmenaren sarbidea. Altxor bat dira, denok daukagun altxor bat, eta aztertzen hasi bezain laster sistemaren konplexutasunaz ohartzen gara. Gizakiek bi begi dauzkagu, eta bakoitzak 100 milioitik gora fotorrezeptore (konoak eta makilak) ditu. Beste modu batez esanda, 100 megapixeleko kamera bat daukagu begi bakoitzean, gaur egungo kamera digitalak 5-20 megapixeleko tartean daudelarik. Baina, horrez gain, ordenagailu txiki bat dugu: erretina, hain zuzen ere. Ordenagailu hori 6 geruza ordenatu ezberdinez osaturik dago. Erretinako geruza bakoitza zelula ezberdinek gauzatzen dute.
Gizakiek kolorea nola lantzen dugun aztertu ahal izateko, eredu matematikoa garatu dugu erretinaren funtzionamendua irudikatuz. Egitura hori eraiki ahal izateko, ikerketa anatomikoko eta neurofisiologikoko datuak jaso eta aztertu ditugu. Eredua osatzen duen geruza bakoitzaren definizioarekin hasten da. Geruza bakoitzeko zelula bakoitza non kokatzen den zehaztu behar dugu, estalki-maila eta hartze-eremuak definitzeko. Horrez gain, zelulak beste mota bateko zelulekin konektatuta daude, sarrerako seinaleak jasoz eta irteerako seinaleak igorriz, konexio dendritikoak eta axonikoak simulatuz. Azkenik, zelulek jasotako seinaleak nola integratzen dituzten eta irteerako seinaleak nola sortzen dituzten, shunt edo konexio bateratzaileen bidez, horiek izan dira landu ditugun beste eremu batzuk.
Beraz, eredua eraiki ahal izateko, zelula bakoitza non dagoen, zerekin eta nola komunikatzen den eta zer lan-mota burutzen duen zehaztu beharra dago.
Orotara 4 zelula-mota eta 24 azpimota hartu dira eredutzat. Sistemaren irteera-kanalak zelula ganglionarrak dira, eta horiek, pultsu nerbiosoak kodetu ondoren, nerbio optikoan zehar bidaltzen dute informazioa.
Erretinaren ereduak zelula ganglionar multzo bakoitzak sortzen dituen informazio-kanalak konbinatuz irudi baten koloreak kalkulatzen duen sistema bat definitu dugu. Horretarako CIECAM02-k (Comission Internationale de l'Eclairage 2002 urtekoa) proposaturiko koloreen atributuen kalkuluetan oinarritu gara. Asmatutako sistema eta CIECAM02a lotuz sistema bioinspiratu bat lortu dugu, gai dena pertsonek bereizten duten eran koloreak bereizteko. Irudi baten kolore-ereduak puntu bakoitzeko ezaugarri hauek kalkulatzen ditu: tonua, zuritasuna, argitasuna, asetasuna, kroma eta kromatasuna, bai eta ertzen detekziorako parametroak ere, osagai kromatikoetan zein ez-kromatikoetan. Ikerketako lanean asmatutako eredu matematikoak CIEk proposatutako azken ereduak baino emaitza hobeak lortzen ditu Munsell kolore datu-baseak erabiltzean. Gainera, CIE eredua laborategiko laginekin erabiltzen da soilik; aldiz, aurkeztutako eredu hori irudi errealekin lan egiteko ere gai da. Goiko irudian, ereduko zelula-mota ezberdinek sortzen dituzten irudiak azaltzen dira, baita pixel bakoitzeko kolore-ezaugarriak ere. Sistema horrek ateak zabaltzen ditu ikusmen artifizialean izango diren aurrerapenetarako, eta orain arte lortutako emaitzak hobetzen ditu. Erabili ahal izango da bai pertsonen bizimoduaren kalitatea hobetzeko, eta bai industrian ere.
Eskertzak: Eskerrak TECNALIA FUNDAZIOARI emandako laguntzagatik, eta eskerrak EUSKO JAURLARITZARI ETORTEK programaren bidez Massachusettseko Institutu Teknologikoan eta Cambridgeko Unibertsitatean egindako ikerketentzat diru-laguntzak emateagatik.
Gai librean aritzeko, bidali zure artikulua aldizkaria@elhuyar.eus helbidera
Hauek dira Gai librean atalean Idazteko arauak