Imatges en alta definició a alta velocitat

Imaz Amiano, Eneko

Elhuyar Zientziaren Komunikazioa

Afortunadament o per desgràcia, avui dia vivim en el món de la imatge: anuncis, televisió, càmeres de fotos i vídeo, imatges d'ordinador, càmeres de seguretat… imatges i càmeres per onsevulla. I, per descomptat, la importància de la imatge i la qualitat de la imatge van unides entre si, per la qual cosa cada vegada necessitem imatges de millor qualitat, per al que es necessiten programes que aportin una major qualitat i treballin més ràpid.
Imatges en alta definició a alta velocitat
01/02/2006 | Imaz Amiano, Eneko | Elhuyar Zientzia Komunikazioa
(Foto: ANDANA)

Quan es necessiten imatges en alta definició, hi ha dues opcions: usar bones cambres o tractar imatges menys bones per ordinador. No obstant això, encara que la cambra sigui molt bona, la qualitat de les imatges obtingudes pot no ser suficient.

La primera tendència de qui no treballa amb imatges, col·locada davant de l'ordinador, sol ser augmentar la foto, fer un zoom. Aquesta tècnica és molt limitada, pot augmentar una mica més aviat, però en augmentar dues vegades, per exemple, la qualitat i la resolució disminueixen dràsticament. Per això, és convenient utilitzar programes especials per a aconseguir bons resultats, tant en fotos com en vídeos.

Urinaris obligatoris

Les imatges de l'ordinador estan formades en realitat per cuadraditos anomenats píxels que creguin una matriu. Els píxels contenen informació sobre el color i intensitat d'aquesta zona de la imatge. Per tant, quants més píxels, més petits seran aquests i, per tant, més informació sobre la imatge, amb millor resolució. I com més gran sigui la resolució, més possibilitats de treballar i ampliar.

Quan augmentem una imatge només amb zoom en l'ordinador, els píxels augmenten però no s'afegeixen, la quantitat d'informació és la mateixa, però la superfície de la imatge és major. Això fa que la imatge es difumini o pixeli. És més adequat augmentar el nombre de píxels, però això sí, als nous píxels cal donar-los una nova i adequada informació. Si se'ls assigna la mateixa informació que els píxels preexistents, la imatge tornarà a difuminar.

Superresolución

Els mètodes que incorporen píxels i nova informació per a ells es denominen mètodes de superresolución. Són programes que reconstrueixen imatges en baixa definició i milloren la seva resolució, i s'utilitzen en imatges de satèl·lit, en el tractament d'imatges obtingudes a través de telescopis, microscopis, càmeres de seguretat o càmeres infraroges, en la recuperació de pel·lícules antigues, en la tecnologia digital, etc.

Es fa passar la imatge en una matriu de píxels. En cada quadrat es genera informació nova que s'utilitza per a augmentar la resolució de la imatge.
SENER

Els sistemes basats en càlculs matemàtics són els mètodes de superresolución més utilitzats. Aquests sistemes o mètodes realitzen càlculs probabilístics per a saber com integrar la nova informació dels píxels afegits i amb això crear una nova imatge.

Els mètodes de probabilitat més utilitzats són les anàlisis bayesianes. Els resultats són molt bons, però solen ser bastant lents: triguen 1 o 2 minuts a tractar el vídeo d'un segon. Un altre mètode relativament nou. És un sistema de superseparación basat en xarxes neuronals que treballa a 100 o 200 vegades més ràpid, gairebé en temps real.

No obstant això, tots els programes de superresolución, tant probabilístics com neuronals, divideixen el treball en dues fases. En la primera fase es creen nous píxels als quals se'ls assigna nova informació. Per a això necessiten obligatòriament fragments de vídeo o seqüències d'imatges fixes. En una segona fase, utilitzen aquesta informació per a reconstruir la imatge amb millor qualitat.

Xarxes neuronals

Limitat al mètode de les xarxes neuronals, en una primera fase, el sistema genera una nova matriu basada en la xarxa o matriu de píxels de la imatge de vídeo. Concretament, genera una matriu de 16 nous píxels per cada píxel original.

A continuació, utilitza el moviment dels objectes de les imatges per a atribuir informació als nous píxels. El moviment pot ser el desplaçament de l'objecte en si mateix, des del fotograma d'un vídeo al fotograma o bé en una seqüència fotogràfica. No obstant això, si l'objecte està parat, el sistema té un moviment tan petit com la vibració de la pròpia càmera.

Imatges ampliades d'un vaixell de passatgers sense tractar i tractades amb el nou mètode.
SENER

No obstant això, en moure la imatge, d'una banda passa pels nous píxels, generant informació per a aquests nous píxels. D'altra banda, el moviment crea nous angles entre càmera i objecte, que el sistema aprofita per a obtenir nova informació: millora la definició de vores, colors, tons, etc. gràcies a nous angles o punts de vista.

Aquesta primera fase la realitza el nou programa basat en xarxes neuronals mitjançant mètodes estàndard.

En una segona fase, el programa unifica tota la informació i refà la imatge amb millor resolució. Fins ara els sistemes usaven estimacions matemàtiques per a unificar la informació i calcular la imatge més probable sobre la base d'ella, mentre que les xarxes neuronals no necessiten càlcul, ja que estan preformadas.

Els éssers vius com a exemple

Els programes que treballen amb xarxes neuronals són sistemes basats en la intel·ligència artificial. Les neurones d'aquestes xarxes són simples simulacions de les neurones dels éssers vius, però totes elles agrupades en una xarxa poden generar models informàtics capaços de fer tasques de gran complexitat.

La principal característica d'aquesta mena de sistemes és la seva capacitat d'aprenentatge i, en aquest cas, la seva formació en el tractament d'imatges.

(Foto: SENER)

La formació és molt similar a la que fem les persones per a moltes coses. En primer lloc, s'introdueix al sistema una imatge de bona qualitat o resolució, seguida de diversos exemples en baixa resolució d'una mateixa imatge. Amb elles, es fa destorbar al programa una vegada i una altra de cada imatge deficient, és a dir, se li fa avançar de la dolenta a la bona.

El programa ajusta diversos paràmetres fins a aconseguir l'objectiu marcat i memoritza aquests ajustos. Així, en trobar uns paràmetres concrets, sap què i quant ha de canviar.

Es necessiten unes 6 hores per a una correcta formació. Ha après com tractar imatges en baixa definició i, d'ara endavant, sap què i com tractar-les en cada cas. Sempre seguirà els mateixos passos: situarà la imatge a tractar en la nova matriu de píxels i, gràcies al moviment, dotarà als nous píxels de nova informació mitjançant les tècniques habituals, i posteriorment la xarxa neuronal unificarà tota la informació i reconstruirà la imatge, basada en les formes d'actuació i els ajustos de paràmetres que té memoritzats.

El sistema basat en xarxes neuronals no requereix càlcul matemàtic, per la qual cosa pot treballar en un cop. Aquí guanya temps.

Aquest nou sistema de superresolución, desenvolupat en l'empresa SENER de Getxo, ja està en el mercat. No obstant això, no creiem que sigui fàcil d'aconseguir. I és que, a pesar que en els exemples apareixen un cotxe i un ferri, sobretot s'han dirigit al mercat de tractament d'imatges gravades per satèl·lit, segons ens ha informat el responsable del projecte, Carlos Miravet.

Formació
Imaz Amiano, Eneko
Serveis
217
2006
Serveis
041
Física; Química; Matemàtiques
Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila