Web semantikoa: Interneten benetako ahala iristeko dago oraindik

Leturia Azkarate, Igor

Informatikaria eta ikertzailea

Elhuyar Hizkuntza eta Teknologia

1990ean, Sir Tim Berners-Lee CERNeko ikertzaileak World Wide Web-a asmatu zuen, hipertestuaren kontzeptua eta Interneteko TCP/IP eta DNS protokoloak konbinatuz. Asmakizun hark gu guztion bizitza eta mundu osoa aldatu zituen. Hala ere, aldaketa hori ez da ezer izango Berners-Lee azkenaldian lantzen ari den ideia berria, web semantikoa alegia, gauzatuz gero sortuko denaren aldean.
web semantikoa
2009/05/01 | Leturia Azkarate, Igor | Informatikaria eta ikertzailea

Interneten informazio eta aukera guztiak erabiltzea ez da beti erraza. Batetik, informazio-kantitate ikaragarria dago, eta, informazio-uholde horretan ito gabe murgiltzeko, ezinbestekoak ditugu bilatzaileak, hala nola Google edo Elebila. Baina, horiekin ere, sarritan ez da erraza behar duguna aurkitzea. Esate baterako, emaitza asko daudenean, ez da erraza bereizten, bilatzeko eman diogun hitzaren esanahi posibleetatik, guk nahi dugun adierari buruzko orriak zein diren ("Texas" hitza bilatzean, adibidez, AEBko estatuari, musika-taldeari, liburuari edo beste gauza askori buruzko orriak, denak batera, agertuko dira). Edo maiz ez dago modu onik informazio ona ren eta txarra ren artean bereizteko, bilatzaileek lehenengo posizioetan erakusteak ez baitu beti kalitatea ziurtatzen. Bestetik, mota bateko zerbitzu guztiak bateratzeko modurik ez dago kasu askotan, eta zerbait erosi nahi dugunean, adibidez, prezioak eta aukerak konparatzeko, hainbat dendaren webguneetan begiratu beste aukerarik ez dugu.

Arazoen iturria, HTML formatua

Arazo horiek guztiak amaraunaren hasierako diseinutik beretik datoz. Weba, finean, Interneten azpiegituran kokatutako hipertestu-bilduma bat besterik ez da, hau da, elkarri erreferentzia egiten dioten dokumentuen bilduma bat, eta, hipertestua kodetzeko, Berners-Leek berak sortutako HTML formatua erabiltzen da. Bada, formatu horren ezaugarriak eta mugak dira arazo guztien kausa.

HTML edo HyperText Markup Language testu-markaketarako lengoaia bat da, alegia, testu bat edo haren zatiak nola deskribatu azaltzen duen konbentzio bat. HTML lengoaian, deskribapen-markatze hori testuan bertan ikurren artean sartzen diren etiketen bidez egiten da. Adibidez, HTMLn, testu-zati bat lehen mailako izenburua dela adierazteko, h1 etiketa erabiltzen da ( h1 Lehen mailako izenburua /h1 ), eta, letra etzanez idazteko, em etiketa ( em kurtsibazko testua /em ). Horrelako beste etiketa mordoa daude, estekentzat, irudientzat eta abarrentzat. Nabigatzaileek markatze hori interpretatzen dute, eta erabiltzaileari orria modu egoki batean erakusten diote.

Pertsonentzat kodetzen den HTML sarearekin batera existituko litzatekeen sare paralelo bat da web semantikoa, makinek ulertzeko moduko ezagutza-base bat. Horri esker, informazioa modu eraginkorrean tratatu eta gurutzatu ahal izango da. Web semantikoak adimena eransten dio Internet-sareari.
123RF

Baina HTMLko etiketa gehienak testuaren egitura eta itxura deskribatzeko dira, gizaki batek testua modu egokian ikusi eta ulertu ahal izateko. Ez daude pentsatuta makinen tratamendu automatikoa hobetu edo errazteko. Eta bilatzaileak eta Interneteko beste tresnak makinak besterik ez dira. HTML etiketekin soilik ez dute informazio nahikorik ongi lan egiteko, eta testua bera ezin dute ulertu pertsonok egiten dugun bezala. Hala, testua eta HTML etiketak soilik izanik, bilatzaile batek ezin du jakin "Java" hitza agertzen den orri bat uharteari edo programazio-lengoaiari buruzkoa den, edo, produktu bati buruz ari den orri batean, jendeak ongi edo gaizki hitz egiten duen hari buruz, edo orri bat produktu jakin bat saltzen duen on line denda batena dela...

Web semantikoak du konponbidea

World Wide Webaren sortzailea bera ari da konponbidea bilatu nahian. Hain zuzen ere, web semantikoarena da Tim Berners-Leek zuzendutako World Wide Web Consortium nazioarteko erakundea azkenaldian gehien lantzen ari den gidalerroetako bat: hasierako diseinu haren akatsak zuzendu nahi dituen egitasmoa.

HTML formatuaren etiketatzeak dokumentuak eta haien arteko loturak deskribatzeko balio du. Web semantikoan, aldiz, objektuak, pertsonak eta horrelakoak, eta haien arteko erlazioak deskribatzen dira. Etiketek orriaren itxura eta egitura azaldu beharrean, orriko elementuen esanahia etiketatzen da. Web semantikoan etiketa jakin batzuk leudeke, adibidez, musika-taldeak deklaratu eta deskribatzeko, beste batzuk pertsonak deklaratu eta deskribatzeko, beste batzuk pertsona batzuek musika talde bat osatzen dutela deskribatzeko, eta horrela gauza guztiekin.

Hala, bilatzaileek ezberdindu ahal izango lukete "Scorpions" hitza duten orrietatik zein diren musika-taldeari dagozkionak eta zein animaliari, eta emaitzak esanahi posible ezberdin horien arabera taldekatuta erakutsi. Edo musika-taldeetan espezializatutako bilatzaileak sortu ahal izango lirateke. Edo on line denda ezberdinetan produktu bera saltzen dela nahiko erraz detektatu ahal izango litzateke, eta prezio-aukera denak batera erakutsiko lituzketen zerbitzuak eraiki. Edo, antzerki-ekitaldiak eta non diren detektatuta, herrialde bateko antzerki-emanaldi guztien egutegi bat automatikoki osatu ahal izango genuke. Edo erabiltzaileek web orri edo produktu bati emandako puntuazioak semantikoki etiketatuta, bilatzaileek edo dendek puntuazioaren araberako rankingak ere egin ahal izango lituzkete. Eta horrelako beste milaka eta milaka aplikazio izango lituzke web semantikoak, oraindik imajinatu ere egin ezin ditugunak.

Beraz, web semantikoa izango litzateke pertsonentzat kodetzen den HTML sarearekin batera existituko litzatekeen sare paralelo bat, makinek ulertzeko moduko ezagutza-base bat, semantika adierazteko formatuetan kodetua. Lengoaia naturaleko webaz gain, testu egituratuko beste bat izango genuke. Ezagutzaren errepresentazio hori makinek ulertu ahal izango lukete, modu eraginkorrean tratatu, ezagutza berria inferitu...

Zalantzarik ez dago web semantikoak aldaketa handia ekar dezakeela Internetera. Baina nola egiten da ahala errealitate bihurtzeko? Zer tresna behar dira? Eta zein dauzkagu?

Jarraituko du...

Leturia Azkarate, Igor
2
253
2009
5
020
Internet
Mundu digitala
30
Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila