Worl Wide Web

Web, é dicir, WWW é una aplicación de difusión e acceso á información, principal responsable do éxito e gran difusión que conseguiu Internet nos últimos cinco anos. De feito, son moitos os
usuarios que aínda confunden internet coa web, a rede que é a infraestrutura principal e una das súas aplicacións. Esta confusión non é de estrañar, con todo, porque a maioría dos usuarios de internet non coñecen ningunha outra aplicación na rede, mellor devandito, aínda que utilizan máis aplicacións, non se dan conta de que os ven”, xa que é o interfaz ou medio de uso de calquera aplicación web.

Neste artigo trataremos de analizar as principais características da aplicación web, empezando pola súa orixe, paira seguir describindo os diferentes compoñentes da aplicación e terminar explicando os recursos (protocolos e linguaxes) que deben utilizar quen queiran desenvolver as súas funcións.

Un pouco de historia

En 1989 presentouse no CERN (Centre Europée pour a Recherche Nucleare) a primeira proposta dunha aplicación paira obter e compartir información. Pódese dicir, por tanto, que a web naceu paira cumprir cunhas obrigacións moi concretas: Facilitar o acceso á información entre investigadores nos centros europeos de investigación. Posteriormente, como ocorre a miúdo, comprobouse que a solución que se empregou paira este uso concreto é tamén a solución adecuada a moitos outros problemas.

Aos 18 meses da presentación desta intención xa se realizou o primeiro prototipo e en febreiro de 1993 presentouse o xa obsoleto navegador Mosaic, neste caso si, realizado en EEUU, concretamente na NCSA (National Center for Supercomputing Applications). Este primeiro produto estableceu as bases sólidas do éxito posterior debido a dúas características principais: por unha banda, seguindo o costume de Internet, a interfaz distribuíuse de forma gratuíta e por outro, era de gran facilidade paira o usuario.

Calquera, fóra ou non experto informático, podía usalo eliminando con iso esa nube de misterio sobre a rede. Ante o éxito de Mosaic, o seu creador, Marc Andresseen, abandonou inmediatamente a NCSA e creou a súa propia empresa, Netscape, que ten como obxectivo desenvolver software paira a web. En 1995 Netscape aparece en bolsa e rompe as marcas de cotización, aínda que recoñece que non esperaba rendemento a curto prazo. Moitos crían que Netscape ía ser una nova Microsoft, a outra gran compañía que crearía un imperio. Con todo, hoxe en día Microsoft e Netscape están a loitar por impor o seu produto. De momento o usuario é o vencedor, daquela os futuros.

En 1994 os MIT (Massachussets Institute of Technologies) e o CERN europeo crearon a organización denominada World Wide Web Consortium paira crear estándares relacionados con Web. A súa páxina web está dispoñible en http://www.w3.org.

Clientes e servidores

Como calquera outra aplicación distribuída, a web divídese en dous partes: o servidor, é dicir, o que se executa en por si nunha máquina, e o cliente, o que se executa noutra máquina e á hora de recibir ordes alleas. Este último pode recibir diferentes nomes en función das aplicacións. Utilízase o browser en inglés, temos o navegador en castelán e o navegador en eúscaro..

Quen queira ampliar a información na rede, por tanto no mundo, necesita un servidor, é dicir, un computador, programas paira o servidor web (tamén hai programas de pago e gratuítos) e una conexión a internet con algún provedor. Todo iso, con todo, supón pór moito máis diñeiro do que normalmente se pode investir. Por tanto, é moito máis normal alugar una parte do seu servidor a quen dispón ou xestiona dita infraestrutura. Desta forma, cada un elabora a súa propia información no seu fogar, é dicir, no seu propio computador, e envíaa ao seu provedor paira a súa publicación. Trátase de pór esta formación en formato HTML que logo analizaremos de forma somera.

Doutra banda, quen queira informarse necesita un navegador no seu computador e, por suposto, una conexión a internet. Até agora non o dixemos, pero hai que ter en conta que no computador do servidor e do navegador, en ambos os casos, son necesarios protocolos TCP/IP.

Os requisitos do navegador son, por unha banda, contactar cos servidores que se atopan ao longo da rede paira captar a información contida na mesma e, por outro, presentar ao usuario os documentos recibidos na rede, axudarlle na procura e corrixilos. A cada documento web denomínaselle “páxina”. Non todas as páxinas pódense ver directamente, xa que moitas veces teñen algo máis que texto: imaxes, son, vídeo ou as tres á vez. Hai navegadores que son capaces de reflectir calquera tipo de información, pero normalmente pídeselle a outra aplicación, a un revisor externo ( external viewer ) ou a unha aplicación auxiliar que realice ese traballo.

Se non dispós deste monitor no teu computador non poderás acceder a esta información. Este é outro dos aspectos multimedia, que fai aínda máis fascinante a web. E é que a capacidade do navegador paira traballar con outras aplicacións tróuxonos moitas posibilidades: calquera cousa pódese utilizar coas webs. Por iso, xa se dixo que o usuario só ve web aínda que estea a utilizar moitas aplicacións. O último paso xigante foi a consideración da linguaxe interpretativa como una aplicación auxiliar, sobre todo a linguaxe Xava. Logo falaremos diso.

Direccións: URL

Paira recibir una páxina hai que definir tres conceptos: o servidor que ten a páxina, o ficheiro no que se atopa e como solicitala ao servidor.

E todo iso codificado nas direccións URL ( Universal Resource Locator ), concretamente nas tres partes que compoñen a mesma URL. Véxase na figura 1 un exemplo.

Se non se indica a terceira parte, sempre se presenta una folla especial como presentación. A segunda parte ten a súa propia sintaxe, correspondente ao nome de DNS ou Internet. En canto á forma de solicitalo, o navegador HTTP ( HiperTex Transfer Protocol ) é o protocolo de contacto co servidor web, pero —e aquí reside outra das claves da web— un navegador web pode tamén porse en contacto cos servidores doutras aplicacións. Isto fai posible o uso doutros recursos en internet (FTP, gopher, news...) antes da aparición da web. ) poder utilizar xunto coas webs e, con iso, que toda a información que existía anteriormente na rede estea a disposición de máis xente. Volvemos ver que o usuario utiliza diferentes aplicacións, aínda que, como dixemos anteriormente, só ve web. Na imaxe podemos ver exemplos de diferentes URL.

A verdade é que normalmente o navegador non utiliza todos os protocolos que aparecen nesa imaxe, porque sería demasiado complicado. A dificultade debe colocarse sempre no outro lado do servidor. Desta forma, entre o navegador e o servidor ponse outro medio que serve paira protocolo múltiple e que fai de servente de zarza. Isto chámase proxy. Normalmente colócase no propio computador do servidor ou noutra máquina directamente conectada con el. Cada proxy adoita ser intercalado con moitos servidores como web, ftp, gopher e news. Nalgúns casos todas estas aplicacións atópanse no propio computador do servidor, pero noutro non.

Normas paira falar: HTTP

A maioría dos documentos necesarios atópanse en formato HTML, polo que se utiliza o protocolo propio da web paira acceder, chamado HTTP ( HyperText Transfer Protocol ). O HTTP está en constante evolución. Na actualidade pódense utilizar diferentes versións e están a ser moi creadas, principalmente baixo o control da WWW Consortium. As características que se citan a continuación son as máis básicas e aínda que algunhas das matizacións poden variar en futuras versións, os conceptos permanecerán intactos.

É un protocolo moi sinxelo, como a maioría dos protocolos de aplicación. Divídese en dous partes: a parte das solicitudes que o navegador pode realizar ao servidor e a parte das respostas en sentido contrario. As novas versións conteñen dous tipos de solicitudes: simples e completas, ambas as escritas no código ASCII. Simple é a parte da URL que indica a palabra GET e o ficheiro. Por exemplo:

GET/público/colaboradores/itoiz.html

A resposta é a folla solicitada en bruto, o navegador debe saber como preparar a información recibida paira presentala ao usuario. Podemos probar este tipo de solicitudes directamente si na nosa máquina facemos de navegador coa aplicación telnet. Conéctache ao porto 80 ( nome do servidor telnet 80 ) e introduce a liña antes mencionada, pero cambia a localización do ficheiro porque o que che demos é inventado por nós.

Con todo, as peticións completas poden ser de varias liñas, pero sempre a última liña é pura. A primeira liña indica a orde (una das opcións é GET), a páxina e a versión do protocolo. As outras liñas seguen as normas RFC 822 do correo electrónico e poden modificarse segundo a orde. Deseñouse paira aplicacións orientadas a obxectos HTTP, polo que as ordes denomínanse “método”.

A resposta a peticións completas componse dunha liña de estados e talvez a información adxunta. A liña de estado pode ser o código OK (número 200) ou un código de erro. A información adoita ser a propia páxina web.

Normas de presentación: HTML

As páxinas web están en formato HTML ( HyperText Markup Language ). Dicir linguaxe ao HTML pode resultar confuso, xa que non executa nada en si mesmo e entrégase a linguaxe ao código que executa os algoritmos. É máis preciso, por tanto, dicir formato, xa que só indica como debe aparecer a información, como TeX e o resto de formatos. Por exemplo , pór B indícanos que o texto debe aparecer en negro e pondo B/ dicir que hai que anular a orde. Por tanto, o navegador deberá coñecer o significado destas marcas que aparecen no texto.

Deste xeito, a información almacénase (sen preocuparse de onde aparecerá): o navegador de cada máquina ou sistema saberá como presentar o texto en negro, saberá que conversión de formato debe realizar paira cumprir as ordes HTML, etc. Isto é moi importante xa que a páxina está na pantalla 1024 x 768 e en cor de 24 bits, por exemplo, na pantalla 640x480 e en cores de 8 bits.

Do mesmo xeito que HTTP, HTML está en continuo cambio. Cando Mosaic era o único navegador, HTML 1.0 era o estándar “de facto”, pero cando apareceron novos navegadores, debido á necesidade dun estándar oficial, xurdiu HTML 2.0. A partir de aí apareceron outras normas, como os oficiais recoñecidos por WWW Consortium e os creados por cada produtor. Normalmente baséanse nos oficiais e só se lles engade algunha novidade. Se esta innovación ten éxito no mercado, incluirase no seguinte estándar oficial. Isto favorece ao produtor, xa que o seu navegador utiliza esta característica antes que o resto. Os concursantes deberán investir tempo e diñeiro paira conseguilo.

Neste tempo sería demasiado longo describir detalladamente HTML, pero lector, cal é o seu aspecto “cru” e como se presentaría una páxina.

... e máis: accións. CGI e Xava

HTML 1.0 era unidireccional: o usuario podía recibir información do servidor pero non podía enviarlle nada. Coa incorporación das organizacións comerciais á rede, incrementouse a necesidade dunha dobre dirección. Por exemplo, hai empresas que, ademais de recibir pedidos, queren recibir o número do cartón de crédito do cliente. Por iso, comezaron a ofrecer a posibilidade de facelo en HTML 2.0. Máis aínda: O estándar CGI ( Common Gateway Interface ) permite executar programas no servidor se o usuario solicítao a través do seu navegador. Por exemplo, supoñamos que o servidor ten una base de datos moi interesante e que o usuario quere consultala.

Paira iso, acudirá á páxina do servidor onde atopará o formulario de preguntas, una vez cumprimentado, a súa navegador enviará ao servidor os datos das preguntas, como a clave de acceso a esta base de datos e as palabras crave de procura. Se o servidor acepta a operación, o navegador indicaralle que execute un programa de referencia na súa páxina. Estes programas chámanse widget ou script e como calquera outro documento indícanse cunha URL dentro do documento HTML.

Con todo, este traballo entre o navegador e o servidor non é suficiente nalgunhas aplicacións, sobre todo nas animacións. Paira iso creouse outra ferramenta: Linguaxe Xava. A idea é: O programa que executa as accións asociadas a unha páxina HTML a carga no navegador xunto coa páxina e execútaas el mesmo. Parece moi fácil, pero non é tan simple. A linguaxe que se executa en calquera computador non existe e ademais sería moi perigoso porque é a forma máis sinxela de introducir virus. Con todo, superando estas barreiras conseguiuse o obxectivo.

A linguaxe é Xava, tipo C++ e non dá problemas de seguridade. Os programas escritos en Xava son pequenos e denomínanse applets, en inglés, que significa aproximadamente “app pequena”. As applets se compilan e almacenan nun código tipo byte, o que garante que todos os applets teñen o mesmo aspecto, independentemente do autor ou do procedemento no que se crearon. Este código tipo byte é o que se accede desde HTML e execútase no computador do navegador. A súa execución require intérprete. Por tanto, os compoñentes do sistema Xava son tres (paira máis información, ver o café Xava puro de Luís Elizondo ou o futuro da informática? Artigo 107, maio 1996):

  1. Compilador de Xava paira código de byte que o programador Xava utilizará no seu sistema.
  2. Navegador que entende as applets.
  3. Intérprete do código de byte no computador do navegador.

Describimos aquí a web e os seus compoñentes, non moi en profundidade, é certo, pero si así o fixésemos, teriamos que escribir un volume e ademais paira publicalo, moitos detalles estarían obsoletos, así é a informática. Con todo, o que aquí explicamos seguirá sendo certo durante algúns anos. Seguramente non moito máis.

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila