Worl Wide Web

Web, c'est-à-dire, WWW est une application de diffusion et d'accès à l'information, principale responsable du succès et de la grande diffusion qu'a obtenu Internet au cours des cinq dernières années. En fait, de nombreux utilisateurs confondent encore Internet avec le web, le réseau qui est l'infrastructure principale et l'une de ses applications. Cette confusion n'est pas surprenante, cependant, parce que la plupart des utilisateurs d'Internet ne connaissent aucune autre application sur le réseau, plutôt, bien qu'ils utilisent plus d'applications, ils ne se rendent pas compte “les voir”, car il est l'interface ou le moyen d'utilisation de toute application Web.

Dans cet article, nous allons essayer d'analyser les principales caractéristiques de l'application web, à commencer par son origine, pour continuer à décrire les différents composants de l'application et terminer en expliquant les ressources (protocoles et langages) que doivent utiliser ceux qui veulent développer leurs fonctions.

Un peu d'histoire

En 1989, la première proposition d'une application pour obtenir et partager des informations a été présentée au CERN (Centre Europée pour la Recherche Nucléare). On peut donc dire que le web est né pour remplir des obligations très concrètes: Faciliter l'accès à l'information entre chercheurs dans les centres européens de recherche. Par la suite, comme souvent, il a été prouvé que la solution utilisée pour cet usage concret est aussi la bonne solution à de nombreux autres problèmes.

A 18 mois de la présentation de cette intention avait déjà été faite le premier prototype et en Février 1993, il a présenté le navigateur déjà obsolète Mosaic, dans ce cas, oui, fait aux États-Unis, plus précisément dans la NCSA (National Center for Supercomputing Applications). Ce premier produit a établi les bases solides du succès ultérieur en raison de deux caractéristiques principales: d'une part, suivant la coutume d'Internet, l'interface a été distribuée gratuitement et de l'autre, il était très facile pour l'utilisateur.

N'importe qui, en dehors de l'informatique ou non, pouvait l'utiliser en éliminant ainsi ce nuage de mystère sur le réseau. Face au succès de Mosaic, son créateur, Marc Andresseen, a immédiatement quitté la NCSA et a créé sa propre entreprise, Netscape, qui vise à développer des logiciels pour le web. En 1995, Netscape apparaît en bourse et casse les records de cotisation, tout en reconnaissant qu'il ne s'attendait pas à des performances à court terme. Beaucoup croyaient que Netscape allait être une nouvelle Microsoft, l'autre grande compagnie qui créerait un empire. Cependant, aujourd'hui, Microsoft et Netscape luttent pour imposer leur produit. Pour l'instant l'utilisateur est le vainqueur, puis les futurs.

En 1994, les MIT (Massachusetts Institute of Technologies) et le CERN européen ont créé l'organisation appelée World Wide Web Consortium pour créer des normes relatives au Web. Son site est disponible sur http://www.w3.org.

Clients et serveurs

Comme toute autre application distribuée, le web est divisé en deux parties: le serveur, c'est-à-dire celui qui s'exécute lui-même sur une machine, et le client, celui qui fonctionne sur une autre machine et au moment de recevoir des commandes étrangères. Ce dernier peut recevoir différents noms en fonction des applications. Le navigateur est utilisé en anglais, nous avons le navigateur en espagnol et le navigateur en basque.

Qui veut étendre l'information sur le réseau, donc dans le monde, a besoin d'un serveur, c'est-à-dire un ordinateur, des programmes pour le serveur web (il y a aussi des programmes payants et gratuits) et une connexion internet avec un fournisseur. Tout cela, cependant, suppose de mettre beaucoup plus d'argent que vous pouvez normalement investir. Il est donc beaucoup plus normal de louer une partie de votre serveur à qui vous disposez ou gérez cette infrastructure. Ainsi, chacun élabore ses propres informations à la maison, c'est-à-dire sur son propre ordinateur, et l'envoie à son fournisseur pour publication. Il s'agit de mettre cette formation au format HTML que nous allons ensuite analyser de manière sommaire.

D'autre part, celui qui veut s'informer a besoin d'un navigateur sur son ordinateur et, bien sûr, d'une connexion internet. Jusqu'à présent, nous ne l'avons pas dit, mais il faut noter que sur l'ordinateur du serveur et du navigateur, dans les deux cas, des protocoles TCP/IP sont nécessaires.

Les exigences du navigateur sont, d'une part, de contacter les serveurs qui se trouvent le long du réseau pour capter les informations qu'il contient et, d'autre part, présenter à l'utilisateur les documents reçus sur le réseau, vous aider à la recherche et les corriger. Chaque document web est appelé “page”. Toutes les pages ne sont pas visibles directement, car elles ont souvent plus que du texte : images, son, vidéo ou les trois à la fois. Il existe des navigateurs capables de refléter tout type d'information, mais il est généralement demandé à une autre application, à un réviseur externe (viewer externe) ou à une application auxiliaire qui effectue ce travail.

Si vous n'avez pas ce moniteur sur votre ordinateur, vous ne pourrez pas accéder à ces informations. C'est un autre aspect multimédia, qui rend le web encore plus fascinant. Et c'est que la capacité du navigateur à travailler avec d'autres applications nous a apporté de nombreuses possibilités: tout peut être utilisé avec les sites Web. C'est pourquoi, il a déjà été dit que l'utilisateur ne voit que le web même si elle utilise de nombreuses applications. Le dernier pas géant a été la considération du langage interprétatif comme une application auxiliaire, en particulier le langage Java. Puis nous en parlerons.

Adresses: URL

Pour recevoir une page, il faut définir trois concepts : le serveur qui a la page, le fichier dans lequel elle se trouve et comment la demander au serveur.

Et tout cela codé dans les URL ( Universal Resource Locator ), concrètement dans les trois parties qui composent la même URL. Voir dans la figure 1 un exemple.

Si la troisième partie n'est pas indiquée, une feuille spéciale est toujours présentée comme présentation. La deuxième partie a sa propre syntaxe, correspondant au nom de DNS ou Internet. En ce qui concerne la façon de le demander, le navigateur HTTP ( HiperTex Transfer Protocol ) est le protocole de contact avec le serveur web, mais — et ici réside une autre clé du web — un navigateur web peut également contacter les serveurs d'autres applications. Cela rend possible l'utilisation d'autres ressources sur internet (FTP, gopher, news...) avant l'apparition du web. ) être en mesure d'utiliser avec les sites et, par conséquent, que toutes les informations qui existaient précédemment sur le réseau soient à la disposition de plus de gens. Nous revoyons que l'utilisateur utilise différentes applications, bien que, comme nous l'avons dit plus haut, il ne voit web. Dans l'image, nous pouvons voir des exemples de différentes URL.

La vérité est que normalement le navigateur n'utilise pas tous les protocoles qui apparaissent sur cette image, car il serait trop compliqué. La difficulté doit toujours être placée de l'autre côté du serveur. De cette façon, entre le navigateur et le serveur, il met un autre moyen qui sert à protocole multiple et qui fait de serviteur de Zarza. Ceci est appelé proxy. Il est généralement placé sur l'ordinateur du serveur lui-même ou sur une autre machine directement connectée. Chaque proxy est généralement intercalé avec de nombreux serveurs tels que web, ftp, gopher et news. Dans certains cas, toutes ces applications se trouvent sur le propre ordinateur du serveur, mais dans d'autres non.

Règles pour parler: HTTP

La plupart des documents nécessaires sont au format HTML, de sorte que vous utilisez le protocole web propre à accéder, appelé HTTP ( HyperText Transfer Protocol ). Le HTTP est en constante évolution. Actuellement, différentes versions peuvent être utilisées et sont très créées, principalement sous le contrôle du WWW Consortium. Les caractéristiques citées ci-dessous sont les plus basiques et bien que certaines des nuances peuvent varier dans les futures versions, les concepts resteront intacts.

C'est un protocole très simple, comme la plupart des protocoles d'application. Il est divisé en deux parties: la partie des demandes que le navigateur peut effectuer au serveur et la partie des réponses dans le sens inverse. Les nouvelles versions contiennent deux types de requêtes : simples et complètes, toutes deux écrites dans le code ASCII. Simple est la partie de l'URL qui indique le mot GET et le fichier. Par exemple :

GET/public/contributeurs/itoiz.html

La réponse est la feuille brute demandée, le navigateur doit savoir comment préparer les informations reçues pour la présenter à l'utilisateur. Nous pouvons tester ce type de demandes directement si dans notre machine nous faisons du navigateur avec l'application telnet. Connectez-vous au port 80 ( nom du serveur telnet 80 ) et entrez la ligne mentionnée ci-dessus, mais changez l'emplacement du fichier parce que ce que nous vous avons donné est inventé par nous.

Cependant, les requêtes complètes peuvent être de plusieurs lignes, mais toujours la dernière ligne est pure. La première ligne indique la commande (une des options est GET), la page et la version du protocole. Les autres lignes suivent les normes RFC 822 de l'e-mail et peuvent être modifiées selon la commande. Conçu pour les applications orientées objet HTTP, les commandes sont donc appelées « méthode ».

La réponse aux demandes complètes se compose d'une ligne d'états et peut-être les informations jointes. La ligne d'état peut être le code OK (numéro 200) ou un code d'erreur. L'information est généralement le site lui-même.

Règles de présentation: HTML

Les pages web sont au format HTML ( HyperText Markup Language ). Dire le langage au HTML peut être déroutant, car il n'exécute rien en lui-même et le langage est livré au code exécutant les algorithmes. Il est donc plus précis de dire le format, car il indique simplement comment les informations doivent apparaître, comme TeX et les autres formats. Par exemple, mettre B nous indique que le texte doit apparaître en noir et mettre B/ on nous dit qu'il faut annuler la commande. Par conséquent, le navigateur doit connaître la signification de ces marques qui apparaissent dans le texte.

Ainsi, les informations sont stockées (sans s'inquiéter de l'endroit où elles apparaissent) : le navigateur de chaque machine ou système saura comment présenter le texte en noir, saura quelle conversion de format vous devez effectuer pour exécuter les commandes HTML, etc. Ceci est très important car la page est sur l'écran 1024 x 768 et en couleur 24 bits, par exemple sur l'écran 640x480 et dans les couleurs 8 bits.

Comme HTTP, HTML est en constante évolution. Lorsque Mosaic était le seul navigateur, HTML 1.0 était la norme “de facto”, mais quand de nouveaux navigateurs sont apparus, en raison de la nécessité d'une norme officielle, il a émergé HTML 2.0. D'autres normes sont apparues à partir de là, comme les officiels reconnus par WWW Consortium et ceux créés par chaque producteur. Ils sont généralement basés sur les officiers et ne sont ajoutés qu'une nouveauté. Si cette innovation réussit sur le marché, elle sera incluse dans la norme officielle suivante. Cela favorise le producteur, car votre navigateur utilise cette fonctionnalité avant le reste. Les candidats devront investir du temps et de l'argent pour l'obtenir.

À ce moment-là il serait trop long de décrire en détail HTML, mais lecteur, quel est son aspect « brut » et comment une page serait présentée.

... et plus: actions. CGI et Java

HTML 1.0 était unidirectionnel : l'utilisateur pouvait recevoir des informations du serveur mais ne pouvait rien lui envoyer. Avec l'incorporation des organisations commerciales au réseau, le besoin d'une double direction a augmenté. Par exemple, il y a des entreprises qui, en plus de recevoir des commandes, veulent recevoir le numéro de la carte de crédit du client. Par conséquent, ils ont commencé à offrir la possibilité de le faire en HTML 2.0. Plus encore : La norme CGI ( Common Gateway Interface ) permet d'exécuter des programmes sur le serveur si l'utilisateur le demande via son navigateur. Par exemple, supposons que le serveur a une base de données très intéressante et que l'utilisateur veut la consulter.

Pour ce faire, vous accédez à la page du serveur où vous trouverez le formulaire de questions, une fois rempli, votre navigateur enverra au serveur les données des questions, telles que la clé d'accès à cette base de données et les mots clés de recherche. Si le serveur accepte l'opération, le navigateur vous indiquera d'exécuter un programme de référence sur votre page. Ces programmes sont appelés widget ou script et comme tout autre document, ils sont indiqués par une URL dans le document HTML.

Cependant, ce travail entre le navigateur et le serveur ne suffit pas dans certaines applications, en particulier dans les animations. Pour cela, un autre outil a été créé: Langage Java. L'idée est: Le programme qui exécute les actions associées à une page HTML les charge dans le navigateur avec la page et les exécute lui-même. Il semble très facile, mais pas si simple. Le langage qui fonctionne sur n'importe quel ordinateur n'existe pas et serait également très dangereux car il est le moyen le plus simple d'introduire des virus. Cependant, en surmontant ces barrières, l'objectif a été atteint.

Le langage est Java, type C++ et ne donne pas de problèmes de sécurité. Les programmes écrits en Java sont petits et sont appelés applets, en anglais, qui signifie approximativement “petite app”. Les applets sont compilées et stockées dans un code type octet, ce qui garantit que toutes les applets ont le même aspect, indépendamment de l'auteur ou de la procédure dans laquelle elles ont été créées. Ce code type byte est accessible depuis HTML et fonctionne sur l'ordinateur du navigateur. Son exécution nécessite interprète. Par conséquent, les composants du système Java sont trois (pour plus d'informations, voir le café Java pur de Luis Elizondo ou l'avenir de l'informatique? Article 107, mai 1996):

  1. Compilateur Java pour byte code que le programmeur Java utilisera sur votre système.
  2. Navigateur qui comprend les applets.
  3. Interprète du code octet sur l'ordinateur du navigateur.

Nous avons décrit ici le web et ses composants, pas très en profondeur, c'est vrai, mais si nous le faisons, nous devrions écrire un volume et de plus pour le publier, beaucoup de détails seraient obsolètes, c'est l'informatique. Cependant, ce que nous avons expliqué ici restera vrai pendant quelques années. Sûrement pas beaucoup plus.

Babesleak
Eusko Jaurlaritzako Industria, Merkataritza eta Turismo Saila