Utiliser toutes les informations et les options Internet n'est pas toujours facile. D'une part, il y a une énorme quantité d'informations, et pour nous plonger sans nous noyer dans cette inondation d'informations, nous avons besoin de chercheurs comme Google ou Elebila. Mais avec eux, il n'est souvent pas facile de trouver ce dont nous avons besoin. Par exemple, quand il y a beaucoup de résultats, il n'est pas facile de distinguer entre les significations possibles du mot que nous avons donné pour rechercher, quelles sont les pages sur la signification que nous voulons (en recherchant le mot "Texas", par exemple, des pages sur l'état des États-Unis, le groupe musical, le livre ou beaucoup d'autres choses à la fois). Ou plusieurs fois il n'y a pas de bonne manière de différencier entre bonne et mauvaise information, car la démonstration par les chercheurs dans les premières positions n'assure pas toujours la qualité. D'autre part, dans de nombreux cas, il n'est pas possible d'unifier toutes sortes de services, et quand nous voulons acheter quelque chose, par exemple, pour comparer les prix et les options, nous n'avons qu'à regarder les pages web de différents magasins.
Tous ces problèmes proviennent de la conception initiale du réseau. Le web est, en définitive, une collection d'hypertextes situés dans l'infrastructure Internet, c'est-à-dire une collection de documents qui sont référencés entre eux, et pour coder l'hypertexte, le format HTML créé par Berners-Lee lui-même est utilisé. Les caractéristiques et les limites de ce format sont la cause de tous les problèmes.
HTML ou HyperText Markup Language est un langage de balisage de texte qui explique comment décrire un texte ou ses parties. En langage HTML, ce libellé descriptif est réalisé par des balises qui sont insérées entre les symboles dans le texte lui-même. Par exemple, en HTML pour indiquer qu'une partie de texte est un titre de premier degré, on utilise la balise h1 ( h1 Titre de premier degré /h1 ) et pour écrire en italique la balise em ( em texte de italique /em ). Il existe une multitude d'étiquettes de ce type pour les liens, les images, etc. Les navigateurs interprètent cette numérotation et affichent à l'utilisateur la page d'une manière appropriée.
Mais la plupart des balises HTML sont pour décrire la structure et l'apparence du texte, afin qu'un être humain puisse voir et comprendre le texte correctement. Ils ne sont pas conçus pour améliorer ou faciliter le traitement automatique des machines. Et les moteurs de recherche et d'autres outils Internet ne sont que des machines. Ce n'est qu'avec les balises HTML que vous n'avez pas suffisamment d'informations pour bien travailler et que vous ne pouvez pas comprendre le texte comme nous le faisons. Ainsi, s'il s'agit uniquement de texte et de balises HTML, un chercheur ne peut pas savoir si une page dans laquelle apparaît le mot "Java" se réfère à l'île ou au langage de programmation, ou si, sur une page qui parle d'un produit, les gens parlent bien ou mal à son sujet, ou qu'une page est d'une boutique en ligne vendant un certain produit...
Le créateur lui-même du World Wide Web est à la recherche d'une solution. En fait, le web sémantique est l'une des lignes directrices les plus récemment travaillées par l'organisation internationale World Wide Web Consortium dirigée par Tim Berners-Lee: un projet qui vise à corriger les erreurs de conception initiale.
L'étiquetage du format HTML sert à décrire les documents et leurs relations. Le site sémantique décrit des objets, des personnes, etc. et leurs relations. Au lieu que les étiquettes reflètent la forme et la structure de la page, la signification des éléments de la feuille est étiquetée. Sur le web sémantique, il pourrait y avoir des étiquettes pour, par exemple, la déclaration et la description de groupes musicaux, d'autres pour la déclaration et la description de personnes, d'autres pour la description que certaines personnes forment un groupe musical et ainsi de suite avec toutes choses.
Ainsi, les chercheurs pourraient différencier des pages qui contiennent le mot "Scorpions" ce qui correspond au groupe musical et quels animaux, et montrer les résultats groupés sur la base de ces significations possibles. Ou créer des moteurs de recherche spécialisés dans les groupes musicaux. Ou bien on pourrait détecter avec une relative facilité que le même produit est vendu dans différents magasins en ligne et construire des services qui exposent toutes les options de prix ensemble. Ou, en détectant les événements théâtraux et leur localisation, nous pourrions compléter automatiquement un calendrier de toutes les représentations théâtrales d'un pays. Ou par l'étiquetage sémantique des scores attribués par les utilisateurs à une page Web ou à un produit, les moteurs de recherche ou les magasins pourraient également effectuer des classements par score. Et le web sémantique aurait des milliers d'applications de ce genre que nous ne pouvons pas encore imaginer.
Par conséquent, le web sémantique serait un réseau parallèle au réseau HTML codé pour les personnes, une base de connaissance compréhensible par les machines, codée dans des formats expressifs de sémantique. En plus du web en langage naturel, nous aurions un autre texte structuré. Cette représentation de la connaissance pourrait être comprise par les machines, traitée efficacement, déduite de la nouvelle connaissance...
Il ne fait aucun doute que le web sémantique peut supposer un grand changement sur Internet. Mais comment se fait-il pour réaliser le pouvoir ? Quels sont les outils nécessaires ? Et qui avons-nous ?
Il suivra...