Utilizar toda la información y las opciones de Internet no siempre es fácil. Por un lado, hay una enorme cantidad de información, y para sumergirnos sin ahogarnos en esta inundación de información, necesitamos buscadores como Google o Elebila. Pero con ellos, muchas veces no es fácil encontrar lo que necesitamos. Por ejemplo, cuando hay muchos resultados, no es fácil distinguir entre los posibles significados de la palabra que hemos dado para buscar, cuáles son las páginas sobre el significado que queremos (al buscar la palabra "Texas" aparecerán, por ejemplo, páginas sobre el estado de EE.UU., el grupo musical, el libro u otras muchas cosas a la vez). O muchas veces no hay buena manera de diferenciar entre buena y mala información, ya que la demostración por parte de los buscadores en las primeras posiciones no siempre asegura la calidad. Por otro lado, en muchos casos no es posible unificar todo tipo de servicios, y cuando queremos comprar algo, por ejemplo, para comparar precios y opciones, no tenemos más que mirar en las páginas web de diferentes tiendas.
Todos estos problemas provienen del diseño inicial de la red. La web es, en definitiva, una colección de hipertextos situados en la infraestructura de Internet, es decir, una colección de documentos que se hacen referencia entre sí, y para codificar el hipertexto se utiliza el formato HTML creado por el propio Berners-Lee. Las características y limitaciones de este formato son la causa de todos los problemas.
HTML o HyperText Markup Language es un lenguaje de marcado de texto que explica cómo describir un texto o sus partes. En lenguaje HTML, este marcado descriptivo se realiza mediante etiquetas que se insertan entre los símbolos en el propio texto. Por ejemplo, en HTML para indicar que una parte de texto es un título de primer grado se utiliza la etiqueta h1 ( h1 Título de primer grado /h1 ) y para escribir en cursiva la etiqueta em ( em texto de cursiva /em ). Existen multitud de etiquetas de este tipo para enlaces, imágenes, etc. Los navegadores interpretan esta marcación y muestran al usuario la página de una manera adecuada.
Pero la mayoría de las etiquetas de HTML son para describir la estructura y la apariencia del texto, para que un ser humano pueda ver y comprender el texto de forma adecuada. No están pensados para mejorar o facilitar el tratamiento automático de las máquinas. Y los buscadores y otras herramientas de Internet son sólo máquinas. Sólo con las etiquetas HTML no disponen de información suficiente para trabajar bien y no pueden entender el texto como lo hacemos las personas. Así, al tratarse únicamente de texto y etiquetas HTML, un buscador no puede saber si una página en la que aparece la palabra "Java" se refiere a la isla o al lenguaje de programación, o si, en una página que habla de un producto, la gente habla bien o mal sobre él, o que una página es de una tienda online que vende un determinado producto...
El propio creador de la World Wide Web está buscando una solución. De hecho, la web semántica es una de las directrices más trabajadas últimamente por la organización internacional World Wide Web Consortium dirigida por Tim Berners-Lee: un proyecto que pretende corregir los errores del diseño inicial.
El etiquetado del formato HTML sirve para describir los documentos y sus relaciones. En la web semántica se describen objetos, personas, etc. y sus relaciones. En lugar de que las etiquetas reflejen la forma y estructura de la página, se etiqueta el significado de los elementos de la hoja. En la web semántica podrían existir etiquetas para, por ejemplo, la declaración y descripción de grupos musicales, otras para la declaración y descripción de personas, otras para la descripción de que unas personas forman un grupo musical y así con todas las cosas.
De este modo, los buscadores podrían diferenciar de las páginas que contienen la palabra "Scorpions" cuáles son las correspondientes al grupo musical y qué animales, y mostrar los resultados agrupados en base a estos significados posibles. O crear buscadores especializados en grupos musicales. O bien se podría detectar con relativa facilidad que se vende el mismo producto en diferentes tiendas online y construir servicios que expusieran todas las opciones de precios conjuntamente. O, al detectar los eventos teatrales y su localización, podríamos completar automáticamente un calendario de todas las representaciones teatrales de un país. O mediante el etiquetado semántico de las puntuaciones otorgadas por los usuarios a una página web o a un producto, los buscadores o tiendas también podrían realizar rankings por puntuación. Y la web semántica tendría miles de aplicaciones de este tipo que todavía no podemos imaginar.
Por tanto, la web semántica sería una red paralela a la red HTML codificada para las personas, una base de conocimiento entendible por las máquinas, codificada en formatos expresivos de semántica. Además de la web en lenguaje natural, tendríamos otro texto estructurado. Esta representación del conocimiento podría ser entendida por las máquinas, tratada eficazmente, inferida del nuevo conocimiento...
No cabe duda de que la web semántica puede suponer un gran cambio en Internet. Pero, ¿cómo se hace para hacer realidad el poder? ¿Qué herramientas son necesarias? ¿Y cuáles tenemos?
Seguirá...