Uno de los temas estrella de los últimos años es la personalization, es decir, mostrar a cada usuario de la web su contenido en función de sus gustos, ideas y aficiones. Esto ya se aplica en muchos lugares. Por ejemplo, varios buscadores ofrecen la posibilidad de mostrar resultados personalizados a partir de nuestros históricos de navegación: búsquedas realizadas previamente, en cuál de los resultados de esas búsquedas hemos pulsado, qué contenido hemos seleccionado para compartirlo en redes sociales, etc. Los sitios web y los servicios para escuchar música, a partir de las canciones que hemos escuchado nosotros o nuestros amigos, nos sugieren nuevas canciones que nos gustan. Las tiendas on line tratan de igual manera, basándose en nuestras compras anteriores o atendiendo a las compras de otros clientes que han adquirido las mismas que las adquiridas por nosotros. También algunos medios de comunicación han empezado a mostrar una portada diferente a cada usuario, utilizando la información de los artículos que hemos leído anteriormente.
En principio, aunque la personalización parece una buena idea, también hay quien cuestiona su idoneidad. En una conferencia TED realmente recomendable, Eli Parise advierte de que cada uno de ellos corre el peligro de quedarse tranquilo en su propia burbuja, de recibir únicamente información limitada y parcial de todo lo que hay en el mundo. Antes los medios de comunicación y las cadenas de televisión filtraban la información para nosotros, y si sólo leíamos y veíamos un tipo de periódicos y cadenas de televisión, sólo recibíamos información unilateral. Internet nos abrió la vista, pero ahora los filtros de personalización pueden dañar de nuevo la diversidad.
Por otro lado, para poder mostrar un contenido personalizado, estas gigantes empresas recogen información sobre nosotros, lo que genera una inquietud por la privacidad entre muchas personas. Es muy interesante la opinión de Tim Berners-Lee, inventor de la web, y fundador y director de W3C, en su discurso de entrada en www2012. En su opinión, la utilización de la información que las empresas tienen sobre nosotros para venderla a otros o para otros usos incorrectos no es correcta ni debería hacerse, pero no cree que esta práctica sea tan habitual, porque al fin y al cabo no es la esencia del negocio de la mayoría de las empresas, y quienes lo hacen penaliza los mercados a largo plazo. No comparte la preocupación de algunos por el uso de información de las empresas sobre nosotros, si se limita a utilizarla para ofrecer un mejor servicio. Puso el ejemplo de una tienda de ropa: el vendedor de la tienda que compra los pantalones recuerda la talla de sus pantalones de la anterior vez, siempre sin tener que probar (la máxima de ofrecer un buen servicio siempre ha sido “conoce a tu cliente”).
No obstante, considera que los interesados en que las empresas no guarden y utilicen su información para nada tienen derecho a ello y que las empresas deben respetarla, para lo que W3C propone que en el protocolo HTTP se incluya un encabezado “do not track” opcional, ya que cuando un sitio web reciba una solicitud que lo contenga no debería almacenar ningún dato del cliente. Casi todos los navegadores ya han implementado esta opción, pero hay que ver si las empresas respetaran...
La defensa de la privacidad puede llegar a ser desfavorable. En la Unión Europea, por ejemplo, una ley prohíbe el almacenamiento de cookies (sistema utilizado para guardar las preferencias del usuario y otras) sin el consentimiento del usuario. Sin cookies, no se trata únicamente de que un sitio web no pueda personalizarse, ¡ni siquiera puede logearse! Según esta ley, más del 90% de los sitios web están ilegalizados. Hasta el momento, los Estados no han hecho cumplir la ley, pero recientemente han permitido en Gran Bretaña imponer multas de hasta medio millón de libras, y algunas de sus webs han comenzado a realizar una molesta solicitud de autorización de cookies.
Otro tema que se escucha mucho en los últimos años es el de la web semántica, y lo ha sido también en el congreso de este año. Lo escribimos al respecto en los números de mayo y junio de 2009. Se trata de una web paralela, compuesta de información estructurada significativa en lugar de texto, a diferencia de la textual, más fácil de entender y tratar adecuadamente las máquinas. Servicios avanzados inteligentes sobre él, proyectos para extraer contenido estructurado del texto, etc. Hubo muchas presentaciones de este tipo.
El producto Knowledge Graph, recientemente presentado por Google, se basa también en la web semántica. Si hemos buscado una persona, lugar o cosa concreta, además de la lista de páginas web habituales, muestra una tabla con información estructurada y relacionada.
Se trata de un tema de moda que no cabe duda de que en los próximos meses y años aparecerán muchos servicios de este tipo. Aunque la verdad es que hace tiempo que se está diciendo que el año en el que se va a explotar la web semántica va a ser el siguiente, y esa explosión no llega, también es cierto que poco a poco van apareciendo cada vez más servicios.
Una novedad en el congreso de este año ha sido la gran presencia del Procesamiento del Lenguaje Natural y de las tecnologías lingüísticas. Estas tecnologías que desde hace una década trabajamos en el Grupo de I+D de Elhuyar, sobre las que hemos hablado con frecuencia en este apartado (corpus, traducción automática, tecnologías para hacer mejores buscadores, sistemas de respuesta a preguntas, agentes de diálogo...), han tenido tradicionalmente poco espacio en congresos relacionados con la web y los buscadores. Este tipo de temas se trataban en congresos relacionados con la lengua o con las tecnologías lingüísticas, pero hasta ahora el mundo de la web y de los buscadores no ha visto su necesidad. Han tratado muy someramente la lengua: un simple stemming o matorral, una simple búsqueda de palabras...
Una de las razones principales del interés actual por estas tecnologías es que los métodos anteriores simples han culminado y han visto la necesidad de profundizar en el análisis de la lengua para mejorar los resultados. En el caso de los buscadores, por ejemplo, se han dado cuenta de que para traducir mejores resultados es necesaria la búsqueda por idioma, la búsqueda multilingüe, la búsqueda de sinónimos o palabras similares, el análisis automático de la opinión de la gente para elaborar rankings por ella, el resumen automático, la respuesta a preguntas, y técnicas tan profundas como estas.
Otra de las razones es la web semántica, paradójica. En teoría, con la web semántica, la máquina es capaz de comprender la información estructurada que contiene sin necesidad de comprender el lenguaje. Pero para resolver determinados problemas (por ejemplo, para responder a preguntas planteadas por el usuario en lenguaje natural) es necesario desambiguar (conocer a qué objetos concretos de la web semántica se refiere la pregunta o a qué propiedades concretas se refiere). O si de los textos se quiere extraer automáticamente contenido estructurado en la web semántica, son necesarias las tecnologías lingüísticas.
Además de los tres grandes temas mencionados, se habló mucho de las redes sociales. Y web móvil, html5, vídeo, 3D... La web sigue teniendo muchas posibilidades y caminos para evolucionar y en los próximos años estaremos seguros de que esta evolución tan sorprendente.