Una parte cada vez mayor de nuestro tiempo y de nuestra inteligencia los vertemos en el trabajo basado en la Web, y a cambio estamos requiriendo respuestas más “inteligentes”. Necesitamos que los “automatismos” que tratan nuestros datos y consultas sean capaces de “entender” mejor nuestro contexto, nuestras necesidades, nuestros deseos.

Las dimensiones de la Web, los tipos de información que contiene y sus patrones de uso han evolucionado notablemente. Estos cambios plantean nuevos retos para sus puntos de entrada por excelencia, los motores de búsqueda, incluyendo:

Eficiencia: Desde sus inicios, los motores de búsqueda han sido diseñados para recuperar referencias Web ante consultas de usuarios en cuestión de milisegundos. Sin embargo, no es lo mismo gestionar unos millones de páginas Web, que recuperar con rapidez sobre centenares de miles de millones. Por ejemplo, el número de servidores Web se ha duplicado en los últimos 18 meses, de acuerdo con los informes de Netcraft. La cantidad de información en la Web crece con más rapidez que la potencia de los ordenadores, y es preciso rediseñar los algoritmos para seguir manteniéndola manejable.

Web Semántica: Los seres humanos son capaces de usar la Web para tareas tales como encontrar la palabra “automóvil” en holandés, reservar un libro en una biblioteca, o buscar el DVD más barato y comprarlo. Sin embargo, una computadora no puede realizar las mismas tareas sin que un humano las guíe, porque las páginas Web están diseñadas para ser leídas por personas y no por computadoras. La Web Semántica es la visión de una información comprensible por las computadoras, de modo que se pueda automatizar los aspectos más tediosos relacionados con encontrar, compartir y combinar información en la Web. Los elementos centrales de la Web Semántica son un modelo de datos denominado Marco de Descripción de Recursos (Resource Description Framework, RDF), una serie de formatos de intercambio de datos (como RDF/XML, Turtle, etc.), y notaciones como el Esquema RDF (RDF Schema, RDFS) y el Lenguaje de Ontologías de la Web (Web Ontology Language, OWL), que facilitan la descripción formal de conceptos, términos y relaciones en un dominio determinado. La Web Semántica posibilitará nuevas formas de búsqueda, más simples y efectivas que las actuales, que deben construirse sobre el procesamiento inteligente de la información actual en la Web, incluyendo el análisis del lenguaje y de los datos multimedia.

Redes Sociales interactivas: Una de las razones más importantes del crecimiento de servidores y páginas Web es la enorme popularidad de los servicios de redes sociales interactivas, como Flickr, Blogger, Digg, MySpace, YouTube, la Wikipedia y muchos otros. Estos sitios permiten que sus usuarios publiquen y compartan fácilmente y con rapidez todos los tipos de información, incluyendo reflexiones personales, fotografías, vídeos, intereses y referencias, noticias, etc. La capacidad de compartir se posibilita especialmente a través del apoyo computacional a las relaciones interpersonales, con características como Amigo de un Amigo (Friend of a Friend, FOAF), que permiten a los usuarios compartir su red de relaciones personales. Los servicios de redes sociales dan apoyo a comunidades dinámicas interactivas emergentes, que toman decisiones sociales sobre la calidad de los contenidos Web. Estas comunidades pueden ser la clave de los motores de búsqueda del futuro, como el análisis de enlaces lo ha sido de la presente.

Personalización y otras formas de contexto: A medida que crece la potencia de las computadoras, ésta se puede aprovechar para implementar características más avanzadas en los buscadores. Explotar la información acerca del contexto del usuario (su ubicación física, las búsquedas previas y recientes, los clicks anteriores, etc.) ofrece la oportunidad de entregar información más precisa al mismo, en tanto que puede adaptarse a sus objetivos e intereses de búsqueda a corto y largo plazo. Tener presente el contexto del usuario es también crítico en los anuncios en la Web, un ámbito de importancia siempre creciente que permite sacar partido de la información de usuario para realizar segmentaciones más efectivas.

Multimedia y multilingüe: La Web es una comunidad con nacionalidades variadas que se expresan en diferentes idiomas, a los que los motores de búsqueda dan aún un soporte muy limitado. Incluso los aspectos más básicos de la internacionalización (como la elección de la codificación y del juego de caracteres) se cubren en los motores actuales de una manera parcial e insatisfactoria. Tan sólo los crecientemente efectivos sistemas de traducción dan soporte a la multiplicidad de lenguas, y los usuarios siguen demandando características translingües que les permitan superar las barreras del idioma, recuperando documentos en múltiples lenguas ante consultas en su idioma materno. La potencia computacional y la calidad de los algoritmos de análisis multimedia también posibilitan mejores índices e interfaces, en los que los usuarios plantean consultas en forma de ejemplos de fotos o incluso videos, con el objetivo de obtener resultados multimedia.

Spam Web: El que posiblemente sea el mayor valor de la Web, esto es, su capacidad para conectar desde fragmentos de información a personas, está siendo objeto de abuso de una manera creciente. Como ocurrió con el correo basura o spam, algunos proveedores de contenidos abusan de este valioso medio de comunicación, con el fin de obtener ventajas comerciales. Para ello, confeccionan páginas y preparan enlaces con el fin de obtener un posicionamiento privilegiado de manera inmerecida ante las consultas más populares de los usuarios. Más aún, violan la seguridad de sitios Web dinámicos (foros, redes sociales, etc.) con el objeto de insertar contenidos falseados y referencias a sus sitios Web. De este modo logran, en último término, dirigir el tráfico de usuarios a sus sitios Web, y el dinero a sus bolsillos, a veces disfrazando esta práctica como optimización de motores de búsqueda (Search Engine Optimization, SEO). Los operadores de motores de búsqueda, redes sociales, etc. se enfrentan a la exigencia de detener, o al menos reducir, este tipo de abuso.

Fuente Original:

Ricardo Baeza-Yates, Paolo Boldi, José María Gómez Hidalgo. Búsqueda en la Web del futuro. Novática: Revista de la Asociación de Técnicos de Informática, ISSN 0211-2124, Nº. 185, Enero - Febrero 2007 , pags. 3-4.

 
 

No Responses to “Buscando en la Web del futuro”  

  1. No Comments
Posting Your Comment
Please Wait

Leave a Reply

There was an error with your comment, please try again.