Also available in English

Inf@Vis!

La revista digital de InfoVis.net

Motores de Búsqueda Visuales
por Sergi Mínguez y Juan C. Dürsteler [mensaje nº 198]

Internet se ha convertido en parte central de nuestra vida diaria como fuente principal de información. Con casi el 70% de los usuarios de web utilizando motor de búsqueda como punto de entrada, la forma en que se presenta visualmente la catarata de información que producen cobra cada vez mayor importancia. Resumimos aquí los rasgos principales de los buscadores visuales así como una lista de los más notables.
SearchmeMadonna.jpg (245686 bytes)
Searchme results for the query "Madonna" under the topic "images"
Source: as can be seen in the searchme web site
Click on the image to enlarge it

La mayoría del contenido existente se publica, referencia o se ilustra en Internet. Así resulta normal que la gente considere Internet como su principal herramienta para hallar los recursos que necesitan. Hasta cierto punto lo que no está en la web no existe en el mundo de hoy. 

Además las aplicaciones multimedia de carácter socia están creciendo de forma acelerada en Internet proporcionándonos ejemplos como YouTube, Facebook, or Flicker, que están introduciendo de forma exponencial una gran cantidad de datos nuevos. Imágenes, videos, libros, noticias, música y cualquier forma de multimedia están isponibles online con cierta abundancia de interfaces interactivas.

Las compañías más importantes que desarrollan motores de búsqueda tales como Yahoo, Google o Microsoft saben que no tienen capacidad para busacr adecuadamente dentro de estos tipos de datos. Por tanto están empezando a mejorar su motores y a modificar sus interfaces actuales para dotarlos de nuevas funcionalidades.

Podemos identificar algunos ejemplos como:

  • Yahoo Alpha: Proporciona una nueva interfaz donde la lista tradicional se relaciona con otros tipos de contenidos (música, vídeo, imágenes) usando una categorización interna.

  • Yahoo Monkey Search: SearchMonkey es una plataforma abierta que permite a los desarrolladores el uso de datos estructurados para mejorar los resultados de Yahoo! incluyendo revisiones, fotos y enlaces profundos (deep links).

  • Google Universal Search: Anunciado en Mayo de 2007 y ahora parte de la experiencia de búsqueda de Google, combina en los listados provenientes de la búsqueda noticias, video, imágenes, y libros.

A pesar de estas mejoras, las nuevas interfaces heredan los mismos viejos y básicos problemas sin proporcionar en cambio avances significativos en la interacción.  La explosión de los multimedia y las nuevas necesidades de información no hace más que incrementar la necesidad de disponer de interfaces visualmente ricas, más sofisticadas y complejas capaces de buscar en contenidos multimedia interrelacionados. Hace ya bastante tiempo han aparecido algunos navegadores visuales que intentan superar las limitaciones de la presentación y la interacción en los motores de búsqueda tradicionales.

Hasta ahora estos tipos de navegadores y motores de búsqueda visual se habían considerado aplicaciones online más cercanas a lo artístico que a lo utilizable. Para entender mejor por qué son necesarios los motores de búsqueda visuales necesitamos introducir dos conceptos.

  • Intención de la interrogación (query intention): En la Recuperación de Información clásica se define la intención de la interrogación como una "necesidad de información". Sin embargo, la necesidad detrás de una búsqueda en la web no es únicamente informacional.. Andrei Broder  introduce en 2002 una taxonomía para identificar distintas necesidades de las búsquedas en la web y discute cómo han evolucionado los buscadores globales para tratar estas necesidades específicas de la web. En sus estudios establece tres categorías distintas para describir los diferentes comportamientos en la búsqueda en la web:

    • Navegacional. La intención inmediata es alcanzar un sitio web particular que el usuario tiene en mente, acaso porque ya lo visitó o bien por que supone su existencia. 

    • Informacional. El objetivo es aquí adquirir cierta información que se supone presente en una o más páginas web. No se predice ninguna interacción adicional exceptuando la lectura de su contenido

    • Transaccional. La meta es ahora realizar cierta actividad mediante la web. La interacción constituye la transacción definida por esas interrogaciones. Son las más difíciles de evaluar.

    Para determinar la relevancia relativa de los distintos tipos de interrogaciones Broder realizó un investigación entre usuarios de AltaVista y un análisis de su histórico de interrogaciones que le permitió determinar que, en 2002, 50% de las interrogaciones fueron informacionales, 30% transaccionales y sólo un 20% navegacionales. Posteriormente, en 2008, Bernard J. Jansen et al.  implementaron un sistema para la clasificación automática de un graan conjunto de interrogaciones (más de 1,5 millones) siguiendo la misma taxonomía. Sus resultados señalaron que 80.6% de las interrogaciones fueron informacionales, 10.2 % Navegacionales y solo 9.2 % fueron transaccionales. 

    Como vemos el reconocimiento de la intención del usuario es necesario para comprender la necesidad detrás de la interrogación y, a partir de esto, proporcionar los resultados apropiados a la persona que está buscando. Consecuentemente los motores de búsqueda visuales podrían beneficiarse de las interrogaciones dinámicas que redefinen los términos de la interrogación en tiempo real lo que proporciona una búsqueda más rica y compleja. 

  • Búsqueda exploratoria: En 2006 G. Marchionini publicó un trabajo más enfocado a la interacción con motores de búsqueda basado en la Búsqueda Exploratoria. En su estudio distingue tres tareas principales que realizan los usuarios durante la búsqueda. Las define como sigue:

    • Buscar (Lookup) es la tarea de búsqueda más básica y ha sido el foco de desarrollo para los sistemas de gestión de bases de datos y mucha parte de lo que soportan los motores de búsqueda.  Esta tarea devuelve objetos discretos y bien estructurados tales como números, nombre, frases cortas o ficheros específicos de texto u en otros formatos.

    • Buscar para aprender se está volviendo cada vez más viable a medida que se incrementa e material online. Las búsquedas de aprendizaje implican iteraciones múltiples y devuelven conjuntos de objetos que requieren de un procesado cognitivo y de su correspondiente interpretación. 

    • Búsquedas que soportan la investigación suponen varias  iteraciones que tienen lugar acaso sobre periodos de tiempo largos y pueden devolver resultados que han sido previamente evaluados antes de incluirlos en las bases de conocimiento. 

    Finalmente Marchionini considera que la búsqueda exploratoria debe ser una combinación de las dos últimas categorías donde la gente ha de estar identificada con conceptos como adquisición de conocimiento, comparación, síntesis investigación o socialización.

Por lo visto anteriormente, los motores de búsqueda convencionales solamente proporcionan búsqueda (Lookup)devolviendo objetos discretos y bien estructurados con propósito informacional. Parece que solamente las aplicaciones de carácter más exploratorio, tales como los motores de búsqueda visuales, pueden ser capaces de soportar apropiadamente la búsqueda para aprender o para investigar. No está claro en este momento si este tipo de motores de búsqueda pueden cambiar los ratios de interrogación informacional/nevegacional/transaccional o no

Algunos ejemplos de estas herramientas son

KartOO 
Kartoo09.gif (153185 bytes) Co-fundada en Francia en 2001, tla compañía homónima lanzó en 2002, KartOO  un meta motor de búsqueda implementado en Flash que proporciona un interfaz visual para explorar los resultados. Una vez entrada la búsqueda obtienes un "mapa" en vez de una lista . Este mapa visualiza los resultados como entidades y las palabras clave como relaciones. Los sitios web se representan mediante una captura de pantalla en baja resolución con la URL. Además, el tamaño se utiliza como atributo visual para representar la relevancia del sitio dentro de la interrogación (véase también el número 97) 

Las palabras relevantes se usan también para relacionar diferentes resultados que se muestran en el mapa y, además, para permitir la posibilidad de redefinir la búsqueda añadiéndolas a la interrogación inicial.  La propia información relacional produce curvas de nivel utilizando la metáfora del paisaje que se encuentra en los mapas cartográficos. La herramienta utiliza la clausura como vehículo para permitir al usuario ver cuales son las relaciones entre objetos de una forma más clara que con enlaces.

Aquí la interacción involucra al usuario en el proceso de búsqueda y le proporciona medios de exploración. Es pues una buena solución para tareas informacionales. La imagen muestra el mapa generado como respuesta a la interrogación sobre Madonna. La página home de la artista tiene el mayor tamaño con Wikipedia y MTV después. Como palabras relevantes podemos encontrar news, music, ringtones or premieres.

Nótese que las palabras relevantes muestran la intención del usuario más que mostrar los resultados ocultos detrás de ellas. Por ejemplo, si el usuario continua la búsqueda añadiendo music a la interrogación es porque está haciendo una búsqueda informacional, sin embargo si decide añadir downloads es porque su intención es la de hacer una tarea transaccional. 

UJIKO
Ujiko09.gif (145925 bytes) Kartoo tiene otros interesantes proyectos de búsqueda visual como es Ujiko. Su display muestra los resultados en un menú oval con una sección central abierta donde el usuario puede marcar determinados resultados como relevantes. La sección central se usa para añadir información a los resultados. Mediante bloques coloreados se ayuda al usuario a identificar  agrupaciones (clusters) nominales.

Otra interesante característica de este motor de búsqueda es que cuanto más lo usas más funciones es capaz de proporcionarte. Cada vez que visitas un sitio web ganas un punto de experiencia. Con cada 10 puntos promocionas al siguiente nivel consiguiendo nuevas funcionalidades. Esta innovadora característica demuestra el deseo de Kartoo de obtener información sobre la interacción del usuario introduciendo su aplicación como si de un juego se tratase.

Grokker
Grokker09.gif (90767 bytes)

Grokker proporciona un conjunto de formas intuitivas para navegar por entre grandes conjuntos de resultados. Un ejemplo de ello es su mapa visual basado en la metáfora visual del árbol de globos. En la misma un conjunto de círculos anidados representan categorías. El tamaño de las mismas se asocia a su cantidad de contenido. El usuario puede pulsar sobre los círculos para explorarlos y tiene la posibilidad de hacer zoom hasta que llega a los documentos individuales. Véase también el número 138

Otra interesante característica es el refinado de resultados mediante el uso de filtros. Grokker te permite refinar los resultados de forma dinámica sin tener que repetir la interrogación.  En particular puedes filtrar por autor, fecha publicación, país, etc. así como mediante la inclusión / exclusión de palabras clave. Finalmente puedes personalizar la presentación de los resultados con diferentes niveles de detalle añadiendo o quitando información. 

Así pues, Grokker parece una buena alternativa para navegar entre grandes conjuntos de datos. Como está implementado en JavaScript, es más rápido que otras aplicaciones Flash. Por contra la limitación de JavaScript en cuanto a representación hace que no use la visualización en la presentación última de resultados . Consecuentemente podemos decir que su principal contribución es la visualización de agrupaciones (clusters). 

Simploos
simploos09.gif (175510 bytes) Simploos es otra herramienta de búsqueda visual desarrollada en México y presentada en 2008. Está implementada en Flash e introduce una interesante idea. Simploos muestra los resultados en forma de una previsualización de alta resolución de los sitios web.  Esto permite al usuario realizar rápidas comparaciones evitando la carga real de la página, sin realizar ninguna pulsación del ratón. 

Sin embargo, a pesar de que usan cache para guardar las imágenes el mecanismo usado para obtener la previsualización es considerablemente lento. Otra importante característica es la navegación a través de de la previsualización.  El usuario puede desplazarse tanto de derecha a izquierda como de arriba a abajo sólo con el movimiento del ratón de forma bastante intuitiva una vez te acostumbras a ello.

Así pues, a pesar de que Simploos sólo es un meta motor de búsqueda que usa Yahho! o Google en función de la elección del usuario, su contribución es potente. Muestra que la previsualización del contenido real de un sitio web, más bien que la de una captura de imagen, proporciona una información importante que puede acelerar el proceso de búsqueda. 

Quintura
quintura.gif (50110 bytes) Quintura es otra herramienta desarrollada en JavaScript. Presentada también en 2008, sigue la misma idea introducida por Kartoo. Utiliza palabras relevantes (tags) para refinar las interrogaciones y atraer a la gente a explorar más que a buscar.

La interacción con la nube de tags presenta otra característica innovadora. Cuando el ratón se cierne sobre un tag se le permite ver una previsualización de la búsqueda. Esta rápida tarea permite al usuario navegar más intuitivamente viendo lo que podría ser el siguiente paso antes de escoger el camino final. 

Guardar o Compartir la búsqueda es otra característica que se introduce en esta aplicación. Sin embargo, debido a la necesidad de reemplazar los resultados con facilidad, Quintura no usa ninguna aproximación visual para mostrar los resultados finales. Por tanto la única característica importante que introduce este software ( aparte de una no muy intuitiva interfaz para niños ) es una navegación rápida de la nube de tags.

oSkope
oSkope.gif (274627 bytes) oSkope es un servicio gratuito online desarrollado por oSkope media gmbh en Zurich y Berlin. Está Implementado en Flash y use la información obtenida de diferentes tipos de motores de búsqueda: Yahoo, Ebay, Youtube, Flickr, Fotolia o Amazon.

En tanto que motor de búsqueda visual puro su característica más interesante es la forma en que representa los resultados en la pantalla.  Utiliza una serie de pre-visualizaciones rápidas distribuidas en varias disposiciones, en forma de malla, como un montón, una pila o como una lista. Otra de las características innovadoras consiste en que el usuario puede escoger representar los resultados en grafico de dispersión en el que los datos están ordenados por fecha, por ranking o por precio en el caso de libros, por ejemplo. 

Por otro lado, cuando se pasa el foco a un elemento concreto, aparecen previsualizaciones que muestran más información lo que permite distintos niveles de resolución en las imágenes. El usuario puede arrastrar y soltar los elementos para construir fácilmente grupos con los resultados y/o crear disposiciones visuales. Sin embargo, a pesar de que existen carpetas de usuario para guardar los resultados, las disposiciones y grupos realizados no se pueden guardar o reutilizar para rankings ulteriores. 

Por tanto podemos considerar que la gestión dinámica de los resultados es la característica más interesante introducida por oSkope. La búsqueda solo  se permite sobre contenido visual como imágenes videos o libros y probablemente la aplicación más interesante sea sobre datos de e-Bay donde oSkope permite escoger entre todas las categorías mostrando los resultados mediante importantes atributos como precio o duración.

News Map
newsmap.gif (216027 bytes) Otra interesante aplicación de los motores de búsqueda visuales es la de obtener una vista general de las noticias más importantes del día. News Map (véase también el número 160) es una de las primeras aplicaciones visuales (con permiso de la extinta y excelente newsmaps.com) que saca partido de la visualización de información para permitir a sus usuarios obtener una rápida idea de las noticias más relevantes del día. De hecho está reflejando continuamente el cambio en el Google News aggregator.

Utiliza un algoritmo de treemap para presentar la información dividida en categorías fácilmente identificables, como son mundo, nación, negocios tecnología, deportes, etc. Cada categoría se visualiza utilizando una paleta de color nominal y el tamaño permite representar la relevancia de cada noticia. Además se puede filtrar la información por categoría fecha o país utilizando una serie de botones situados en la visualización.

Searchme
searchme.gif (182326 bytes) Searchme es probablemente, el motor de búsqueda visual con más propiedades. Utiliza una interfaz dinámica en Flash para gestionar toda clase de resultados de búsqueda. Inicialmente, sin necesidad de interrogación alguna muestra por defecto webs relevantes sobre novedades, deportes etc. simplemente para probar la flexibilidad de la aplicación. 

Para navegar a través de los diferentes websites utiliza un scroll vertical muy similar al recientemente introducido por Apple. los resultados se presentan con un buen nivel de resolución para proporcionar una vista general detallada del contenido. Además, después de unos segundos, aparece una herramienta que permite hacer zoom sobre la imagen. La misma tecnología está disponible también para imágenes y videos permitiendo la reproducción en tiempo real. 

Una vez se entra la interrogación, el contenido se muestra con razonable velocidad. Una vez  se ha cargado al página las palabras de la interrogación se resaltan en la misma para obtener una rápida vista de conjunto. Por otro lado aparecen otras subcategorías cerca del campo de búsqueda que nos permiten filtrar los resultados. Por ejemplo podemos ver como aparecen criterios como música, universidades, noticias, fitness o tickets para refinar la interrogación añadiendo la intención del usuario a la búsqueda inicial.

Finalmente el usuario puede guardar sus resultados en subcategorías personalizadas llamadas stacks (pilas) La facilidad para creara carpetas personalizadas convierte a searchme es una buena aplicación para guardar o compartir contenido interesante encontrado en la Web.

El conjunto de Motores de Búsqueda Visual introducido más arriba reúne importantes características comunes que se pueden resumir como sigue:

  • Previsualizaciones como representación visual de los resultados.

  • Una rica interacción para navegar y organizar los contenidos resultantes.

  • El uso de filtros para redefinir dinámicamente la información recuperadas.

  • Tags o categorías personalizadas para relacionar entidades y añadir intención a la interrogación inicial.

  • Mapas para organizar los resultados mediante atributos relevantes.

Todas estas características introducen importantes mejoras respecto a los motores de búsqueda habituales, lo que proporciona una nueva manera de interaccionar para motivar la exploración y la permanencia. Pero, además, están proponiendo nuevas características que nunca habían estado presentes en los motores actuales, como sugerencia de tags, previsualización visual o uso de filtros. Éstas últimas se encontraban en otras aplicaciones más enfocadas a multimedia como: YouTube, Flickr o Facebook. 

En cualquier caso parece que los motores de Búsqueda Visual debieran ayudar en la búsqueda de la eficiencia cuando se busca en la Web.

Puesto que el 70% de las personas que buscan en la web usan un motor de búsqueda como su punto de entrada en Internet, éstos se ven obligados a proporcionar acceso a todo tipo de contenido, sitios web, imágenes, videos, noticia, libros; multimedia al fin y al cabo. Algunos de estos motores han estado con nosotros ya desde hace algún tiempo, como KartOO y Grokker. Pero la búsqueda visual no es aún parte de la experiencia habitual de búsqueda en Internet. Conseguirlo proporcionaría un gran impulso a la visualización de información en general. No estamos tan lejos de ese momento (posiblemente). 


Sergi Mínguez trabaja como desarrollador en la Fundació Barcelona Media y como profesor de programación en la Universidad Pompeu Fabra (UPF), combinando su trabajo con los estudios de Máster en la misma universidad.

Sus intereses en el diseño y el arte digital combinados con su formación como Ingeniero Informático le han llevado a introducirse en la visualización de la información y convertirlo en su trabajo, habiendo colaborado en la herramienta WebSite Exploration Tool (WET) presentada en artículos anteriores, TangibleSQL, aplicación desarrollada sobre reacTable para visualizar resultados de consultas en bases de datos, y su actual proyecto de Master thesis dirigida por Ricardo Baeza-Yates y dedicada a la implementación de una interfaz para hacer búsqueda exploratoria.

Enlaces de este artículo:

http://www.searchme.com   Página web de SearchMe
http://au.alpha.yahoo.com/   Página web de Yahoo! Alpha
http://developer.yahoo.com/searchmonkey/   Página web de Search Monkey
http://searchengineland.com/google-universal-search-2008-edition-13256   Artículo sobre Google Universal Search
http://research.yahoo.com/bouncer_user/17   Página personal de Andrei Broder
http://www.kartoo.com   Página web de KartOO
http://www.infovis.net/printMag.php?num=97&lang=1   Artículo 97 sobre KartOO
http://www.infovis.net/printMag.php?num=168&lang=1   Artículo 138 sobre La Metáfora del Paisaje
http://www.ujiko.com/v2a/flash.php?langue=en   Página web de Ujiko
http://www.infovis.net/printMag.php?num=138&lang=1   Artículo 138 sobre Grokker, o la Navegación Visual
http://www.quintura.com/   Página web de Quintura
http://www.oskope.com   Página web de oSkope
http://newsmap.jp   Página web de Newsmap
http://www.infovis.net/printMag.php?num=160&lang=1   Artículo 160 sobre Newsmap
http://www.barcelonamedia.org/   Página web de Barcelona Media
http://www.upf.edu/   Página web de la Universitat Pompeu Fabra
http://www.infovis.net/printMag.php?num=193&lang=1   Artículo 193 sobre Ocho años y WET!
http://www.infovis.net/printMag.php?num=189&lang=1   Artículo 189 sobre Reactable
© Copyright InfoVis.net 2000-2018