Also available in English

Inf@Vis!

La revista digital de InfoVis.net

Búsqueda Exploratoria
por Juan C. Dürsteler [mensaje nº 185]

No siempre sabemos con precisión lo que queremos y, muchas veces, ni siquiera cómo se llama. En estas condiciones la búsqueda exploratoria es una estrategia que nos permite, ayudada por la visualización, afinar la búsqueda y llegar a aquello que nos interesa mediante aproximaciones sucesivas.
wwmxscreenshot.jpeg (139810 bytes)
WorldWideMediaExchange.  Una web de fotografias con multiples formas de explorar su contenido.           
Fuente: Captura de pantalla tal como se puede ver en la web de wwmx.org.
Pulse sobre la imagen para agrandarla

Parte de las tareas diarias de muchos de nosotros consiste en conectarnos a Internet para buscar información. A veces sabemos exactamente lo que buscamos y dónde encontrarlo pero otras muchas sólo tenemos una idea elemental de lo que queremos y ni siquiera sabemos dónde, si existe, puede estar dicha información.

Por ejemplo, sabemos que es posible buscar información en Internet sin conocer exactamente el nombre o la ubicación pero, ¿cómo encuentro información sobre un campo del que no tengo conocimientos específicos, del que sólo tengo una vaga idea?

Habitualmente lo que hacemos en estos casos es recurrir a un buscador como Google o Yahoo! y formular interrogaciones más o menos felices para ir explorando los resultados y refinar la búsqueda en función de la información que vamos obteniendo y aprendiendo. En definitiva utilizamos una técnica exploratoria. Pero esta es una técnica que con los navegadores y buscadores actuales es lenta y tediosa. 

Una de las respuestas podría venir por la vía de la visualización, de la mano de lo que se está empezando a llamar Búsqueda Exploratoria (Exploratory Search). 

Diversos grupos de investigadores en campos que van de la recuperación de información al diseño de interfaces y la visualización de información están trabajando para dar soporte a este tipo de búsqueda. De hecho, aunque en el pasado no hemos hablado formalmente de búsqueda exploratoria como tal, hemos pasado revista a muchas aplicaciones que ya iban en esta dirección.

Ejemplos de ello son TileBars y Bailando de Marti Hearst o los TreeMaps de Shneiderman & colegas o las iniciativas de KartOO, Grokker, Autofocus, para información textual. Para la información musical revisamos Musicplasma (ahora livePlasma)  y otros en Visualizando la música o Islands of Music en el numero 168. Estos son sólo algunos de los artículos aparecidos en InfoVis.net relacionados con esta materia. Por tanto el tema o, más bien la necesidad, no son nuevos.

Lo que es nuevo es que se empieza a hablar de Búsqueda Exploratoria de forma integrada, como una disciplina en si, que reconoce que las interfaces visuales junto con la integración de diversas metodologías de búsqueda son un aspecto clave para facilitar a los usuarios encontrar aquellas piezas de información que no pueden encontrar usando simplemente una interrogación precisa.

Uno de los aspectos donde ello es importante es en la búsqueda de información personal. Una información por ejemplo de una visita comercial puede estar relacionada en nuestra lista de contactos o contenida en un e-mail o acaso en un informe comercial. Si buscamos en un solo canal, por ejemplo el e-mail, podemos errar por completo. A ello se añade que nuestra memoria suele resultar vaga y en muchos casos no seguimos un criterio riguroso al guardar nuestros datos. En parte debido a que no podemos adelantar cómo nos va a interesar recuperarlos en el futuro. 

Phlat_1.gif (86314 bytes)
Phlat Imagen de la interfaz.
Fuente: Tal como se puede ver en la web de Microsoft Research.
Pulsa sobre la imagen para agrandarla.

Phlat es una interfaz de búsqueda exploratoria desarrollada por el grupo de interacción y sistemas adaptativos de Microsoft Research para la búsqueda en el escritorio de Windows. Se puede descargar gratuitamente y busca información utilizando interrogaciones transversales a través de múltiples categorías de documentos, como música, texto, e-mail, imágenes, etc. con diversos tipos de filtros  

OpenVideoSearch.gif (143229 bytes) OpenVideStrybrd.gif (302756 bytes)
Openvideo.org. La interfaz del "Relation Browser" proporciona una página de búsqueda que combina una ventana de recuperación de información con un particionamiento del corpus de videos por genero, duración, contenido, etc. 
Fuente: Captura de pantalla tal como se puede ver en la web de openvideo.org.
Pulse sobre la imagen para agrandarla
Openvideo.org. Una de las formas de ver un video y analizarlo antes de decidir su descarga es el "storyboard", que nos muestra una imagen de cada una de las escenas que componen el video, permitiendo de esta forma hacerse una idea de su contenido. 
Fuente: Captura de pantalla tal como se puede ver en la web de openvideo.org.
Pulse sobre la imagen para agrandarla

Por su parte Openvideo utiliza una colección de videos relacionados con la investigación y la educación extensamente anotados para ofrecer múltiples caminos que permiten seleccionar y valorar un video antes de decidirse a descargarlo. Open Video permite hacer una búsqueda tradicional (lookup) por un lado y/o una búsqueda por partición (browsing) por otro y también combinarlas. 

En particular, además de recoger la información habitual (autor, fecha, duración, etc.), Openvideo ofrece varios formatos que permiten comprender la naturaleza del video y decidir su descarga. Storyboard es uno de ellos. En ella cada una de las escenas aporta una imagen da reflejada en una forma similar a las viñetas de un storyboard. Mirando el conjunto obtenemos una idea bastante buena de su contenido.

Clusty.gif (83297 bytes) mspace.gif (133660 bytes)
Clusty. Los resultados son agrupados por "clusters" de documentos que tienen un tema en común. 
Fuente: Captura de pantalla tal como se puede ver en la web de clusty.com.
Pulse sobre la imagen para agrandarla
mspace. Una combinación de búsqueda tradicional con particionado. 
Fuente: Captura de pantalla tal como se puede ver en la web de mspace.
Pulse sobre la imagen para agrandarla

Clusty utiliza técnicas de "clustering" para agrupar los resultados en función de ciertas palabras claves presentes en todos ellos. Además de la lista típica de resultados à la Google Clusty ofrece un esquema de partición que nos permite adentrarnos en los resultados que se han agrupado por similitud etiquetados bajo el epígrafe de un cluster determinado. Por ejemplo si buscamos "infoVis" obtenemos una serie de resultados y además una lista de temas o clusters, determinados automáticamente del análisis de los resultados, como "recursos", "blogs", etc. de forma que podemos afinar nuestra búsqueda introduciéndonos en las agrupaciones.

mspace es otra herramienta, que ejemplifica la combinación de herramientas de particionado, ordenación, previsualización (o pre-audición para ficheros musicales) con la búsqueda tradicional. Proponen un ejemplo basado en la búsqueda de piezas musicales de música clásica como forma de introducción a la herramienta. 

Estos son solamente algunos de los ejemplos que se están empezando a ver en la web. Si profundizamos en ellos podemos percatarnos de que algunas de las técnicas que más se están usando en este tipo de aplicaciones son:

  • Agrupación (clustering). La identificación de conjuntos de resultados de búsquedas tradicionales que tienen elementos en común y que, por tanto, son similares entre sí.

  • Particionado (slicing). Segmentación de los resultados proporcionando diversas vistas (slices) del conjunto de datos en el que se quiere buscar restringiendo el numero de dimensiones de las variables que lo caracterizan. En muchos casos el conjunto contiene metadatos o anotaciones que proporcionan información para crear la vista. Este es el caso de OpenVideo o mspace, en el que además de los datos hay información adicional lo que permite ver el conjunto de datos desde distintas perspectivas semánticas.

  • Ordenación (sorting). En función de las informaciones adicionales o metadatos almacenados con los datos. Por ejemplo por autor, por fecha de edición , etc en el caso de libros.

La mayoría de los casos combinan varias o todas estas técnicas con otras menos habituales creando un espacio de búsquedas multimodal  

 En definitiva, frente a la búsqueda tradicional nos permite extraer información en base a una interrogación precisa con claves muy significativas empiezan a alzarse unos sistemas de búsqueda más eclécticos que combinan diversas estrategias con elementos de visualización de información para facilitar la búsqueda exploratoria, aquella en la que a veces ni sabemos lo que estamos buscando hasta que lo tenemos delante de nuestros ojos.


Otros recursos:

En junio de 2005 tuvo lugar un taller en la Universidad de Maryland con el objetivo de reunir investigadores de distintas ramas como la recuperación de información, interacción persona ordenador y visualización para explorar de forma interdisciplinaria las interfaces que pueden ayudar a conformar y consolidar la búsqueda exploratoria. 

Por otro lado el número especial de abril de 2006 de Communications of the ACM está dedicado especialmente a esta disciplina. Vale la pena leer los distintos artículos de este interesante número, que muestran un enfoque dedicado a resolver el problema de la búsqueda exploratoria en sí.

Enlaces de este artículo:

http://wwmx.org/   Website de World Wide Media Exchange
http://www.infovis.net/printMag.php?num=104&lang=1   Número 104 sobre Barras de Mosaicos
http://www.infovis.net/printMag.php?num=107&lang=1   Número 107 sobre Flamenco
http://www.infovis.net/printMag.php?num=51&lang=1   Número 51 sobre TreeMaps
http://www.infovis.net/printMag.php?num=97&lang=1   Número 97 sobre KartOO
http://www.infovis.net/printMag.php?num=138&lang=1   Número 138 sobre Grokker o la Navegación Visual
http://www.infovis.net/printMag.php?num=151&lang=1   Número 151 sobre Autofocus
http://www.liveplasma.com/   Website de Liveplasma
http://www.infovis.net/printMag.php?num=161&lang=1   Número 161 sobre Visualizando la Música
http://www.infovis.net/printMag.php?num=168&lang=1   Número 168 sobre La Metáfora del Paisaje
http://research.microsoft.com/adapt/phlat/   Phlat interfaz de búsqueda para escritorio Windows
http://www.open-video.org/index.php   Openvideo
http://www.clusty.com/   Clusty
http://www.mspace.fm/   mspace
http://www.umiacs.umd.edu/~ryen/xsi   Taller sobre Exploratory Search Interfaces
http://portal.acm.org/toc.cfm?id=1121949&type=issue&coll=GUIDE&dl=GUIDE&CFID=783193&CFTOKEN=90026442#1121977   Número especial sobre Búsqueda Exploratoria de Communications of ACM
© Copyright InfoVis.net 2000-2018