Also available in English

Inf@Vis!

La revista digital de InfoVis.net

Cazadores de Información
por Juan C. Dürsteler [mensaje nº 153]

El comportamiento de los seres humanos en la búsqueda intensiva de información se parece al de los cazadores recolectores de nuestro pasado y al de los animales en busca de alimento. La visualización de información busca sacar partido de este hallazgo.
InfoRastro.gif (39312 bytes)
El rastro de la información (Information scent). En la teoría del forrajeo de información un rastro informacional se obtiene al ver un elemento que nos da idea de la fuente de información que lo produjo. Por ejemplo un enlace puede darnos pistas sobre la información a la que se refiere. 
En la imagen, la pista de "huellas informacionales"  representa el rastro de información.
Fuente: representación por el autor.
Pulse sobre la imagen para agrandarla.  

La búsqueda y digestión de información en la web es una de las tareas cotidianas a las que dedicamos más tiempo en Internet y que, probablemente, nos causan más dificultades también.

Uno de los temas de más interés es, consecuentemente, qué estrategias pueden ser las más adecuadas para mejorar esa búsqueda y cómo implementarlas en los sistemas que sirven y recogen dicha información.

Existe una aproximación muy interesante desde el punto de vista conceptual: la teoría del rastreo o forrajeo de información (Information Foraging). Esta teoría tiene sus orígenes a principios de los 90 cuando Peter Pirolli y Stuart Card estaban estudiando el comportamiento humano en la búsqueda intensiva de información. 

Pirolli conocía la teoría del forrajeo o rastreo de alimentación (foraging theory) usada por antropólogos y etólogos y pronto se dio cuenta de que el comportamiento de los humanos en busca de información era similar al de los cazadores recolectores y los animales en busca de alimento. 

En 1997 G.W. Furnas introdujo la idea de que la representación de un objeto (por ejemplo un enlace de hipertexto) mantiene un “residuo” perceptible de lo que subyace al mismo. 

El mismo año Pirolli refundió el concepto de residuo en la idea de “rastro” de información (information scent). Este rastro se puede asimilar según Card* a la “percepción (imperfecta) del valor, coste o camino de acceso a las fuentes de información obtenido a partir de entradas proximales como los enlaces WWW” por parte del usuario. 

En este sentido el rastro proximal (cercano) de la información nos daría una idea de la existencia y acaso una vaga localización de la fuente distal (lejana en términos de acceso) de la misma.

Los biólogos idearon la teoría del forrajeo en los años 70, intentando explicar algunos aspectos del comportamiento animal. En particular se preguntaban qué hace elegir a un depredador entre una presa fácil pero poco energética como una cría o una presa de mayor rendimiento energético pero más difícil, como un animal adulto.

Otra de las preguntas clave es cuándo hay que moverse a otra región más rica en alimentos (información en nuestro caso), ya que cuanto más se explota una región menor es la cantidad de alimentos disponibles.

Parece ser que los animales escogen aquellas estrategias que maximizan el beneficio por unidad de coste. Dicho de otra manera, buscan aquellas estrategias en las que con un mínimo consumo de energía se obtiene el máximo de energía en forma de alimento. Pirolli y Card definen la rentabilidad de una fuente de información como “el valor de la información obtenida por unidad de coste de procesado de la fuente”.

Por otro lado la estrategia óptima para cambiar de área de forrajeo dentro de una región es la de hacerlo cuando el retorno que se obtiene en un área concreta es menor que el promedio de toda la región. Ello constituye el denominado “Teorema del Valor Marginal” desarrollado por Charnov en 1976 y que ha servido para modelizar el comportamiento en campos tan diferentes como la ecología o el cultivo de tierras. 

Según Pirolli, Card y otros autores resulta que el comportamiento de los usuarios de web se ajusta bastante bien al de nuestros antepasados cazadores-recolectores en lo que a información se refiere, lo que parece bastante lógico ya que gracias a esas habilidades fuimos capaces de sobrevivir. En concreto son capaces de encontrar rápidamente el camino optimo hacia la información deseada. El problema es que en muchos sitios web este camino es considerablemente largo y sinuoso, si es que existe, incluso.

Así pues la idea que hay detrás de ello es la de 

  • crear representaciones de información con una fuerte huella informacional, 

  • optimizar la arquitectura de información para producir caminos óptimos cortos y directos y 

  • crear regiones informacionales en las que el suministro de información equilibre la tasa de consumo (la información relevante que ya se ha adquirido deja de serlo, aunque “siga ahí”).

Según Card y otros* algunas de las características que se han desarrollado espontáneamente en el lado del servidor han sido: 

  • Los índices tales como los de Lycos que crean un índice invertido intentando visitar las paginas siguiendo todos sus enlaces a partir de uno en concreto. El usuario formula una interrogación y obtiene un conjunto de enlaces que se puede interpretar como una “región de forrajeo”

  • Arboles de categorías que agrupan enlaces como el Open Directory Project que produce caminos y regiones de forrajeo.

  • Páginas web creadas por muchos usuarios sobre temas específicos, que recolectan listas de enlaces con un rastro informacional común.

InfoVis.net es un ejemplo de este último caso donde se recoge “alimento informacional” de un mismo tipo .

Como veremos en el próximo artículo, se han creado ya algunos sistemas que sacan provecho de este modelo. Empresas como amazon.com o google.com aprovechan distintos aspectos de las mismas para favorecer el forrajeo informacional. 

No obstante los investigadores se enfrentan a varios retos:

  • No es tan fácil calcular el coste de una acción en la web como en el mundo natural. Hace falta una definición de “energía” apropiada. El valor de la información es difícil de calcular.

  • La teoría inicial del forrajeo se ha ido refinando al incluir cada vez más factores que los iniciales, que daban lugar a un modelo simplista. Lo mismo ocurre con su contrapartida informacional, queda mucho por descubrir del comportamiento de rastreo de información humano. 

  • Las ecologías de la información son eminentemente dinámicas, mientras que las teorías de forrajeo tienden a suponer que los entornos son poco cambiantes en el tiempo.

La visualización de Información se aprovecha del mestizaje interdisciplinar. Quizá haya que ir pensando en empezar a crear una agricultura de la información.


Véase también

Enlaces de este artículo:

http://bio.research.ucsc.edu/~barrylab/classes/animal_behavior/FORAGING.HTM#anchor2421864   Teorema del valor marginal
http://www.dmoz.org/   Open Directory Project
http://www.acm.org/sigchi/chi96/proceedings/papers/Card/skc1txt.html   The webBook and the WebForager por Card et al.
http://www2.parc.com/istl/members/pirolli/pirolli_files/NewScientist_pirolli.html   Surf like a Bushman por Rachel Chalmers
http://www.pixelcharmer.com/essays/information-foraging.html   Information Foraging Theory Applied" por Tanya Rabourn.
© Copyright InfoVis.net 2000-2018