Also available in English

Inf@Vis!

La revista digital de InfoVis.net

Filtraje Cooperativo
por Juan C. Dürsteker [mensaje nº 155]

El filtraje cooperativo está cada vez más presente como parte integrante de los sitios web comerciales. Los algoritmos “basados en la memoria” son además de los más sencillos de implementar, los más efectivos a la hora de recomendar productos y predecir preferencias.
AmazonDus.gif (89841 bytes)
Página de refinamiento de recomendación en amazon.com. El sistema propone recomendaciones en función de lo que el usuario ha comprado y de lo que han comprado otros usuarios con perfil similar. Existen diversos formularios para afinar más nuestros gustos. Si no se rellenan amazon se basa en las compras y las páginas consultadas y la "wish list" para crear el perfil.
Pulsa la imagen para agrandarla
Fuente: Captura de pantalla por el autor.

Finalizábamos el artículo anterior considerando que muchas herramientas que utilizan una metáfora 3D que imita el entorno real en que nos movemos han tenido menos éxito en la utilización en el día a día que otras alternativas más abstractas. Hay muchos ejemplos de ello como Vios, PlanetOasis y otros (véase la sección “La aventura 3D” en el número).

Existen empero otras aproximaciones, menos directas pero acaso más efectivas, a las propuestas de la teoría del forrajeo de información. Una de las que están funcionando con éxito es el filtraje cooperativo (collaborative filtering).

El equivalente del filtraje cooperativo en una sociedad de cazadores recolectores son las recomendaciones implícitas que se derivan del estudio de las huellas que dejan los animales y otros cazadores y las recomendaciones explicitas “boca a oreja” que se hacen unos grupos de cazadores a otros en función de sus experiencias previas. Ambas pueden facilitar encontrar en cada estación del año los lugares más apropiados para la caza y recolección de las especies favoritas, las que proporcionan mayor energía con el mínimo consumo.

En Internet los cazadores de información se encuentran con el rastro informacional (information scent) que dejan los sitios y enlaces que se visitan, pero también existen foros de intercambio de opiniones, chats y weblogs donde podemos encontrar información explícita sobre dónde encontrar la información que buscamos.

En el filtraje cooperativo distintos grupos de usuarios combinan las evaluaciones de la información que han encontrado o que poseen y se ayudan mutuamente a encontrar información de su interés. Esto ocurre a través de news, chats, weblogs e incluso e-mail, de una manera informal.

Una manera más sofisticada de promocionar el filtraje cooperativo surge de la mano de los sistemas de recomendación, como el que se puede encontrar en los sitios web de Amazon.com.

Estos sistemas utilizan las valoraciones explícitas (calificaciones o “ratings” de los productos que se venden o presentan) o implícitas (las compras que realiza cada uno) de los usuarios para construir perfiles de usuario que permiten la predicción de otros productos o documentos no vistos por el usuario, pero que podrían ser de su interés.

Movielens.gif (129831 bytes)
Movielens: El sistema de recomendación propone nuevas películas después de valorar un conjunto predefinido de films que se muestran al crear nuestra cuenta.
Pulsa la imagen para agrandarla
Fuente: Captura de pantalla por el autor.

En un interesante artículo* presentado por varios investigadores de la Universidad de Bucaramanga, Colombia, en el ACM Symposium of Applied Computing del año 2004 se comparan 4 tipos distintos de algoritmos de recomendación en uso hoy día:

  • Memory based (basados en la memoria). Son los primeros que se propusieron y los más sencillos de implementar. Constan de dos pasos:

    • cálculo de correlaciones. El coeficiente de correlación entre las preferencias de dos usuarios indica el nivel de coincidencia sobre sus opiniones respecto a los objetos evaluados.

    • predicción de preferencias. La predicción de la preferencia para un objeto determinado se calcula usando la suma de las calificaciones que han dado los usuarios a dicho objeto ponderados por los coeficientes de correlación entre cada usuario y el usuario activo.

  • Dependency-networks (Redes de dependencia). Una red de dependencia es un grafo que consiste en cierto número de nodos (documentos en la base de datos) unidos por arcos que representan relaciones de dependencia entre los nodos. Los estados de cada nodo representan los valores posibles de las calificaciones. Sobre esta estructura se construyen algoritmos basados en árboles de decisión probabilística que “aprenden” a predecir la preferencia.

  • On-line learning (aprendizaje on-line). Son procesos continuos e interactivos en los que cada atributo se considera como un “predictor experto” que recibe un peso usado para medir la fiabilidad en la tarea de predicción. Hay diversos tipos de algoritmos de aprendizaje on-line que no describiremos aquí debido a su complejidad.

  • Support Vector Machines. El filtrado cooperativo se puede considerar como una tarea de clasificación. Para cada usuario se puede crear un modelo de clasificación basado en los votos que el usuario y otros usuarios han emitido sobre un objeto particular. A partir de aquí se presenta un conjunto de ejemplos de las clasificaciones de usuarios y sus votos emitidos sobre objetos concretos a un algoritmo de aprendizaje, de forma que éste es capaz de predecir los votos que se emitirán para nuevos objetos no calificados todavía.

Los diversos algoritmos se usaron contra los conjuntos de datos de Movielens un sistema experimental de recomendación de películas de la Universidad de Minnesota, EachMovie un sistema experimental que corrió en el Digital Equipment Corporation's Systems Research Center (SRC) durante 18 meses desde 1995 a 1997, cuyos datos está a disposición de investigadores y Jester , un sistema de recomendación de chistes desarrollado en la Universidad de California en Berkeley.

Los resultados de la comparación muestran que en un amplio rango de condiciones los algoritmos basados en la memoria superan en rendimiento y calidad de la predicción de la preferencia. Resulta por otro lado que son los más sencillos conceptualmente y los más fáciles de implementar.

Los sistemas de recomendación se están convirtiendo en parte integral de los sitios web de comercio electrónico. Sólo hay que ver la eficiencia del sistema de filtrado cooperativo de amazon.com para darse cuenta de que existen formas de aprovechar la teoría del forrajeo de información más directas y sencillas que el uso de metáforas 3D, acaso atractivas visualmente, pero menos operativas efectivamente.


* A Comparison of Several Predictive algorithms for Collaborative Filtering on Multi-Valued Ratings. Maritza L. Calderón Benavides, Cristina N. González-Caro, José de J. Pérez-Alcázar Juan C. García-Díaz, Joaquin Delgado. Proceedings of the 2004 ACM symposium on Applied computing, pp 1033-1039

Enlaces de este artículo:

http://www.infovis.net/printMag.php?num=154&lang=1   Num 154 Web Forager.
http://www.infovis.net/printMag.php?num=93&lang=1   Num 93 Dos años después.
http://www.amazon.com   Sitio web de Amazon.com
http://movielens.umn.edu   Sitio web de MovieLens. Sistema de recomendación de películas.
http://shadow.ieor.berkeley.edu/humor/   Sitio web de Jester. Sistema de recomendación de chistes.
© Copyright InfoVis.net 2000-2018