| InfoVis.net>Revista>mensaje nº 103 | Publicado 2002-10-09 |
| Also available in English | |
La revista digital de InfoVis.net
La lectura de un libro es un proceso estimulante, pero lento. Tener que analizar muchos de ellos no es tarea fácil. Los motores de búsqueda nos permiten hoy en día buscar el libro adecuado o una parte del mismo, pero no nos ayudan a entenderlo ni nos dan la posibilidad de descubrir patrones o conceptos en un texto arbitrario. TextArc es una herramienta experimental, que permite visualizar textos de forma alternativa. Diseñado por W. Bradford Paley, de Digital Image Design Incorporated con la idea de permitir al usuario “obtener una visión de conjunto acerca de un cuerpo de textos sin formato de tamaño medio, por ejemplo, la cantidad que uno recibe en un solo día” de ficheros ASCII como e-mails, news, etc. Durante muchos años se han utilizado índices, resúmenes, concordancias, léxicos y otros tipos de listas estructuradas. La lingüística computacional ha producido múltiples e interesantes técnicas capaces de producir automáticamente resúmenes, abstracts e identificar ideas y párrafos clave en un texto. También se ha hecho uso de técnicas gráficas para mostrar la dominancia de ciertas palabras en grandes colecciones de documentos. Como ejemplos tenemos los treemaps o los mapas de Kohonen de los que ya hablamos en los números 39 y 51. Hemos visto ya técnicas que combinan el foco y el contexto en una misma vista (números 3 y 85) A diferencia de otras aproximaciones, TextArc tiene en cuenta el orden lineal que todos los textos poseen. Para ello muestra el texto en la pantalla en forma íntegra, como dos espirales concéntricas compuestas de muchas líneas escritas con una fuente de 1 píxel de alto. Cada línea corresponde a su homologa en el texto, incluyendo todas sus palabras. El espaciado, los capítulos, secciones, tipografía, la distribución de las poesías y todas las características “geométricas” del texto se preservan de forma que se convierten en puntos de referencia que ayudan al usuario a identificar secciones particulares del texto. La espiral ocupa la periferia de la representación, dejando el centro para las palabras usadas más frecuentemente (véanse los dibujos adjuntos). De esta forma, las palabras que aparecen más de una vez se dibujan dentro de la espiral, en su posición media, en el “centro de gravedad” de los distintos lugares que ocupa en el texto. Por ejemplo, una palabra que aparece más veces en la parte derecha de la espiral que en la izquierda se hallará más cercana a ese lado. Seleccionando una palabra con el mouse podemos ver un conjunto de rectas que la enlazan con sus posiciones en el texto. Apuntando a una línea del texto, éste muestra su contenido y se pueden ver iluminadas todas las líneas de la espiral exterior donde aparece.
Las palabras se vuelven mas gruesas y más brillantes cuanto mayor es su frecuencia. En la versión para impresora, el tamaño de los tipos codifica también la frecuencia. Hay muchas más posibilidades en este software que merecen un espacio del que no disponemos aquí. Por ello vale la pena jugar con él, utilizando cualquier texto de los disponibles en el proyecto Gutenberg. De especial interés es el “front end” que permite realizar búsquedas de textos en la base de datos de dicho proyecto. Una vez seleccionado el texto de nuestro interés, no se olviden de arrastrarlo y dejarlo caer en la caja apropiada para verlo en modo TextArc. Después de haber jugado durante cierto tiempo con esta elegante herramienta con diversos textos del proyecto Gutenberg se me aparecen algunas sensaciones: TextArc proporciona una forma inusual de aproximarnos a un texto. Puedes localizar las palabras más relevantes, buscar asociaciones entre términos, y hacer listas de las palabras mas frecuentes en un instante. Ver qué personajes aparecen más en una novela y en que parte del texto lo hacen es sencillo y muy intuitivo. Puedes ver, por ejemplo que en un libro la palabra más utilizada aparece sólo en tres capítulos, mientras que en otro está distribuida más o menos regularmente por el texto. Cargar un texto grande lleva un cierto tiempo, empero. Un precio que vale la pena pagar para acceder al mismo en “modo de acceso aleatorio” que te permite analizar visual y efectivamente el documento No estoy seguro de si esta herramienta es la apropiada para indexar la información del escritorio de todo el mundo. El usuario final nos lo dirá una vez esté en el mercado. En cualquier caso, su elegante metáfora del reloj y la facilidad de encontrar patrones en documentos de texto la convierte en un excelente ejemplo de Visualización de Información. Véase también el número 25 que cubre la visualización de software. Hasta cierto punto TextArc comparte características comunes con SeeSoft, una herramienta de visualización de software. Enlaces de este artículo:
|
||||||||||||||||||||||||||||||||||||||
|
Reserva tu ejemplar gratuito |