Also available in English

Inf@Vis!

La revista digital de InfoVis.net

Visión Activa
por Juan C. Dürsteler [mensaje nº 200]

A pesar de lo que pueda parecer nuestro sistema visual es increíblemente limitado. Vemos con nitidez un parte muy pequeña de nuestro entorno y de forma fragmentaria, a medida que nuestro ojos se mueven a sacudidas escaneándolo. Para mayor decepción, sólo retenemos durante unas fracciones de segundo dos o tres motivos de atención, ligados a la tarea que estamos desempeñando. Estos hechos tienen importantes consecuencias para el diseño y la visualización.

La mayoría de nosotros, cuando miramos a nuestro alrededor, tenemos la sensación de que lo vemos todo con una gran claridad. Se diría que percibimos nuestro entorno en su totalidad, que lo vemos todo a la vez. Esta ilusión está bien lejos de la realidad como es fácil de ver constatando que para leer un libro tenemos que ir mirando las palabras una por una.

Para verlo mejor basta hacer un sencillo ejercicio: mire fijamente la primera palabra del párrafo siguiente (VISIÓN) y, sin dejar de mirarla, intente leer la que hay al otro extremo de la página.

VISIÓN

ACTIVA

¿Sorprendidos? Efectivamente, no es posible leer la palabra situada a la derecha si miramos fijamente la palabra situada a la izquierda. Ello es debido a que la fóvea ocupa una área muy pequeña de la retina (un círculo de unos 0,2 mm de diámetro) que sólo cubre el 1% de su superficie pero, sin embargo, está conectada directamente con el 50% de la corteza visual y, con una alta densidad de fotorreceptores, es responsable de la visión nítida

DusHeadFovealEye.jpg (27776 bytes) DusHeadFovealMouth.jpg (27711 bytes)
Qué vemos y qué no vemos:. La visión sólo es nítida en una pequeña área alrededor del punto de fijación, cuya imagen cae en la fóvea.
 En las imágenes tenemos  una recreación artística de la zona de visión nítida. En la cara izquierda estamos viendo el ojo derecho en visión foveal, en la derecha la boca.
Podemos ver  la ojo  o la boca con claridad pero no ambos a la vez!
El constante movimiento de los ojos  nos permite extraer la información que nos interesa y nos da la ilusión de que lo vemos todo.
Fuente: Imagen Luis Fuentes de Oca. Tratamiento de imagen por el autor.
Pulse sobre la imagen para agrandarla.

Por contra la retina periférica (el resto) con el 99% de área se conecta con tan sólo el 50% restante de la corteza visual, integrando la señales de varias células individuales en una sola fibra nerviosa. 

El resultado es una zona de gran agudeza visual en el centro de la retina  (la fóvea) y una zona de visión periférica con muy baja resolución pero muy sensible al movimiento y a la localización espacial.

Así pues podemos hablar de la visión foveal, la que nos permite ver con gran nitidez, que abarca una ángulo sólido muy pequeño (alrededor de unos 3º de campo visual) lo que hace que tengamos que mirar directamente a un objeto para verlo con claridad, y de la visión periférica, la que procede del resto de la retina, que da muy poca resolución pero es muy sensible al movimiento y nos ayuda a situarnos en el espacio. 

Para soslayar estas importantes restricciones nuestros ojos se están moviendo sutil pero constantemente a "sacudidas" (movimientos sacádicos) para barrer nuestro entorno vital e ir recopilando información que nos permita construir un supuesto mapa mental de nuestro entorno lo que nos proporciona la ilusión de que "lo vemos todo en detalle".

Esto tiene importantes implicaciones para la creación de visualizaciones, gráficos e interfaces persona-ordenador.

Hasta no hace mucho se pensaba que ese mapa mental recogía una imagen del mundo de gran riqueza. El concepto de Visión Activa supone un cambio de paradigma en cuanto que reconoce que solamente existe esa ilusión, que el "mapa" es muy pobre y limitado y que la visión es un proceso dinámico.

El cerebro utiliza solamente los fragmentos de información visual que le son estrictamente necesarios para ejecutar su actividad mental instantánea. En realidad lo que guardamos del entorno en que nos movemos es increíblemente limitado y sólo es gracias a todas las asociaciones a experiencias pasadas que le podemos dar significado y riqueza.

Como explica Collin Ware en su muy recomendable libro "Visual Thinking for Design", la ilusión de tenerlo todo al abasto proviene del hecho de que podemos extraer cualquier detalle del mundo a través de la visión, en cualquier momento que queramos, mediante un movimiento de los ojos que es, literalmente, más veloz que el pensamiento o la conciencia.

El pensamiento visual es un acto dinámico de relación con el entorno en el que se utiliza información guardada en el cerebro e información guardada de forma externa (visualizaciones) que, en palabras de Ware, constituye un baile continuo con el entorno. Entender este baile es fundamental para poder diseñar visualizaciones efectivas. 

Vamos  resumir brevemente algunos de los conceptos clave vertidos en el libro de Ware junto con sus implicaciones para el diseño.

CuatroCarasPerc.jpg (55188 bytes)
Procesos perceptivos
Fuente
: Imagen tratada por el autor
Pulse sobre la imagen para agrandarla

La Percepción.

El acto de la percepción está determinado por dos tipos de procesos que tienen lugar a lo largo de las distintas vías de la corteza visual

  • Ascendente (bottom-up): dirigido por la información visual existente en el patrón de luz que incide sobre la retina del ojo.

  • Descendente (top-down): dirigido por las solicitudes de atención visual que se derivan de las necesidades de las tareas que el cerebro está realizando.

Para entender fácilmente este concepto podemos atender a la imagen de la derecha: Empecemos por la letra V y sigamos el camino que nos marcan las flechas para construir la palabra que forman las letras. Mientras lo hacemos seguiremos percibiendo las caras pero claramente se desvanecen de nuestra conciencia. Por el contrario, si intentamos descifrar la naturaleza de cada cara y sus características faciales, ahora son las flechas y letras las que se desvanecen de nuestra conciencia.

Lo que vemos depende, pues,  por un lado de los patrones de luz que se crean en nuestra retina (abajo - arriba), y de la atención especifica que demanda al cerebro la tarea que nos proponemos (arriba - abajo). El proceso de abajo a arriba proporciona información neural en varias etapas sobre los rasgos de la imagen, que los procesos de arriba a abajo se encargan de filtrar "desvaneciendo" aquellos que no son objeto de nuestra atención.

Veámoslo más en concreto

Proceso ascendente (bottom up) de Integración

Tres conceptos son básicos para entender este proceso

  • Rasgos (features) La información en bruto que sale de los fotorreceptores de la retina se procesa en distintas áreas de la corteza visual que trabajan en paralelo identificando rasgos particulares de la escena representada en la retina. Algunas zonas se especializan en la detección de la orientación otras en la del tamaño mientras que otras responde mejor a los canales que codifican los colores primarios y aún otras se especializan en los elementos que permiten detectar el movimiento o la visión estereoscópica. Así pues cada parte del campo visual es procesado simultáneamente para la detección de esos rasgos elementales, que se pasan a la siguiente fase, descartando la información no relevante (la que no dispara los conjuntos de neuronas apropiados)

  • Patrones (patterns) Los rasgos individuales elementales de la escena detectados en los pasos anteriores se conjugan para formar patrones crecientemente complejos. El espacio visual se divide en regiones de rasgos comunes, por ejemplo color, orientación, tamaño, etc. Los rasgos individuales se conectan en largas cadenas que devienen contornos continuos y, en general van apareciendo patrones constituidos a partir de los rasgos elementales.

  • Objetos (objects). En la fase final, los conjuntos de patrones relevantes procesados a partir de millones de rasgos elementales se terminan destilando a través de los patrones en una serie reducida de objetos visuales, conjuntos de patrones que retienen información relevante de la escena. Estos objetos visuales se guardan en un sistema denominado memoria de trabajo visual, que no es capaz de retener más de tres objetos a la vez.

    La limitada capacidad de la memoria de trabajo visual tiene una importante incidencia en lo que podemos ver y retener. Aunque el conjunto de patrones que forma el objeto visual pueda identificarse como un caballo, no existe una imagen del caballo en nuestro cerebro, sino más bien una red asociativa que es capaz de encontrar un conjunto de experiencias previas relacionadas con el tipo de objeto visual y disparar una serie conceptos asociados al mismo (relincho, mamífero, amigable u hostil según nuestra experiencia pasada, etc.)
BottomUp.jpg (46030 bytes)
Proceso ascendente y descendente en la percepción. En la imagen se representan ambos procesos para la tarea de buscar una piña entre un grupo de frutas.
La detección de rasgos (aqui hemos representado sólo perfiles y color)  evoluciona en generación de patrones y éstos a su vez en la construcción de objetos  visuales.
Todo ello estimulado por la atención que requiere la tarea que el cerebro persigue (detectar la piña) de manera que los estímulos que no se corresponden con lo esperado de una piña tienden a "desvanecerse" (son inhibidos) simbolizado aquí con el desvanecimiento en la detección de rasgos de orientación y color que no se corresponden con los de la piña.
Finalmente estos convergen en unos sencillos patrones que estimulan el concepto de piña asociado a ellos en nuestro cerebro incluyendo las múltiples asociaciones a "piña" acumuladas a lo largo de nuestra experiencia en el tiempo, como "dulce", "acida" "rugosa" etc.
Fuente: representación elaborada por el autor.
Pulse sobre la imagen para agrandarla

Los pocos objetos visuales que aparecen en la memoria de trabajo son precisamente aquellos que responden mejor a la tarea que necesitamos realizar en ese momento. Ahora veremos que cuando decimos responden es prácticamente de forma literal:

Proceso descendente (top down) dirigido por la Atención 

El proceso ascendente se puede resumir como se puede observar en el gráfico adjunto. A partir de la imagen retiniana (una serie de manchas de colores en la retina que corresponden en este caso a un conjunto de frutas) se suceden los procesos de detección de rasgos , generación de patrones hasta la creación de objetos visuales. La flecha etiquetada "Integración" representa la evolución de los os pasos del proceso ascendente

 Mientras el proceso bottom-up tiene lugar, se da simultáneamente el proceso top-down.  Este proceso filtra las señales del proceso ascendente utilizando la tarea cognitiva en curso simbolizado por la flecha etiquetada como "Atención".

Los procesos top-down se describen en la literatura asociados al concepto de atención. Estos procesos se rigen por la necesidad de cumplir una tarea en cada momento. Así si estamos buscando un objeto con ciertas características (color, orientación, etc.) las neuronas especializadas en esas características verán reforzada su respuesta (de hecho emitirán señales que inhiben la respuesta de otras neuronas no especializadas en la misma) por los procesos de arriba a abajo de manera que su señal será más intensa que la de aquellas que están detectando otra característica.

Lo mismo ocurre con la generación de patrones y con la fusión de éstos en objetos visuales. Si, por ejemplo, estamos buscando una piña entre un conjunto de frutas (como en la representación adjunta), las neuronas que detectan amarillo, marrón y verde verán reforzada su señal ("gritarán" más alto).

Igualmente las neuronas especializadas en detectar la orientación reforzarán su señal cuando en la imagen haya rasgos cruzados en forma romboide y los patrones compatibles con formas redondas incrementarán su respuesta en caso de surgir en la imagen en detrimento de otros compatibles con cilindros u otras formas no relevantes.

Finalmente sólo aparecerán en la memoria de trabajo aquellos objetos visuales que puedan parecerse a una esferoide reticulado con una mancha verde.

Quizá lo mas fascinante de todo esto es que es un proceso dinámico en el que la memoria de trabajo mantiene objetos durante muy poco tiempo, solamente aquel necesario para seguir procesando la atención y aceptar un objeto o descartarlo en función de la tarea.

Finalmente todo esto constituye un proceso dinámico e iterativo, de tal forma que el cerebro, movido por la atención hacia la tarea en curso, dirige los movimientos sacádicos de los ojos hacia aquellas partes de la imagen más relevantes realimentando continuamente el proceso hasta satisfacer el objetivo. Así si estamos en una tienda de deportes buscando una pelota de tenis, aparecerán muchas veces objetos redondos en la memoria de trabajo, pero el sistema visual estará continuamente realimentando la gestión de la mirada para encontrar objetos peludos, redondos y amarillos de forma dinámica, usando el contenido de la memoria de trabajo en función de los objetos visuales que irán apareciendo.

Ello explica por qué muchas veces no "vemos" objetos reales que están claramente dentro de nuestro campo visual, pero no dentro de nuestra esfera de interés o atención como es el caso de los videos de la web dothettest.

También permite entender por qué los atributos visuales (orientación líneas, las áreas de color etc) emergen como elementos de atención y tienden a formar patrones fácilmente asociables a conceptos (variables visuales) y por ello utilizables en los gráficos.

Hemos querido dar aquí una breve exposición de algunos de los últimos avances en el estudio del proceso cognitivo de la visión. Resultamos estar mucho más limitados de lo que creemos. Ello ha de ser fuente de conocimiento cuando hacemos representaciones que pretenden hacer más comprensible la información existente o cuando intentamos transmitir un mensaje coherente de una forma fácil de entender.

Enlaces de este artículo:

http://www.infovis.net/printRec.php?rec=persona&lang=1#ColinWare   Breve semblanza de Colin ware
http://www.dothetest.co.uk/   Sitio web con test de consciencia
© Copyright InfoVis.net 2000-2018