Also available in English

Inf@Vis!

La revista digital de InfoVis.net

Gramática Gráfica
por Juan C. Dürsteler [mensaje nº 74]

La creación de un gráfico cuantitativo tiene unos componentes y una gramática bien definidos. Conocerlos ayuda a separar las partes de un gráfico y a elegir apropiadamente su representación.

La especificación de un gráfico, por complejo que éste sea, no deja de ser susceptible de expresarse mediante el lenguaje. Leland Wilkinson, profesor de estadística en la NorthWestern University y programador del paquete estadístico SYSTAT  que dio lugar a la fundación de la empresa SYSTAT Inc. de la que fue fundador, ha escrito recientemente un libro titulado “The Grammar of Graphics” “La gramática de los gráficos”. 

No nos vamos a adentrar aquí en las complejidades de la construcción de una gramática gráfica. Los interesados pueden recurrir al propio libro de Wilkinson o el libro “Visual Language Theory” editado por Marriot y Meyer.

Lo que me interesa compartir aquí es la descomposición que Wilkinson hace de los componentes de un gráfico y que tienen un significado muy concreto en su aproximación a la gramática gráfica. Para él las especificaciones se dividen en 7 componentes que denomina: 

  1. DATA (Datos): un conjunto de operaciones que crean variables a partir de conjuntos de datos. Un conjunto de datos se diferencia de los datos en bruto porque tiene una estructura, por ejemplo una tabla o una base de datos. Una variable puede ser un subconjunto del conjunto de datos (una columna de la tabla).

  2. TRANS (Transformaciones): transformaciones que se aplican sobre las variables (por ejemplo la ordenación, el porcentaje, el promedio)

  3. FRAME (Marco): un conjunto de variables, relacionadas por operadores que definen un espacio. Son la selección concreta de variables que escogemos para representar.

  4. SCALE (Escala): Transformaciones geométricas que definen la escala en la que representamos, por ejemplo escala logarítmica, lineal, probabilística.

  5. COORD (Coordenadas): El sistema coordenado a utilizar, entre ellas se cuentan las .cartesianas, polares, etc

  6. GRAPH (Grafo): los elementos a dibujar (por ejemplo puntos, rectángulos u otras formas geométricas) y sus atributos estéticos (color, patrón de rellenado...).

  7. GUIDE (Guías): elementos que ponen dentro de contexto los grafos, como ejes, leyendas...

Un ejemplo de esta descomposición en componentes se puede ver en el siguiente diagrama:

Componentes de un gráfico. 
Nótese que algunos son visibles (Grafo, Guías) y otros no, aunque son imprescindibles para realizar el gráfico, como Trans, Scale o Data. 

DATA

País Hombres Mujeres
Rusia 62 75
Finlandia 67 76
Alemania 68 75
Austria 68 76
Canadá 69 77
EE.UU. 69 77
Francia 69 77
Inglaterra 69 76
Japón 71 77
Suecia 72 78
Los datos en bruto son los de cada país por separado. 
Al haberlos estructurado en una tabla pasan a ser un conjunto de datos.
Cada columna se puede asociar a una variable
FRAME (marco)

El espacio definido por la combinación de  variables a representar.
En este caso País x Hombres + Mujeres.

TRANS

El conjunto de datos se ha ordenado por edad creciente de los hombres

SCALE

Utilizamos una escala lineal con mínimo en 60 y máximo en 80.
La escala vertical es cuantitativa.
La escala horizontal es categórica.

COORD

Coordenadas Cartesianas

GRAPH

Rectángulos con colores degradados

GUIDE

Leyenda con la codificación de la relación  variables y colores.
Eje Vertical con la escala cuantitativa
Eje Horizontal con los nombre de la escala categórica

Muy bien, ya lo sabemos, pero ¿en qué nos ayuda esto cuando ya tenemos un programa de representación gráfica (como Excel por ejemplo) y tenemos que enfrentarnos a la tarea de realizar un gráfico?.

El anterior esquema es muy potente para realizar gráficos porque abstrae los detalles concretos y se fija en los elementos de que se compone cualquier gráfico estadístico por diferente que sea a los que conocemos.

Por tanto, podemos considerar cada uno de ellos por separado al aplicar la operativa que discutimos la semana pasada (véase el número anterior). Para no aburrir al lector me centraré en dos aspectos de los que se abusa a menudo: las guías y los atributos estéticos del grafo, quizá porque son los elementos más visibles 

Escalas Anotaciones

Leyenda

Vertical
Horizontal
Interior...

Eje

Ninguno
Simple
Doble
Retícula

Texto

Titulo
Subtítulo

Forma

Línea
Rectángulo
Elipse
Flecha
Etiqueta...

Algunas de las guías que se utilizan 
en gráficos estadísticos

Guías: nos proporcionan la interpretación para decodificar el gráfico. 

Si ponemos colores asociados a distintas variables, necesitamos una leyenda de colores para saber cuál es cuál. Los ejes nos permiten saber cuales son los valores entre los que nos movemos. Las retículas nos permiten situar con precisión el valor de los grafos. 

Sin embargo, en muchas ocasiones lo que más salta a la vista de un gráfico es la retícula con unos robustos ejes dotados de una numeración excesivamente grande. 

A veces olvidamos de que el objetivo de un gráfico es enseñar los datos. Por ello Edward Tufte propone la denominada relación datos/tinta que es la división entre la cantidad de tinta usada para representar datos y la tinta usada en total para el gráfico. 

Lo que Tufte propone no es, por supuesto, que nos pongamos a contar el área recubierta de tinta sino que consideremos cuanta tinta que no pertenece a los datos podemos borrar sin que se pierda información. Muchas retículas imitando el papel milimetrado desaparecerían... Las guías no son el gráfico, son sólo elementos auxiliares que no deben competir con los datos, sino complementarlos.

Atributos estéticos del grafo.
Forma  Superficie Movimiento Sonido Texto
Posición

Tamaño

Forma

Deformación

Color

Textura

Transparencia

Dirección

Velocidad

Aceleración

Tono

Volumen

Ritmo

Etiqueta

Algunos de los atributos estéticos de los grafos 
(la representación gráfica de los datos) según L. Wilkinson

Los colores, las tramas, los efectos 3 D son también lo más visible de un gráfico y a menudo se utilizan abusivamente.

 Colores muy saturados uno al lado del otro en gráficos de áreas, por ejemplo, distraen la atención de lo que verdaderamente importa, las variables

Lo mismo se puede decir de las tramas con patrones de gran contraste y densidad que producen efectos ópticos de apariencia vibratoria notablemente molestos y que, de nuevo centran la atención en lo que no interesa.

Y es que el buen diseño es el que está, pero no se nota. El buen gráfico es el que ayuda a comprender, el que permite exclamar ¡Ajá!, aunque su estructura, colores, etc pasen desapercibidos.


Enlaces de este artículo:

http://www.spss.com/research/wilkinson/  
http://www.spssscience.com/systat/  
http://www.infovis.net/printRec.php?rec=llibre&lang=1#GrammarGraphics  
http://www.infovis.net/printRec.php?rec=llibre&lang=1#VisualLanguage  
http://www.infovis.net/printMag.php?num=73&lang=1  
© Copyright InfoVis.net 2000-2013