Also available in English

Inf@Vis!

La revista digital de InfoVis.net

Gram√°tica Gr√°fica
por Juan C. D√ľrsteler [mensaje nļ 74]

La creación de un gráfico cuantitativo tiene unos componentes y una gramática bien definidos. Conocerlos ayuda a separar las partes de un gráfico y a elegir apropiadamente su representación.

La especificaci√≥n de un gr√°fico, por complejo que √©ste sea, no deja de ser susceptible de expresarse mediante el lenguaje. Leland Wilkinson, profesor de estad√≠stica en la NorthWestern University y programador del paquete estad√≠stico SYSTAT¬† que dio lugar a la fundaci√≥n de la empresa SYSTAT Inc. de la que fue fundador, ha escrito recientemente un libro titulado ‚ÄúThe Grammar of Graphics‚ÄĚ ‚ÄúLa gram√°tica de los gr√°ficos‚ÄĚ.¬†

No nos vamos a adentrar aqu√≠ en las complejidades de la construcci√≥n de una gram√°tica gr√°fica. Los interesados pueden recurrir al propio libro de Wilkinson o el libro ‚ÄúVisual Language Theory‚ÄĚ editado por Marriot y Meyer.

Lo que me interesa compartir aquí es la descomposición que Wilkinson hace de los componentes de un gráfico y que tienen un significado muy concreto en su aproximación a la gramática gráfica. Para él las especificaciones se dividen en 7 componentes que denomina: 

  1. DATA (Datos): un conjunto de operaciones que crean variables a partir de conjuntos de datos. Un conjunto de datos se diferencia de los datos en bruto porque tiene una estructura, por ejemplo una tabla o una base de datos. Una variable puede ser un subconjunto del conjunto de datos (una columna de la tabla).

  2. TRANS (Transformaciones): transformaciones que se aplican sobre las variables (por ejemplo la ordenación, el porcentaje, el promedio)

  3. FRAME (Marco): un conjunto de variables, relacionadas por operadores que definen un espacio. Son la selección concreta de variables que escogemos para representar.

  4. SCALE (Escala): Transformaciones geométricas que definen la escala en la que representamos, por ejemplo escala logarítmica, lineal, probabilística.

  5. COORD (Coordenadas): El sistema coordenado a utilizar, entre ellas se cuentan las .cartesianas, polares, etc

  6. GRAPH (Grafo): los elementos a dibujar (por ejemplo puntos, rectángulos u otras formas geométricas) y sus atributos estéticos (color, patrón de rellenado...).

  7. GUIDE (Guías): elementos que ponen dentro de contexto los grafos, como ejes, leyendas...

Un ejemplo de esta descomposición en componentes se puede ver en el siguiente diagrama:

Componentes de un gráfico. 
Nótese que algunos son visibles (Grafo, Guías) y otros no, aunque son imprescindibles para realizar el gráfico, como Trans, Scale o Data. 

DATA

País Hombres Mujeres
Rusia 62 75
Finlandia 67 76
Alemania 68 75
Austria 68 76
Canad√° 69 77
EE.UU. 69 77
Francia 69 77
Inglaterra 69 76
Japón 71 77
Suecia 72 78
Los datos en bruto son los de cada país por separado. 
Al haberlos estructurado en una tabla pasan a ser un conjunto de datos.
Cada columna se puede asociar a una variable
FRAME (marco)

El espacio definido por la combinación de  variables a representar.
En este caso País x Hombres + Mujeres.

TRANS

El conjunto de datos se ha ordenado por edad creciente de los hombres

SCALE

Utilizamos una escala lineal con mínimo en 60 y máximo en 80.
La escala vertical es cuantitativa.
La escala horizontal es categórica.

COORD

Coordenadas Cartesianas

GRAPH

Rect√°ngulos con colores degradados

GUIDE

Leyenda con la codificación de la relación  variables y colores.
Eje Vertical con la escala cuantitativa
Eje Horizontal con los nombre de la escala categórica

Muy bien, ya lo sabemos, pero ¬Ņen qu√© nos ayuda esto cuando ya tenemos un programa de representaci√≥n gr√°fica (como Excel por ejemplo) y tenemos que enfrentarnos a la tarea de realizar un gr√°fico?.

El anterior esquema es muy potente para realizar gráficos porque abstrae los detalles concretos y se fija en los elementos de que se compone cualquier gráfico estadístico por diferente que sea a los que conocemos.

Por tanto, podemos considerar cada uno de ellos por separado al aplicar la operativa que discutimos la semana pasada (v√©ase el n√ļmero anterior). Para no aburrir al lector me centrar√© en dos aspectos de los que se abusa a menudo: las gu√≠as y los atributos est√©ticos del grafo, quiz√° porque son los elementos m√°s visibles¬†

Escalas Anotaciones

Leyenda

Vertical
Horizontal
Interior...

Eje

Ninguno
Simple
Doble
Retícula

Texto

Titulo
Subtítulo

Forma

Línea
Rect√°ngulo
Elipse
Flecha
Etiqueta...

Algunas de las guías que se utilizan 
en gráficos estadísticos

Guías: nos proporcionan la interpretación para decodificar el gráfico. 

Si ponemos colores asociados a distintas variables, necesitamos una leyenda de colores para saber cuál es cuál. Los ejes nos permiten saber cuales son los valores entre los que nos movemos. Las retículas nos permiten situar con precisión el valor de los grafos. 

Sin embargo, en muchas ocasiones lo que más salta a la vista de un gráfico es la retícula con unos robustos ejes dotados de una numeración excesivamente grande. 

A veces olvidamos de que el objetivo de un gr√°fico es ense√Īar los datos. Por ello Edward Tufte propone la denominada relaci√≥n datos/tinta que es la divisi√≥n entre la cantidad de tinta usada para representar datos y la tinta usada en total para el gr√°fico.¬†

Lo que Tufte propone no es, por supuesto, que nos pongamos a contar el área recubierta de tinta sino que consideremos cuanta tinta que no pertenece a los datos podemos borrar sin que se pierda información. Muchas retículas imitando el papel milimetrado desaparecerían... Las guías no son el gráfico, son sólo elementos auxiliares que no deben competir con los datos, sino complementarlos.

Atributos estéticos del grafo.
Forma  Superficie Movimiento Sonido Texto
Posición

Tama√Īo

Forma

Deformación

Color

Textura

Transparencia

Dirección

Velocidad

Aceleración

Tono

Volumen

Ritmo

Etiqueta

Algunos de los atributos estéticos de los grafos 
(la representaci√≥n gr√°fica de los datos)¬†seg√ļn L. Wilkinson

Los colores, las tramas, los efectos 3 D son también lo más visible de un gráfico y a menudo se utilizan abusivamente.

 Colores muy saturados uno al lado del otro en gráficos de áreas, por ejemplo, distraen la atención de lo que verdaderamente importa, las variables. 

Lo mismo se puede decir de las tramas con patrones de gran contraste y densidad que producen efectos ópticos de apariencia vibratoria notablemente molestos y que, de nuevo centran la atención en lo que no interesa.

Y es que el buen dise√Īo es el que est√°, pero no se nota. El buen gr√°fico es el que ayuda a comprender, el que permite exclamar ¬°Aj√°!, aunque su estructura, colores, etc pasen desapercibidos.


Enlaces de este artŪculo:

http://www.spss.com/research/wilkinson/  
http://www.spssscience.com/systat/  
http://www.infovis.net/printRec.php?rec=llibre&lang=1#GrammarGraphics  
http://www.infovis.net/printRec.php?rec=llibre&lang=1#VisualLanguage  
http://www.infovis.net/printMag.php?num=73&lang=1  
© Copyright InfoVis.net 2000-2018