El segundo paso que tenemos que dar para realizar una visualización de datos es seleccionar el tipo de gráfico con el que vamos a contar nuestra historia. Expresado de otra forma, necesitamos identificar la forma visual con la que queremos codificar nuestros datos numéricos.

Seleccionar: Segunda fase del ciclo del StoryTelling

Seleccionar: Segunda fase del ciclo del StoryTelling

Si tuviera que seleccionar un idea clave para comenzar a hablar de esta fase, la idea sería conseguir alcanzar la máxima simplicidad en nuestra visualización. Es decir, menos es más, pero con matices.

Menos es más solamente donde menos no es bueno.

Frank Lloyd Wright – Arquitecto

¿Qué es una representación visual de datos?

La selección de una representación visual de datos está condicionada por la determinación de dos factores principales:

  • La funcionalidad general de la representación.
  • La característica de proporcionalidad seleccionada.

Funcionalidad

En la actualidad la cantidad de tipos de visualizaciones que existen son inmensas y cada día aparecen más. Sin embargo, y con toda probabilidad, para la mayoría de las representaciones que necesitamos hacer en nuestro trabajo, con muy pocos tipos de gráficos tendremos suficiente.

Las funcionalidades principales a representar visualmente son evoluciones de datos en el tiempo, comparación de diferentes categorías, correlaciones de diferentes variables, y múltiples combinaciones de todas ellas.

Proporcionalidad

Simplificando, una representación visual de datos es la representación proporcional de un conjunto de cifras numéricas mediante una o varias variables visuales. Las principales variables visuales son longitudes, anchuras, áreas, colores, intensidades, posiciones y ángulos. Además, en una misma visualización podemos utilizar una combinación de algunas de ellas.

La Ley de Pareto llevada al extremo

La Ley de Pareto, también conocida como la Ley del 80/20, aplicada a la visualización de datos podría decirnos que con un 20% de los tipos de gráficos actuales seríamos capaces de representar el 80% de nuestras visualizaciones de datos.

Ahora bien, si hablamos de visualización de datos, me atrevería a llevar al extremo la Ley de Pareto y asegurar que prácticamente el 90% de las visualizaciones de datos las podremos generar con tan sólo 3 tipo de gráficos. Además, cumpliremos con el principio de simplicidad ya que esos tres tipos de gráficos son los más simples y conocidos de todos los gráficos existentes.

Los tipos de gráficos a los que me refiero son los siguientes:

  • Textos: Un texto en si mismo puede ser un gráfico perfecto.
  • Líneas: Se trata del tipo de gráfico más basico para representar dos variables.
  • Barras: Quizás los más conocidos. Inventado por William Playfair en 1786

Textos

Los textos los utilizaremos cuando lo que tenemos que visualizar es una cifra concreta. Es decir, necesitamos transmitir una cifra o un porcentaje.

Vemos un ejemplo en el cual se quiere representar la cifra del 80%

Mal ejemplo para representar una cifra

¿Cómo podemos mejorar este gráfico?

A primera vista podría parecer un buen gráfico, pero lo cierto es que quizás los colores no están muy bien seleccionados y la tarta tampoco aporta mucha más información. Así pues, veamos como se podría representar esta misma información utilizando simplemente un texto.

En cuanto a la característica de proporcionalidad podemos jugar con el tamaño de las cifras. El color también es una característica que nos puede ayudar en este tipo de representaciones para añadir emociones. Por ejemplo, utilizar el color rojo podría añadir  cierta emoción negativa.

Veamos como transformaríamos el gráfico anterior utilizando una representación en formato texto.

Buena representación de una cifra

Buena representación de una cifra

No sé que os parece a vosotros pero yo prefiero la segunda representación, y no sólo por ser la que yo propongo, sinceramente pienso que es mucho más clara. Podéis indicar si queréis vuestra opinión en un comentario.

Líneas

La representación de líneas es muy útil para la representación de variaciones o evoluciones de una variable a lo largo del tiempo. Esa sería su funcionalidad general.

En cuanto a las características visuales que utilizamos para este tipo de representación son evidentemente la posición de los puntos con respecto a los ejes, el color de las líneas, el grosor y tipo de linea.

Veamos un ejemplo, en este caso se trata de un gráfico que representa la evolución del gasto social y cuya fuente es el Ministerio de Hacienda.

Mal ejemplo para explicar como utilizar un diagrama de líneas

Mal ejemplo para explicar como utilizar un diagrama de líneas

Aunque el gráfico tiene muchos más defectos simplemente me centraré en los dos principales:

Por el momento tan sólo quiero centrarme en estos aspectos aunque como veréis seguidamente cambian otros matices que veremos en otros Post de mi serie de visualización de datos.

Buen ejemplo para explicar como utilizar un diagrama de líneas

Buen ejemplo para explicar como utilizar un diagrama de líneas

El cambio de diagrama de barras por un diagrama de líneas nos permite ver mucho mejor la evolución de los datos en el tiempo. Además, al representar el eje vertical con una referencia base cero las variaciones anuales ya no aparecen distorsionadas visualmente.

Las posiciones de los puntos serán por tanto los elementos de proporcionalidad, y adicionalmente he utilizado el color y tipo de línea para diferenciar los datos consolidados de la previsión.

Podéis indicar si queréis vuestra opinión en un comentario, pero creo que esta segunda forma de representar los datos mejora mucho el gráfico inicial.

Barras

Los diagramas de barras son muy buenos para la representación de categorías y proporciones entre las mismas. Evidentemente recordando siempre poner correctamente las referencias en los ejes para evitar distorsiones visuales.

Existen muchos tipos de diagramas de barras, simples, apilados, proporcionales, etc.

Veamos un ejemplo partiendo de un gráfico bastante desafortunado, y que curiosamente se encuentra en un curso de visualización de datos. Podéis ver las referencias en el pie del mismo.

Ejemplo para explicar como utilizar un diagrama de Barras

Ejemplo para explicar como utilizar un diagrama de Barras

Siendo sincero, el gráfico anterior es absolutamente la antítesis de una visualización de datos. Tiene tantos defectos que hace daño a la vista. Centrándome tan sólo en sus aspectos de funcionalidad y en sus elementos de proporcionalidad:

  • Funcionalmente la elección de un diagrama de líneas, es francamente una autentica aberración, ya que está uniendo en una misma línea categorías de diferente tipo. Es lo que en educación básica todos entendemos, no se pueden sumar peras con manzanas.
  • En cuanto al uso de los elementos de proporcionalidad, se pierde la información en el momento que cruzamos las líneas y se utiliza una nefasta gama de colores.

Mi propuesta será para este gráfico utilizar un diagrama de barras en el que cada una de las barras representará una categoría diferente.

Ejemplo para explicar como utilizar correctamente un diagrama de Barras

Ejemplo para explicar como utilizar correctamente un diagrama de Barras

Aunque el gráfico cambia sustancialmente otros aspectos, quiero centrarme únicamente en los aspectos funcionales y en los elementos de proporcionalidad:

  • Funcionalmente, la representación de cada una de las categorías de productos en una sola barra apilada nos permite saber exactamente el resultado de la campaña y que producto es el más vendido.
  • Los elementos de proporcionalidad lógicamente son las longitudes de las barras y adicionalmente he utilizado el color para remarcar especialmente la última semana de campaña.

Un pequeño detalle más, el gráfico como puedes ver nos está contando exactamente una historia concreta, y todos los elemento están coordinados para ello. En este caso se trata de centrarnos en la venta de ordenadores de la última semana. Como veremos en las siguientes fases, este gráfico se podría configurar de múltiples  formas para centrarnos en diferentes aspectos de la información disponible.

Nuevamente podéis indicar vuestra opinión en un comentario.

Tipos de Gráficos a evitar

Logicamente existen multitud de diferentes tipos de gráficos que podemos utilizar en nuestras representaciones visuales. Con los tres básicos tenemos cubiertas la mayor parte de los casos con los que podamos encontrarnos, pero lógicamente podemos optar por otras posibilidades.

Ahora bien me gustaría indicar tres tipos de gráficos que debemos evitar en la medida de lo posible y que son los gráficos siguientes:

  • Gráficos de tarta
  • Gráficos 3D
  • Gráficos de doble escala

Gráficos de tarta / Pie-Charts

El problema de los gráficos de tarta es que cuando añadimos muchas categorías a los mismos y las proporciones no son muy diferentes, los humanos no somos demasiado buenos comparando ángulos. Creo que lo veremos mucho mejor con una imagen.

Ejemplo de Gráfico de Tarta

Ejemplo de Gráfico de Tarta

Creo que vemos que es poco claro utilizar un diagrama de tarta, salvo que las proporciones sean muy diferentes.

Gráficos 3D

En mi opinión es mejor olvidarnos de ellos salvo que seamos experimentados diseñadores y seamos capaces de mostrar un buen modelo.

Al margen de esos casos, el 3D tan sólo aportará ruido a la representación gráfica y nos dificultará ver las proporciones de una forma clara. Veamos un ejemplo.

Ejemplo de Gráfico 3D

Ejemplo de Gráfico 3D

Gráficos de doble escala

Los gráficos de doble escala tienen básicamente un problema, visualmente vamos a comparar elementos que tienen diferentes proporciones en una misma visualización. Aunque puede estar bien en un informe técnico, si pretendemos utilizarlo en una presentación en la cual mostraremos el gráfico unos pocos segundos lo único que aportará será confusión a nuestros interlocutores. Veamos un ejemplo.

Ejemplo de Gráfico de doble escala

Ejemplo de Gráfico de doble escala

Como se puede apreciar se trata de un gráfico que tiene tanta carga visual que nos resulta difícil extraer información sin dedicarle bastante tiempo.

Caso practico

Retomando el caso iniciado en el post anterior.

Ejemplo de visualización. ¿Qué opinas de este gráfico?

Ejemplo de visualización. ¿Qué opinas de este gráfico?

Después del análisis realizado en la fase de contextualización disponemos de la siguiente información para comenzar a mejorar nuestro gráfico:

  1. Tenemos que modificar todos los datos a porcentajes base 100 y añadiendo el símbolo de % en todos los casos.
  2. Disponemos de una información de contexto con la que montar nuestra historia.
    • ¿Quién es el destinatario de esta visualización? Las tiendas de música cercanas a la universidad.
    • ¿Qué objetivo queremos alcanzar? Facilitar la labor de optimizar la música que ofertan.
    • ¿Cómo lo conseguiremos? Mostrando de forma clara los gustos musicales y las tendencias de los estilos de música por los que tienen que apostar para optimizar los resultados de venta.

Adicionalmente, ahora sabemos que al tratarse de una evolución de datos de diferentes categorías en el tiempo podríamos optar por utilizar un diagrama de líneas o uno de barras dependiendo de las características que queramos resaltar.

En este caso vamos a representar nuestros datos con un gráfico de líneas. Es decir, vamos a remarcar especialmente la funcionalidad de la evolución en el tiempo.

Los ejes serán los siguientes:

  • Eje horizontal (eje x): El tiempo, años en este caso.
  • Eje vertical (eje y): Valor del porcentaje de cada uno de los estilos de música. Será por tanto la posición la que representará la proporcionalidad.
  • Cada estilo de música será una categoría y por lo tanto cada uno de ellos se representará por un línea independiente. No solo eso, utilizaremos un código de colores para diferenciar cada una de las categorías.

Tras aplicar las modificaciones indicadas anteriormente, nuestro ejemplo quedaría con el siguiente aspecto.

Ejemplo_visualizacion: Aplicando la fase de Selección

Ejemplo_visualizacion: Aplicando la fase de Selección

Como se puede apreciar el gráfico por el momento no es visualmente una maravilla, pero ahora podemos ver de forma clara como están variando las tendencias musicales. 

En las siguientes fases seguiremos mejorando esta representación, pero por el momento me quedaría con esta frente al gráfico inicial del ejemplo. ¿Cuál es tu opinión?

Continuará…

Objetivo

El objetivo de esta serie de post es ayudar a crear visualizaciones con datos potentes, que proporcionen seguridad y confianza en la información, y que nos muestren claramente historias que nos guíen a la acción.

Este es el cuarto de los artículos de una serie que he denominado “Más que datos” y que constará de un total de 7 artículos:

Referencias

Esta serie de Posts está basada principalmente en el libro de Cole Nussbaumer «Storytelling with data»  (2015)

Otras referencias que completan la información contenida en los diferentes Post de la serie se puede encontrar en las siguientes referencias por orden de importancia:

Si detectas alguna referencia adicional no mencionada, te agradecería me enviases un correo para agregarla. Adicionalmente, puedo incluir aquellas referencias que podríais indicarme como material de ampliación del contenido.

Muchas gracias

Categoría:
Storytelling, Visualización de datos
Etiquetas:
,

¡Únete a la conversación! 7 Comentarios

  1. […] el caso iniciado en el post anterior. Habíamos transformado nuestra visualización inicial en un gráfico de líneas, ya que en […]

    Me gusta

    Responder

Deja un comentario