Visualización de Datos: El gráfico adecuado
Fue hace unos pocos días que os hablaba de gráficos en cuarentena en mi post «Errores en Visualización de Datos: Una Crítica Constructiva» y hoy vuelvo al tema de la visualización de datos, ya que otro de los errores típicos al representar información es no usar los gráficos adecuados o no usarlos de la mejor forma. ¿Me acompañas?
Para tratar este tema volveré a coger nuevamente una noticia de hoy mismo en la prensa escrita.
Hoy (9 de agosto de 2023 en el Heraldo de Aragón) me he encontrado con una noticia que nuevamente me ha llamado la atención. El artículo trataba en este caso de la variación del número de habitantes en Aragón, e ilustraba la noticia con dos gráficas que a mi juicio ni son la mejor elección, ni probablemente las más adecuadas para ilustrar la noticia. Vamos a comenzar viendo la noticia «Aragón registra otro récord de población al sumar 2.068 habitantes en tres meses«
Las dos gráficas que acompañan a la noticia desde luego no reflejan claramente esa variación trimestral, y cabría pensarse que eso es lo que se quiere remarcar en la noticia. Por otra parte, la noticia se acompaña de dos titulares adicionales:
- «Con 1.353.884 en el padrón y una tendencia al alza, las cifras superan desde hace un año los máximos anotados en 2009»: Haciendo un gran esfuerzo analizando el primero de los gráficos vemos que sí que se podría deducir que efectivamente se cumple, pero si lo que se pretende con un gráfico es ilustrar un dato es necesario que sea claro y no requiera de un esfuerzo de interpretación.
- «La inmigración supone el principal motor de crecimiento»: Desde luego este titular no se refleja en ninguna de los dos gráficos.
Así pues, la primera conclusión es que los gráficos no facilitan la explicación de la noticia, y no refuerzan el mensaje de los titulares.
Y entonces, si no refuerzan el mensaje de la noticia para que están ahí. ¿Ofrecen información adicional interesante? y ¿Por qué esos dos gráficos combinados? ¿Dan un mayor detalle de información?
La verdad es que habría que preguntar a los editores de la noticia la razón de ocupar casi un 45% del espacio de la noticia en dos gráficos, que en mi opinión lo único que aportan es confusión y una idea ilusoria o equivocada de los datos. Y los tres motivos para argumentar esto son los siguientes:
- Gráficos claros y simples de entender de un vistazo. Para acompañar a una noticia creo que esta premisa es fundamental.
- Gráficos con eje sin base cero. Uno de los trucos para manipular la información de forma visual. Probablemente uno de los más utilizados en el ámbito político. Aunque en este caso se podría perdonar añadiendo un matiz.
- Gráficos mal etiquetados. Para finalizar debemos de revisar todas las etiquetas y elementos que acompañan a un gráfico para que faciliten su lectura, y no sean simplemente un elemento que aporte carga cognitiva sin ningún sentido.
Gráficos claros 🧐
Es evidente que a pesar del gran espacio que ocupan los gráficos en la noticia no están creados para facilitar la comprensión de la misma.
El gráfico de líneas muestra el número de habitantes de Aragón por años que es lo que marca el eje horizontal si bien la línea representada en el gráfico, por su forma, representa un nivel de datos trimestral, luego no encaja. En mi opinión sería más conveniente simplificar la curva y mostrar únicamente los datos indicados en el eje. Dado que el segundo gráfico si que representa los datos trimestralmente, para hacer el vinculo entre ellos ha señalado los puntos sobre el gráfico, añadiendo una carga cognitiva innecesaria.
Por lo que respecta al segundo gráfico por provincias, que si que dispone de los datos a nivel trimestral, tiene el problema de que no usa el mismo rango temporal que el primero. Es decir, el gráfico de línea va de julio 2008 a julio 2023 y el gráfico de barras de abril 2021 a julio 2023.
Otro elemento que dificulta es que los ejes temporales se intercambian entre los gráficos, en el gráfico de líneas es el eje horizontal y en el de barras es el vertical.
En mi opinión un desastre. Así llegados a este punto yo preferiría un gráfico mucho más simplificado que mostrase la evolución de la población.
Y aunque está representación no es la mejor desde luego es más clara, al margen de que soy consciente de que estoy aún incluyendo elementos distorsionares. Entre ellos que los puntos del eje horizontal no están a las mismas distancias temporales, y esto produce distorsiones que habría que corregir.
Gráficos con eje sin base cero 🧐
En mi opinión este es el peor de los errores que se puede cometer con un gráfico y que habría que evitar a toda costa.
El uso de gráficos de líneas y barras con ejes verticales que no comienzan en cero puede llevar a malinterpretaciones y distorsiones. Si el eje vertical no parte desde cero, las diferencias entre valores pueden parecer más pronunciadas de lo que realmente son, lo que puede llevar a percepciones incorrectas de cambios y proporciones. Esto es especialmente crucial cuando se comparan datos entre diferentes series o categorías.
Aunque hay situaciones en las que no comenzar el eje en cero puede ser justificado, como cuando se trata de resaltar pequeñas variaciones, generalmente es preferible mantener el eje vertical en base cero para garantizar una representación precisa y evitar distorsiones engañosas.
Es importante ser transparente y claro en la representación de datos para que las audiencias comprendan correctamente la magnitud de las diferencias y puedan tomar decisiones informadas.
En conclusión, mientras que los gráficos sin eje en base cero pueden a veces parecer más dramáticos, su uso debe ser cuidadoso para no distorsionar la realidad y comprometer la integridad de la visualización de datos.
Al representar el mismo gráfico en base cero desde luego pierde el interés y lo que cabria preguntarnos es si la noticia es verdaderamente interesante. Así, a pesar de lo indicado, en este caso estaría justificado el uso de la escala sin base cero.
En el segundo gráfico, directamente el uso de la base 130.000, hace que los datos de Teruel prácticamente ni se vean y aquí desde luego no está justificado de ninguna forma produciendo una distorsión total. Si bien en un gráfico de líneas podría justificarse, en una de barras NO.
Gráficos mal etiquetados 🧐
Por último, que podemos decir de la rotulación de los ejes y la coordinación de los dos gráficos, ambos se deberían de complementar y en mi opinión no lo hacen.
Deberían de mantener el significado de los ejes de representación y se debería de prestar atención tanto a las etiquetas erróneas como a su significado. Personalmente datos de trimestre deberían de ser (31/03, 30/06, 30/09, y 31/12) y no (01/01, 01/04, 01/07, 01/10) que me parecen etiquetas malas.
Propuesta de Mejora: Gráfico Correcto y Reflexión Final 🆗🤔
Tras trabajar un poco los gráficos y sin ser una versión completamente final, a la que se podría llegar con un buen conjunto de datos, os paso a indicar los gráficos que yo utilizaría.
Para el gráfico de línea, en este caso seguiría usando la escala sin base cero, pero eliminado el eje vertical para no inducir al error. En este caso esta escala permite visualizar las pequeñas variaciones sobre el número total de habitantes.
Adicionalmente incorporo dos elementos gráficos interesantes:
- Referencia al periodo COVID
- Referencia a la franja que posteriormente veremos de forma detallada por provincias.
El nuevo gráfico proporciona una visión más clara y precisa de la situación, permitiendo una mejor comprensión de la evolución. Insisto, no sería una versión definitiva ya que deberíamos de corregir la uniformidad de los intervalos del eje horizontal.
Para el segundo gráfico, decididamente cambio las barras por líneas de tendencia entre dos puntos, creo que aporta mucho más, y añado unas barras con el % de variación. Además, se evitan las distorsiones de escala de las barras con base diferente a cero.
En ambos casos el eje horizontal son periodos trimestrales, que etiqueto de una forma más clara.
Conclusión
En conclusión, la visualización de datos no consiste en poner el primer gráfico que se nos ocurra, tenemos que pensar muy bien que gráfico usamos para apoyar la noticia o la información que queremos remarcar.
Os muestro como sería el cambio que yo propondría en un primer análisis, aunque seguramente le volvería a dar una vuelta más.
¡La visualización de datos es una poderosa herramienta que debe ser utilizada con responsabilidad y transparencia! 🚀📈
¿Qué opinas? Me encantaría que me dejases tu opinión.
Muchas gracias