Características de Power BI

Tienes que probar Power BI 

🚀 ¡Descubre el poder de PowerBI !🚀


¡Amantes del análisis de datos y del Data StoryTelling, estoy emocionado de compartir con todos mi más reciente contacto con PowerBI, herramienta líder en visualización de datos! 📊 después de completar un nuevo curso en Platzi.!

Certificado curso de Análisis de Datos con Power BI
Certificado curso de Análisis de Datos con Power BI


¡Permíteme mostrarte algunas de las increíbles características que he aprendido! 🔥, pero para ello en esta ocasión os voy a dirigir a mi Perfil de LinkedIn, al que si os interesa os invito a seguir, y a pedirme ser parte de vuestra red profesional.

Características de Power BI
Características de Power BI

¡Nos vemos en LinkedIn!


#dataanalytics #datastorytelling #powerbi #platzi

Propuesta final de Gráficos

Visualización de Datos: El gráfico adecuado

Fue hace unos pocos días que os hablaba de gráficos en cuarentena en mi post «Errores en Visualización de Datos: Una Crítica Constructiva» y hoy vuelvo al tema de la visualización de datos, ya que otro de los errores típicos al representar información es no usar los gráficos adecuados o no usarlos de la mejor forma. ¿Me acompañas?

Para tratar este tema volveré a coger nuevamente una noticia de hoy mismo en la prensa escrita.

Errores en visualización de datos
Errores en visualización de datos

Hoy (9 de agosto de 2023 en el Heraldo de Aragón) me he encontrado con una noticia que nuevamente me ha llamado la atención. El artículo trataba en este caso de la variación del número de habitantes en Aragón, e ilustraba la noticia con dos gráficas que a mi juicio ni son la mejor elección, ni probablemente las más adecuadas para ilustrar la noticia. Vamos a comenzar viendo la noticia «Aragón registra otro récord de población al sumar 2.068 habitantes en tres meses«

Noticia en el Heraldo de Aragón del 9 de Agosto de 2023
Noticia en el Heraldo de Aragón del 9 de Agosto de 2023

Las dos gráficas que acompañan a la noticia desde luego no reflejan claramente esa variación trimestral, y cabría pensarse que eso es lo que se quiere remarcar en la noticia. Por otra parte, la noticia se acompaña de dos titulares adicionales:

  • «Con 1.353.884 en el padrón y una tendencia al alza, las cifras superan desde hace un año los máximos anotados en 2009»: Haciendo un gran esfuerzo analizando el primero de los gráficos vemos que sí que se podría deducir que efectivamente se cumple, pero si lo que se pretende con un gráfico es ilustrar un dato es necesario que sea claro y no requiera de un esfuerzo de interpretación.
  • «La inmigración supone el principal motor de crecimiento»: Desde luego este titular no se refleja en ninguna de los dos gráficos.

Así pues, la primera conclusión es que los gráficos no facilitan la explicación de la noticia, y no refuerzan el mensaje de los titulares.

Y entonces, si no refuerzan el mensaje de la noticia para que están ahí. ¿Ofrecen información adicional interesante? y ¿Por qué esos dos gráficos combinados? ¿Dan un mayor detalle de información?

La verdad es que habría que preguntar a los editores de la noticia la razón de ocupar casi un 45% del espacio de la noticia en dos gráficos, que en mi opinión lo único que aportan es confusión y una idea ilusoria o equivocada de los datos. Y los tres motivos para argumentar esto son los siguientes:

  • Gráficos claros y simples de entender de un vistazo. Para acompañar a una noticia creo que esta premisa es fundamental.
  • Gráficos con eje sin base cero. Uno de los trucos para manipular la información de forma visual. Probablemente uno de los más utilizados en el ámbito político. Aunque en este caso se podría perdonar añadiendo un matiz.
  • Gráficos mal etiquetados. Para finalizar debemos de revisar todas las etiquetas y elementos que acompañan a un gráfico para que faciliten su lectura, y no sean simplemente un elemento que aporte carga cognitiva sin ningún sentido.

Gráficos claros 🧐

Es evidente que a pesar del gran espacio que ocupan los gráficos en la noticia no están creados para facilitar la comprensión de la misma.

El gráfico de líneas muestra el número de habitantes de Aragón por años que es lo que marca el eje horizontal si bien la línea representada en el gráfico, por su forma, representa un nivel de datos trimestral, luego no encaja. En mi opinión sería más conveniente simplificar la curva y mostrar únicamente los datos indicados en el eje. Dado que el segundo gráfico si que representa los datos trimestralmente, para hacer el vinculo entre ellos ha señalado los puntos sobre el gráfico, añadiendo una carga cognitiva innecesaria.

Por lo que respecta al segundo gráfico por provincias, que si que dispone de los datos a nivel trimestral, tiene el problema de que no usa el mismo rango temporal que el primero. Es decir, el gráfico de línea va de julio 2008 a julio 2023 y el gráfico de barras de abril 2021 a julio 2023.

Otro elemento que dificulta es que los ejes temporales se intercambian entre los gráficos, en el gráfico de líneas es el eje horizontal y en el de barras es el vertical.

En mi opinión un desastre. Así llegados a este punto yo preferiría un gráfico mucho más simplificado que mostrase la evolución de la población.

Gráfica de habitantes de Aragón Simplificada, sin eje de referencia en cero
Gráfica de habitantes de Aragón Simplificada, sin eje de referencia en cero

Y aunque está representación no es la mejor desde luego es más clara, al margen de que soy consciente de que estoy aún incluyendo elementos distorsionares. Entre ellos que los puntos del eje horizontal no están a las mismas distancias temporales, y esto produce distorsiones que habría que corregir.

Gráficos con eje sin base cero 🧐

En mi opinión este es el peor de los errores que se puede cometer con un gráfico y que habría que evitar a toda costa.

El uso de gráficos de líneas y barras con ejes verticales que no comienzan en cero puede llevar a malinterpretaciones y distorsiones. Si el eje vertical no parte desde cero, las diferencias entre valores pueden parecer más pronunciadas de lo que realmente son, lo que puede llevar a percepciones incorrectas de cambios y proporciones. Esto es especialmente crucial cuando se comparan datos entre diferentes series o categorías.

Aunque hay situaciones en las que no comenzar el eje en cero puede ser justificado, como cuando se trata de resaltar pequeñas variaciones, generalmente es preferible mantener el eje vertical en base cero para garantizar una representación precisa y evitar distorsiones engañosas.

Es importante ser transparente y claro en la representación de datos para que las audiencias comprendan correctamente la magnitud de las diferencias y puedan tomar decisiones informadas.

En conclusión, mientras que los gráficos sin eje en base cero pueden a veces parecer más dramáticos, su uso debe ser cuidadoso para no distorsionar la realidad y comprometer la integridad de la visualización de datos.

Gráfica de habitantes de Aragón Simplificada, con eje de referencia en cero
Gráfica de habitantes de Aragón Simplificada, con eje de referencia en cero

Al representar el mismo gráfico en base cero desde luego pierde el interés y lo que cabria preguntarnos es si la noticia es verdaderamente interesante. Así, a pesar de lo indicado, en este caso estaría justificado el uso de la escala sin base cero.

En el segundo gráfico, directamente el uso de la base 130.000, hace que los datos de Teruel prácticamente ni se vean y aquí desde luego no está justificado de ninguna forma produciendo una distorsión total. Si bien en un gráfico de líneas podría justificarse, en una de barras NO.

Gráficos mal etiquetados 🧐

Por último, que podemos decir de la rotulación de los ejes y la coordinación de los dos gráficos, ambos se deberían de complementar y en mi opinión no lo hacen.

Deberían de mantener el significado de los ejes de representación y se debería de prestar atención tanto a las etiquetas erróneas como a su significado. Personalmente datos de trimestre deberían de ser (31/03, 30/06, 30/09, y 31/12) y no (01/01, 01/04, 01/07, 01/10) que me parecen etiquetas malas.

Propuesta de Mejora: Gráfico Correcto y Reflexión Final 🆗🤔

Tras trabajar un poco los gráficos y sin ser una versión completamente final, a la que se podría llegar con un buen conjunto de datos, os paso a indicar los gráficos que yo utilizaría.

Para el gráfico de línea, en este caso seguiría usando la escala sin base cero, pero eliminado el eje vertical para no inducir al error. En este caso esta escala permite visualizar las pequeñas variaciones sobre el número total de habitantes.

Adicionalmente incorporo dos elementos gráficos interesantes:

  • Referencia al periodo COVID
  • Referencia a la franja que posteriormente veremos de forma detallada por provincias.
Gráfica de habitantes de Aragón Simplificada, sin eje de referencia en cero, pero indicando que se ampliara información
Gráfica de habitantes de Aragón Simplificada, sin eje de referencia en cero, pero indicando que se ampliara información

El nuevo gráfico proporciona una visión más clara y precisa de la situación, permitiendo una mejor comprensión de la evolución. Insisto, no sería una versión definitiva ya que deberíamos de corregir la uniformidad de los intervalos del eje horizontal.

Para el segundo gráfico, decididamente cambio las barras por líneas de tendencia entre dos puntos, creo que aporta mucho más, y añado unas barras con el % de variación. Además, se evitan las distorsiones de escala de las barras con base diferente a cero.

Gráfica de variación de habitantes de Aragón por provincias. % variación
Gráfica de variación de habitantes de Aragón por provincias. % variación

En ambos casos el eje horizontal son periodos trimestrales, que etiqueto de una forma más clara.

Conclusión

En conclusión, la visualización de datos no consiste en poner el primer gráfico que se nos ocurra, tenemos que pensar muy bien que gráfico usamos para apoyar la noticia o la información que queremos remarcar.

Os muestro como sería el cambio que yo propondría en un primer análisis, aunque seguramente le volvería a dar una vuelta más.

Propuesta final de Gráficos
Propuesta final de Gráficos

¡La visualización de datos es una poderosa herramienta que debe ser utilizada con responsabilidad y transparencia! 🚀📈

¿Qué opinas? Me encantaría que me dejases tu opinión.

Muchas gracias

Errores en visualización de datos

Errores en Visualización de Datos: Una Crítica Constructiva

Gráficos en Cuarentena: El Gráfico del Periódico 🗞️

En la actualidad estamos constantemente expuestos a datos y estadísticas que intentan persuadirnos y guiarnos en la toma de decisiones. Entre los recursos más utilizados para presentar información se encuentran los gráficos. Sin embargo, no todos los gráficos son creados igual, y en ocasiones, podemos encontrarnos con representaciones visuales que no reflejan fielmente la realidad.

Errores en visualización de datos
Errores en visualización de datos

Hoy (4 de agosto de 2023 en el Heraldo de Aragón) me he encontrado con una noticia que me ha llamado la atención. El artículo trataba sobre las Tasas de notificaciones de reacciones adversas a fármacos en Aragón durante los últimos años. En la noticia, se incluía un gráfico de barras que mostraba las tasas de notificaciones año tras año. A simple vista, el gráfico parecía transmitir información clara y concisa. Sin embargo, al analizarlo más detenidamente, encontré, en mi opinión, varios errores que ponen en cuarentena su contenido.

Noticia en el Heraldo de Aragón del 4 de Agosto de 2023
Noticia en el Heraldo de Aragón del 4 de Agosto de 2023

Errores Detectados 🧐

El primer error que saltó a la vista fue la falta de contexto en los datos presentados. El gráfico mostraba directamente las Tasas del número de notificaciones por año, sin mostrar o indicar la población total en cada período. Esto es crucial cuando se intenta analizar tendencias o comparar cifras entre diferentes años. Para obtener una visión más precisa de la situación, es esencial saber las bases de población sobre las que se están calculando las tasas de notificaciones por 100,000 habitantes. Según he podido extraer de datosmacro.expansion.es y de los datos de la noticia seguidamente os indico la población de los años 2021 y 2022 en Aragón, junto con el resto de datos para construir el gráfico.

AñoPoblación Aragón
(TH)
Notificaciones
Acumuladas Año (N)
Tasa NoticiaTasa de Notificaciones por 100.000 habitantes
(N / TH) x 100.000
Nota
201852,7Sin verificar
201964,64Sin verificar
202038,16Sin verificar
20211.314.159 (dic2021)2.495409,78(2.495 / 1.314.159) x 100.000 = 189,85
20221.315.523 (jun2022)1.73592,42(1.735 / 1.315.523) x 100.000 = 131,88
Tabla parcial de datos. Soy consciente de que los datos de población deberían de ajustarse, y se deberían verificar todos los datos.

Otro problema encontrado en el gráfico está relacionado precisamente con los cálculos de las tasas anuales. Al calcular la tasa de notificaciones por 100,000 habitantes, he descubierto que los datos presentados en el gráfico podrían estar incorrectos, por lo menos en base a los datos que he podido rescatar. Esto genera una distorsión de la realidad y una percepción inexacta de la magnitud del fenómeno en cuestión.

Curiosamente en el Boletín Epidemiológico Semanal de Aragón de la semana 30/2023 podemos ver la siguiente información, que curiosamente coincide con los datos indicados por el periódico.

Captura del Boletín Epidemiológico de Aragón
Captura del Boletín Epidemiológico de Aragón

Para terminar, ¿es un gráfico de barras el más adecuado para mostrar una evolución a lo largo del tiempo?

¿Cuál sería el Gráfico Adecuado? 🌟📈📉

Para mostrar adecuadamente la evolución de las Tasas de notificaciones a lo largo del tiempo y su relación con la población, el gráfico de líneas es la opción más adecuada. Un gráfico de líneas nos permite identificar fácilmente las tendencias y cambios en las tasas de notificaciones por 100,000 habitantes. La línea continua que conecta los puntos de datos nos muestra la variación a lo largo del tiempo de manera más clara y coherente.

¿Quiere decir esto que el gráfico de barras esta mal?, no necesariamente. Por ejemplo, si se quisiera enfatizar las diferencias absolutas entre los años, un gráfico de barras podría ser más adecuado. Sin embargo, en este caso específico, el objetivo principal de la noticia parece ser resaltar la tendencia a lo largo del tiempo, y en ese caso un gráfico de líneas se ajusta mejor a esa necesidad.

Seguidamente os proporciono una infografía extraída de datos.gob.es en la que de forma simplificada podemos ver que gráficos son los más adecuados para simplificar nuestra elección y facilitar a los lectores la comprensión de la información.

Propuesta de Mejora: Gráfico Correcto y Reflexión Final 🆗🤔

A partir de los datos corregidos y la información proporcionada en la fuente original, he rediseñado el gráfico. En base a todo lo comentado hasta ahora un gráfico de líneas mostrará mucho mejor la evolución de las tasas de notificaciones por 100,000 habitantes a lo largo de los años. La comparación entre este gráfico corregido y el gráfico original del periódico es sorprendente. Y esto dejando también en cuarentena los datos anteriores al 2021 para los que no he contrastado la información y que por lo tanto podrían tener también algún error.

Propuesta de Rediseño del Gráfico
Propuesta de Rediseño del Gráfico

El nuevo gráfico proporciona una visión más clara y precisa de la situación, permitiendo una mejor comprensión de la evolución de las Tasas de notificación.

Este caso específico es solo un ejemplo de cómo la mala visualización de datos puede distorsionar la realidad y llevar a conclusiones erróneas. Lamentablemente, este mal uso de los gráficos es generalizado, especialmente en el ámbito político, donde los datos pueden ser manipulados para respaldar ciertas narrativas.

Es importante que como sociedad promovamos una visualización de datos más responsable y precisa.

Conclusión

En conclusión, es fundamental prestar atención a la calidad y precisión de los gráficos que encontramos en los medios y estar conscientes de cómo pueden influir en nuestras percepciones e interpretaciones.

Adoptar un enfoque crítico y analítico nos permitirá tomar decisiones informadas y basadas en la realidad, evitando ser engañados por representaciones visuales inexactas.

¡La visualización de datos es una poderosa herramienta que debe ser utilizada con responsabilidad y transparencia! 🚀📈

Visualización Final aplicando Atributos Preatentivos y Storytelling

Visualizaciones de Datos que brillan ⭐️

En mi anterior post os hablaba de la existencia de lo que se denomina los «Atributos preatentivos» y como estos podían ayudarnos a crear Visualizaciones de Datos mucho más brillantes.

Visualizaciones de datos brillantes en cuanto a que son capaces de remarcar el mensaje que queremos transmitir, facilitándonoslo de un vistazo de forma clara y sencilla.

Como referencia para introducirnos en el mundo de la Visualización de Datos os vuelvo a aconsejar el libro «Storytelling con datos»

de Cole Nussbaumer Knaflic

¿Cuáles son los Atributos Preatentivos?

Decía en mi anterior post que los Atributos Preatentivos son los que nos ayudan a dar fuerza y potencia a nuestras visualizaciones de datos. Es decir, transforman nuestra Visualización de Datos en un potente y eficaz apoyo visual de nuestras ideas. Ahora bien, tal y como indicaba necesitaremos invertir tiempo para usarlos adecuadamente.

Podemos ver que su uso produce un gran cambio es nuestra visualización

Gráfico creado por defecto con NumbersAplicación de Atributos Preatentivos a la Visualización de Datos
Gráfico por defecto vs Gráfico usando Atributos Preatentivos
Aplicación de Atributos Preatentivos a la Visualización de Datos
Aplicación de Atributos Preatentivos a la Visualización de Datos

En el ejemplo vemos con claridad que ahora nuestro producto resalta sobre el resto, y eso es gracias a los Atributos Preatentivos añadidos a la Visualización, pero ¿Qué son estos atributos?

Los Atributos Preatentivos son atributos visuales que nuestro cerebro procesa sin necesitar una acción consciente por nuestra parte, y que dirigen nuestra atención directamente a los puntos concretos que nos interesan.

Existen muchos atributos y como creo que con una imagen lo entenderéis mejor, seguidamente podéis ver los que más me gusta utilizar en mis Visualizaciones. Con la siguiente imagen de forma sencilla podéis ver hacia dónde se dirige vuestra atención en cada caso.

Atributos preatentivos
Atributos preatentivos

En el ejemplo que anteriormente os presentaba he utilizado varios atributos de forma coordinada para remarcar la información que me interesa.

  • Color: He utilizado el color «AZUL» para remarcar exactamente a nuestro producto. Además, le he dado un color neutro «GRIS» al resto de elementos para dejarlos en un segundo plano.
  • Tamaño: He utilizado un tipo de letra de mayor tamaño para nuestro producto.

Incluso podría haber utilizado algún atributo adicional…

  • Anchura: Podría haber representado a nuestro producto con la línea de evolución más gruesa que el resto de productos.

Bien utilizados los atributos preatentivos dirigen la atención de nuestra audiencia al punto concreto que nos interesa.

Añadiéndole storytelling

Para dar el toque final a nuestra visualizaciones falta un importante detalle. Si bien para una presentación en la contemos nuestros datos esta Visualización es suficiente, si tuviera que remitirla a un tercero, o dejarla impresa en un informe deberíamos de añadir uno o varios componentes de Storytelling. Es decir, faltan componentes que añadan la historia que nosotros contaríamos si pudiéramos explicar el gráfico.

Os lo muestro visualmente

Visualización Final aplicando Atributos Preatentivos y Storytelling
Visualización Final aplicando Atributos Preatentivos y Storytelling

En el ejemplo anterior los dos componentes añadidos son:

  • Modificación del título: El cambio del título remarca mucho mejor el contexto del gráfico
  • Argumento: He añadido la razón por la cual los clientes deberían utilizar nuestro producto en lugar del COMPETIDOR C que podría parecer que tiene una mejor evolución.

En resumen

No te conformes con utilizar los gráficos que te ofrecen las herramientas de visualización por defecto, y utiliza de forma inteligente tanto los Atributos Preatentivos como los componentes de Storytelling en tus visualizaciones de datos.

Muchas gracias

Mejorando la Visualización de Datos

Mejorar la Visualización de Datos es muy sencillo, pero muchas veces por no invertir 10 minutos el resultado que mostramos es mucho más pobre del que podríamos conseguir.

Existen muchas referencias pero te aconsejo un libro que es muy sencillo de leer y que nos ofrece claramente las ideas principales para conseguir crear gráficos de primer nivel, se trata de «Storytelling con datos» de Cole Nussbaumer Knaflic.

¿Cuál es el problema?

Principalmente, el problema lo sufrimos por utilizar los gráficos que nos ofrecen por defecto las herramientas de Visualización de Datos. Veamos un ejemplo utilizando Numbers (herramienta similar a Excel en el entorno de Apple)

En el ejemplo que os muestro seguidamente vemos la Evolución de la cuota de mercado de Nuestro Producto frente a los productos de la competencia, y este sería el gráfico que nos ofrece por defecto Numbers.

Gráfico creado por defecto con Numbers
Gráfico creado por defecto con Numbers

Nuestro producto es el de Color Azul tal y como se puede ver en base a la Leyenda del Gráfico. El gráfico lo he realizado en 5 segundos (super eficiente) y el aspecto a primera vista es muy bueno, pero os planteo una pregunta ¿Es un buen gráfico para explicar o presentar la información a un tercero? Es decir, ¿Consideráis qué es un gráfico eficaz?

¿La eficiencia mato a la eficacia?

Pues NO, para mí este gráfico no nos ayuda a explicar o a mostrar cual es la evolución en el mercado de nuestro producto en comparación con la competencia, y mucho menos nos ayudará a dar argumentos para apoyarlo.

Ahora bien, tengo buenas noticias. Existe los que se llaman los Atributos Preatentivos, y son precisamente estos los que nos ayudan a dar fuerza y potencia a nuestras visualizaciones de datos. Es decir, a transformar a nuestra Visualización de Datos en un potente y eficaz apoyo visual de nuestros argumentos de venta (en este caso). Ahora bien, tendremos que invertir 10 minutos tras obtener la opción por defecto que nos ofrecen las herramientas de visualización.

Usando Atributos Preatentivos

El siguiente sería el resultado tras utilizar parámetros preatentivos…

Aplicación de Atributos Preatentivos a la Visualización de Datos
Aplicación de Atributos Preatentivos a la Visualización de Datos

¿Qué te parece? Son los mismos datos, pero evidentemente la Visualización ha cambiado mucho, y aún queda margen de mejora.

¿Podrías indicar cuales son los Atributos Preatentivos que he utilizado? ¿Te parece que el gráfico ha mejorado?

Permanece atento a mis próximas publicaciones, te contaré cuales son los principales Atributos Preatentivos y como puedes utilizarlos. Si te interesa el tema deja un comentario.

Gráfico creado por defecto con NumbersAplicación de Atributos Preatentivos a la Visualización de Datos
Compara el Antes y el Despues

Muchas gracias