Estoy muy contento de compartir con todos que he finalizado con éxito el curso de certificación en Visualización de datos ofrecido por Platzi y en colaboración con Latinometrics. Quiero agradecer a ambos por la excelente estructura y contenido del curso, que me ha permitido adquirir y mejorar mis habilidades en esta área tan importante. Aquí os muestro el certificado que he obtenido…
Certificado en Visualización de Datos Platzi y Latinometrics
Para completar el certificado, seguidamente os muestro un pequeño proyecto que añadiré en el área de proyectos del curso en Platzi.
Proyecto: 🍺 El consumo de alcohol en Latinoamérica: Un análisis preocupante
🚨 El consumo de alcohol es un tema que afecta a muchas sociedades en todo el mundo, y Latinoamérica no es la excepción. A través de este pequeño proyecto, quiero mostraros algunos datos alarmantes sobre el consumo de alcohol en Latinoamérica. 🚨
😨 Introducción: Una realidad alarmante
El consumo de alcohol en Latinoamérica sigue siendo un problema significativo, con diversas implicaciones para la salud pública y la seguridad vial. A pesar de los esfuerzos por reducir su consumo, los datos muestran que se está lejos de alcanzar resultados positivos. Hoy quiero enfocar este análisis en los 10 países con mayor consumo de alcohol y en particular, en Argentina, un país que destaca negativamente en esta problemática.
📊 Datos y visualizaciones
Top 10 de países con mayor consumo de alcohol en Latinoamérica Aquí presento un gráfico de barras que ilustra los diez países de nuestra región con el mayor consumo de alcohol per capita.
Gráfico de la Top 10 de países que consumen alcohol en Latinoamérica
Datos preocupantes sobre Argentina y el alcohol En Argentina, país con el mayor consumo de alcohol en Latinoamérica, se observan dos datos especialmente alarmantes.
Argentina y el Alcohol dos datos muy preocupantes
El 25% de los accidentes de coche mortales son producidos por conductores a los que se les detecto alcohol en sangre.
El consumo de alcohol comienza a los 13 años, y la tendencia es a que esta edad disminuya. Estos datos reflejan una problemática que requiere atención y acciones urgentes para mejorar la situación.
⭐️ Principios fundamentales de una buena visualización de datos
Para concluir este post, quiero compartir con vosotros los cinco principios que considero fundamentales para una buena visualización de datos, principios que he aprendido y que considero esenciales para cualquier proyecto en esta área:
Claridad: La visualización debe ser clara y fácil de entender. Evita el uso de gráficos complicados y mantén el diseño limpio.
Precisión: Asegúrate de que los datos están representados con precisión, sin distorsionar la realidad.
Relevancia: Elige los datos y las visualizaciones que sean más relevantes para el mensaje que quieres transmitir.
Consistencia: Utiliza un estilo coherente en todas tus visualizaciones para que el público objetivo pueda seguir fácilmente el flujo de la información.
Estética: Una buena visualización de datos también debe ser visualmente atractiva para captar y mantener la atención de la audiencia.
Estos principios no solo ayudan a mejorar la comprensión de los datos, sino que también contribuyen a contar una historia más efectiva y convincente. Gracias a Platzi y Latinometrics por este excelente curso, ahora me siento más preparado para aplicar estos principios en mis proyectos futuros.
El desarrollo de esta semana y la herramientas utilizadas han sido los siguientes:
Presentación del caso de la semana. Pequeño diseño / Metáfora Visual o pieza gráfica que represente el tema. Utilizare Procreate.
Resumen de las ideas principales del artículo. Herramienta utilizada ChatGPT 4o 🤖
Visual Thinking. Generación de un Mapa Mental (Mind Map) en base a las ideas 💡 del resumen. La herramienta utilizada Procreate.
Análisis 📈 de los datos. Determinación del major gráfico 📈 a utilizar para este caso. Os explicaré el tipo de gráfico “Slope Chart”
Visualización de los datos.📊 Hoy os presentaré Flourish Studio, una herramienta web de Visualización de Datos que me encanta.
🎙️ Presentación del caso
#MakeoverMonday, sin duda alguna, es una fuente de inspiración para aplicar la práctica deliberada y forzarnos a desarrollar nuestras habilidades en el apasionante mundo de la Visualización de Datos y aprovechando el tema en practicar también el Visual Thinking.
Para empezar a inspirarnos en el tema y con iPad en mano, he creado lo que sería la presentación del tema de la semana y que a la postre será la imagen central del Mapa Mental que crearé relacionado con este tema.
#RetoVTVD2024 week 21/2024 #makeovermonday Olimpiadas París 2024
En la semana 21 / 2024 los datos que se nos proporcionan es un articulo en el que se analizan unos datos de tendencia de la confianza de los franceses en los juegos olímpicos que se celebran en París en 2024.
💡 Resumen de las ideas principales
Para realizar el resumen del artículo he utilizado ChatGPT 4o, y la verdad es que el resultado a mi modo de entender ha sido perfecto 👍. Seguidamente os muestro las 5 ideas principales generadas por esta IA:
1. Percepción negativa: Ha disminuido la creencia en los beneficios de los Juegos Olímpicos para Francia, como su imagen, turismo, economía y empleo.
2. Desconfianza en la organización: Ha bajado la confianza en que los organizadores puedan realizar con éxito los Juegos, incluyendo la ceremonia de apertura y el transporte público.
3. Cambios en promesas gubernamentales: El gobierno ha cancelado el plan de transporte público gratuito y en su lugar ha aumentado los precios del metro.
4. Bajo entusiasmo: Solo el 36 % de los franceses están entusiasmados con los Juegos, incluso entre los aficionados al deporte.
5. Posibles huelgas: Varios sindicatos han anunciado huelgas durante el periodo olímpico, lo que podría afectar el desarrollo de los Juegos.
Este resumen destaca las principales preocupaciones y la falta de entusiasmo de los franceses hacia los Juegos Olímpicos de París 2024.
👁️ Visual Thinking
El resumen anterior generado por IA (ChatGPT 4o) o un resumen que pudiéramos realizar nosotros requeriría de una lectura concentrada para entender los motivos de la pérdida de confianza de los franceses en los Juegos Olímpicos de París 2024, pero no me cabe ninguna duda de que la representación visual de estas mismas ideas en un Mapa Mental facilita la rápida comprensión de las causas.
Seguidamente te muestro un Mind Map tuneado, ya que realmente no cumple estrictamente con las reglas de un Mapa Mental. Yo lo denomino Mini Mapa Mental o MMM, y se trata de un mapa mental con la 💡 idea central y únicamente un primer nivel de ideas fundamentales. A partir de este primer esqueleto podríamos seguir ramificando y completando con ideas de más detalle.
En esta ocasión no le he pedido a la Inteligencia Artificial que me diese unas primeras ideas y me he centrado en generar un MMM utilizando en esta ocasión Procreate en mi iPad.
Mind Map #makeovermonday week 21 / 2024 Olimpiadas París 2024
📈 Análisis de datos
Los datos que nos proporciona el reto en esta semana son básicamente 8 registros con diferentes categorías y un valor para estas categorías en dos puntos diferentes de tiempo. Dados estos datos mi intuición me dice que el gráfico más adecuado es un Slope Chat.
¿Qué es un slope chart o gráfico de pendiente?
Se trata de un gráfico de líneas de tiempo en el cual únicamente tenemos dos puntos el inicial y el final. Es decir, los gráficos de líneas muestran tres o más puntos en el tiempo, mientras que los gráficos de pendientes muestran exactamente dos puntos en el tiempo para cada uno de las categorías que representen. En el siguiente punto puedes ver uno de los Slope Charts que he creado para el caso de #makeovermonday de esta semana.
Comparar tasas de cambio entre distintos elementos gracias a la visualización de la pendiente de cada uno de ellos.
Visualizar facilmente «pendientes aberrantes«. Permite ver rápidamente que elementos se salen de la media general del resto de los elementos.
📊 Visualización de datos
Una vez sabemos que es un Slope Chat el gráfico que vamos a utilizar para representar los datos del reto de esta semana seguidamente te muestro el aspecto de uno de los gráficos generados.
Slope Chart (Gráfico de pendiente) en Flourish Studio
Este tipo de gráfico se puede generar con nuestra herramienta de visualización favorita, pero en este caso lo he realizado con Flourish Studio, una herramienta de visualización web que personalmente me gusta mucho.
Si no conoces esta herramienta te animo a que la pruebes ya que te permite generar visualizaciones realmente impactantes, y de forma gratuita. Las dos características que más me gustan son:
La facilidad para generar una gran variedad de visualizaciones.
Su herramienta de generación de historias. Storytelling para mostrar tus datos de una forma impactante.
Llegados a este punto me gustaría compartir contigo un pequeño resumen del reto de la semana, pero en este caso será en formato vídeo para hacerlo un poco más ameno.
💭 ¿Qué te ha parecido el reto de esta semana?
⭐️ Me encantaría ofrecerte más detalles sobre el caso de la semana para asegurarme de que estás obteniendo el máximo provecho de este reto. Profundizar en aspectos específicos que puedan ser de mayor ayuda o facilitar orientación adicional sería mi objetivo, pero necesitaría saber en que puntos te gustaría que extienda la información.
Además, tu perspectiva y experiencia personal serían muy valiosas para enriquecer el contenido, ya que podrías compartir la forma en que consideras que los datos del caso de la semana deberían ser presentados. Estoy ansioso por recibir tus comentarios y continuar esta conversación de manera constructiva.
Estoy emocionado de anunciar mi nuevo desafío para 2024: el #RetoVT&VD2024. 🎨📊 Este reto semanal combina mis pasiones por el Sketching y Visual Thinking con mis habilidades técnicas en análisis y visualización de datos.
Cada semana, me sumergiré en un nuevo proyecto inspirado en el #MakeoverMonday de la comunidad de Tableau Public. A través de publicaciones llenas de creatividad y datos, mostraré cómo fusionar estas dos poderosas disciplinas para comunicar ideas de manera impactante y efectiva.
🔍 ¿Qué puedes esperar?
💡 Visualizaciones de datos sorprendentes y llenas de insights. 💡 Esquemas y bocetos que clarifiquen conceptos complejos. 💡 Tutoriales y tips sobre herramientas y técnicas. 💡 Interacción y aprendizaje conjunto con la comunidad.
Únete a mí en este viaje y descubre cómo transformar datos en arte visual.
Puedes ver el detalle del reto en el siguiente enlace de el artículo que publiqué en LinkedIn al respecto:
Además de mis publicaciones en el blog, estaré publicando en Instagram historias al respecto del reto.
En esta presentación del reto os dejo las que sería las publicaciones de la idea inicial que tengo para este nuevo reto. Después el reto va evolucionando, y la verdad es que este creo que es bastante exigente.
Presentación del reto semanal
#RetoVT&VD2024 week 20/2024 #makeovermonday
En esta publicación presentaré el reto y plantearé probablemente alguna pregunta al respecto de la misma.
Mapa Mental o SketchNote asociado al reto semanal
Mind Map #makeovermonday week 20 / 2024
Publicación de un Mapa Mental en el que se recojan las ideas principales de la temática semanal.
Analizando los datos
Finalmente piezas de Visualización de datos, y comentarios al respecto de la Herramienta utilizada para dichas visualizaciones.
Diagrama de Burbujas en Tableau Public
En resumen…
Un reto muy exigente que espero poder mantener durante este año 😀 ¿Qué te parece? Me encantaría conocer tu opinión, anímate a dejar un comentario.
¡Amantes del análisis de datos y del Data StoryTelling, estoy emocionado de compartir con todos mi más reciente contacto con PowerBI, herramienta líder en visualización de datos! 📊 después de completar un nuevo curso en Platzi.!
Certificado curso de Análisis de Datos con Power BI
¡Permíteme mostrarte algunas de las increíbles características que he aprendido! 🔥, pero para ello en esta ocasión os voy a dirigir a mi Perfil de LinkedIn, al que si os interesa os invito a seguir, y a pedirme ser parte de vuestra red profesional.
Fue hace unos pocos días que os hablaba de gráficos en cuarentena en mi post «Errores en Visualización de Datos: Una Crítica Constructiva» y hoy vuelvo al tema de la visualización de datos, ya que otro de los errores típicos al representar información es no usar los gráficos adecuados o no usarlos de la mejor forma. ¿Me acompañas?
Para tratar este tema volveré a coger nuevamente una noticia de hoy mismo en la prensa escrita.
Errores en visualización de datos
Hoy (9 de agosto de 2023 en el Heraldo de Aragón) me he encontrado con una noticia que nuevamente me ha llamado la atención. El artículo trataba en este caso de la variación del número de habitantes en Aragón, e ilustraba la noticia con dos gráficas que a mi juicio ni son la mejor elección, ni probablemente las más adecuadas para ilustrar la noticia. Vamos a comenzar viendo la noticia «Aragón registra otro récord de población al sumar 2.068 habitantes en tres meses«
Noticia en el Heraldo de Aragón del 9 de Agosto de 2023
Las dos gráficas que acompañan a la noticia desde luego no reflejan claramente esa variación trimestral, y cabría pensarse que eso es lo que se quiere remarcar en la noticia. Por otra parte, la noticia se acompaña de dos titulares adicionales:
«Con 1.353.884 en el padrón y una tendencia al alza, las cifras superan desde hace un año los máximos anotados en 2009»: Haciendo un gran esfuerzo analizando el primero de los gráficos vemos que sí que se podría deducir que efectivamente se cumple, pero si lo que se pretende con un gráfico es ilustrar un dato es necesario que sea claro y no requiera de un esfuerzo de interpretación.
«La inmigración supone el principal motor de crecimiento»: Desde luego este titular no se refleja en ninguna de los dos gráficos.
Así pues, la primera conclusión es que los gráficos no facilitan la explicación de la noticia, y no refuerzan el mensaje de los titulares.
Y entonces, si no refuerzan el mensaje de la noticia para que están ahí. ¿Ofrecen información adicional interesante? y ¿Por qué esos dos gráficos combinados? ¿Dan un mayor detalle de información?
La verdad es que habría que preguntar a los editores de la noticia la razón de ocupar casi un 45% del espacio de la noticia en dos gráficos, que en mi opinión lo único que aportan es confusión y una idea ilusoria o equivocada de los datos. Y los tres motivos para argumentar esto son los siguientes:
Gráficos claros y simples de entender de un vistazo. Para acompañar a una noticia creo que esta premisa es fundamental.
Gráficos con eje sin base cero. Uno de los trucos para manipular la información de forma visual. Probablemente uno de los más utilizados en el ámbito político. Aunque en este caso se podría perdonar añadiendo un matiz.
Gráficos mal etiquetados. Para finalizar debemos de revisar todas las etiquetas y elementos que acompañan a un gráfico para que faciliten su lectura, y no sean simplemente un elemento que aporte carga cognitiva sin ningún sentido.
Gráficos claros 🧐
Es evidente que a pesar del gran espacio que ocupan los gráficos en la noticia no están creados para facilitar la comprensión de la misma.
El gráfico de líneas muestra el número de habitantes de Aragón por años que es lo que marca el eje horizontal si bien la línea representada en el gráfico, por su forma, representa un nivel de datos trimestral, luego no encaja. En mi opinión sería más conveniente simplificar la curva y mostrar únicamente los datos indicados en el eje. Dado que el segundo gráfico si que representa los datos trimestralmente, para hacer el vinculo entre ellos ha señalado los puntos sobre el gráfico, añadiendo una carga cognitiva innecesaria.
Por lo que respecta al segundo gráfico por provincias, que si que dispone de los datos a nivel trimestral, tiene el problema de que no usa el mismo rango temporal que el primero. Es decir, el gráfico de línea va de julio 2008 a julio 2023 y el gráfico de barras de abril 2021 a julio 2023.
Otro elemento que dificulta es que los ejes temporales se intercambian entre los gráficos, en el gráfico de líneas es el eje horizontal y en el de barras es el vertical.
En mi opinión un desastre. Así llegados a este punto yo preferiría un gráfico mucho más simplificado que mostrase la evolución de la población.
Gráfica de habitantes de Aragón Simplificada, sin eje de referencia en cero
Y aunque está representación no es la mejor desde luego es más clara, al margen de que soy consciente de que estoy aún incluyendo elementos distorsionares. Entre ellos que los puntos del eje horizontal no están a las mismas distancias temporales, y esto produce distorsiones que habría que corregir.
Gráficos con eje sin base cero 🧐
En mi opinión este es el peor de los errores que se puede cometer con un gráfico y que habría que evitar a toda costa.
El uso de gráficos de líneas y barras con ejes verticales que no comienzan en cero puede llevar a malinterpretaciones y distorsiones.Si el eje vertical no parte desde cero, las diferencias entre valores pueden parecer más pronunciadas de lo que realmente son, lo que puede llevar a percepciones incorrectas de cambios y proporciones. Esto es especialmente crucial cuando se comparan datos entre diferentes series o categorías.
Aunque hay situaciones en las que no comenzar el eje en cero puede ser justificado, como cuando se trata de resaltar pequeñas variaciones, generalmente es preferible mantener el eje vertical en base cero para garantizar una representación precisa y evitar distorsiones engañosas.
Es importante ser transparente y claro en la representación de datos para que las audiencias comprendan correctamente la magnitud de las diferencias y puedan tomar decisiones informadas.
En conclusión, mientras que los gráficos sin eje en base cero pueden a veces parecer más dramáticos, su uso debe ser cuidadoso para no distorsionar la realidad y comprometer la integridad de la visualización de datos.
Gráfica de habitantes de Aragón Simplificada, con eje de referencia en cero
Al representar el mismo gráfico en base cero desde luego pierde el interés y lo que cabria preguntarnos es si la noticia es verdaderamente interesante. Así, a pesar de lo indicado, en este caso estaría justificado el uso de la escala sin base cero.
En el segundo gráfico, directamente el uso de la base 130.000, hace que los datos de Teruel prácticamente ni se vean y aquí desde luego no está justificado de ninguna forma produciendo una distorsión total. Si bien en un gráfico de líneas podría justificarse, en una de barras NO.
Gráficos mal etiquetados 🧐
Por último, que podemos decir de la rotulación de los ejes y la coordinación de los dos gráficos, ambos se deberían de complementar y en mi opinión no lo hacen.
Deberían de mantener el significado de los ejes de representación y se debería de prestar atención tanto a las etiquetas erróneas como a su significado. Personalmente datos de trimestre deberían de ser (31/03, 30/06, 30/09, y 31/12) y no (01/01, 01/04, 01/07, 01/10) que me parecen etiquetas malas.
Propuesta de Mejora: Gráfico Correcto y Reflexión Final 🆗🤔
Tras trabajar un poco los gráficos y sin ser una versión completamente final, a la que se podría llegar con un buen conjunto de datos, os paso a indicar los gráficos que yo utilizaría.
Para el gráfico de línea, en este caso seguiría usando la escala sin base cero, pero eliminado el eje vertical para no inducir al error. En este caso esta escala permite visualizar las pequeñas variaciones sobre el número total de habitantes.
Adicionalmente incorporo dos elementos gráficos interesantes:
Referencia al periodo COVID
Referencia a la franja que posteriormente veremos de forma detallada por provincias.
Gráfica de habitantes de Aragón Simplificada, sin eje de referencia en cero, pero indicando que se ampliara información
El nuevo gráfico proporciona una visión más clara y precisa de la situación, permitiendo una mejor comprensión de la evolución. Insisto, no sería una versión definitiva ya que deberíamos de corregir la uniformidad de los intervalos del eje horizontal.
Para el segundo gráfico, decididamente cambio las barras por líneas de tendencia entre dos puntos, creo que aporta mucho más, y añado unas barras con el % de variación. Además, se evitan las distorsiones de escala de las barras con base diferente a cero.
Gráfica de variación de habitantes de Aragón por provincias. % variación
En ambos casos el eje horizontal son periodos trimestrales, que etiqueto de una forma más clara.
Conclusión
En conclusión, la visualización de datos no consiste en poner el primer gráfico que se nos ocurra, tenemos que pensar muy bien que gráfico usamos para apoyar la noticia o la información que queremos remarcar.
Os muestro como sería el cambio que yo propondría en un primer análisis, aunque seguramente le volvería a dar una vuelta más.
Propuesta final de Gráficos
¡La visualización de datos es una poderosa herramienta que debe ser utilizada con responsabilidad y transparencia! 🚀📈
¿Qué opinas? Me encantaría que me dejases tu opinión.