En este artículo analizo 6 ejemplos de visualizaciones de datos (DataViz) que contienen errores serios de distinta gravedad.
Si sigues este blog, sabrás que me entusiasma especialmente todo lo relacionado con los datos y la visualización de datos, una disciplina que se especializa en la representación gráfica de los datos. Y, en algunos casos, se trata de una forma de arte. En el artículo de hoy propongo que profundicemos en cómo evitar errores. Aquí descubrirás 6 datos con errores de distinta gravedad.
Contacta con la agencia de investigación de mercado IntoTheMinds
1. Un mapa de árbol que provoca migraña
Este tipo de visualización de datos se conoce como «mapa de árbol», y se utiliza para representar valores en forma de áreas. El área más amplia se ubica en la esquina superior izquierda, y la más pequeña en la inferior derecha. El mapa de árbol que puedes ver pretende clasificar los países por número de habitantes y continente.
Errores cometidos
Este mapa de árbol contiene varios errores:
-
- Para empezar, existe una redundancia de información. Puesto que el mapa de árbol clasifica valores, su creador debería haber cuestionado la necesidad de incluir dichos valores. Al mismo tiempo, si dichos valores no se hubieran incluido, estos datos serían inútiles. El cerebro humano tiene muchas dificultades a la hora de comprar distintas áreas.
- Te reto a leer los valores de la esquina inferior derecha. Resulta imposible de leer y, por lo tanto, inútil.
- Los continentes no se han clasificado según el principio del mapa del árbol; es un error más sutil.
2. Áreas difíciles de comparar
Esta visualización de datos muestra las importaciones de distintos países a nivel mundial y la proporción del gas ruso dentro de esas importaciones. Se ha añadido un color para indicar el continente. Si dejamos de lado el continente, hay 2 variables presentes.
Errores cometidos
Aquí se han cometido diversos errores:
-
- El uso de las áreas hace que establecer una comparación sea difícil. Por ejemplo, ¿podrías decirme si Suecia importa más que España?
- La escala de abscisas es incongruente y redundante, ya que el nombre de los países está justo encima de los puntos de datos.
- Por último, la contribución del color es débil. Solo hay un país representado para el continente americano.
La solución
Deberían haberse usado 2 escalas con variables continuas. La proporción de gas en el eje Y llevaría a cabo esa labor a la perfección. El número de importaciones debería situarse en el eje X.
3. Un histograma innecesariamente complicado
Incluso los histogramas más inocentes puedes acabar ser visualizaciones de datos horrendas. Este es uno de mis favoritos: las reacciones son épicas cuando se lo muestro a alguien por primera vez. Hace falta mucho tiempo para comprender qué se está representando y, en varias ocasiones, he visto a gente rendirse por la carga cognitiva involucrada.
Errores cometidos
Se han realizado tantos errores que me resulta difícil saber por dónde empezar:
Eje de abscisas está invertido (el periodo más reciente está en la izquierda), y no está claro que representan las 2 fechas. ¿Es una comparación, o un periodo temporal que cubre los 2 años?
Las 3 barras presentan preguntas: ¿cómo están relacionadas? ¿Qué hacen una junto a las otras?
Hay colores asociadas a estas, y se explican en la base del gráfico. Esto fuerza al lector a saltar entre la leyendo y el histograma en un intento por comprender lo que está viendo.
Explicaciones y posibles mejoras
Este gráfico representa las fuentes de ingresos de una empresa durante 2 años fiscales. Las barras junto al total representan el desglose de las entradas en subcategorías:
-
- Ingresos excluyendo subvenciones públicas
- Ingresos por publicidad
Este DataViz es completamente innecesario; la misma información podría haberse mostrado con una única barra. Los indicadores visuales (es decir, las columnas) podrían haber agrupado la información necesaria.
4. Uso pobre del gradiente de color
Este mapa representa el «grado de comodidad termal» entre distintos barrios de una aglomeración urbana (Bruselas).
Qué está mal
Aquí hay dos cosas a corregir.
Primero, el uso de los colores. El cerebro inconscientemente los asocia con percepciones:
-
- Rojo = caliente
- Azul = frío
Segundo, la leyenda no indica las variaciones de temperatura objetivas.
No fue hasta que rebusqué en la base de datos utilizada para esta visualización que comprendí que la mayor diferencia de temperatura era de tan solo 3ºC. O, en otras palabras, las zonas más rojas solo estaban 3ºC más calientes que las zonas más azules. Es todo un engaño.
Soluciones para un mejor DataViz
Utilizar un gradiente de colores distinto al rojo-azul habría sido más apropiado, algo que habría evitado la mala interpretación del mapa. Un gradiente monocromo habría sido perfecto. Además, los valores utilizados para visualizar los datos deberían haberse indicado. Una visualización con valores numéricos tiene más valor.
5. Un gráfico 3D a olvidar
No sé de quién fue la idea de esta visualización de datos, pero les habría ido bien contar con algo más de inspiración.
Qué está mal
El uso del 3D hace que los resultados sean imposibles de leer y resulten incomprensibles. Hay distintos tonos de rojo, y todavía no comprendo por qué los profesores se representan en verde.
Durante mucho tiempo creí que se trataba de una escalera de caracol, pero posteriormente comprendí que los «peldaños» en realidad eran un gráfico circular.
Qué puede hacerse para mejorar este DataViz
Lo primero a hacer es prohibir la visualización en 3D para siempre. Y el gráfico circular tampoco es una visualización preferente a no ser que tengas solo dos categorías a visualizar. Una vez más, la razón detrás de ello es la dificultad del cerebro de comprar áreas o ángulos.
En este caso, un histograma ordenado en orden descendente según el «prestigio» (que era el tema de la encuesta) habría encajado a la perfección. Tal y como dicen los americanos: «que sea simple y estúpido».
6. El premio al DataViz más inútil
Estos datos deberían pasar a los anales de la historia. Todo está mal.
Malas prácticas de DataViz
Para empezar, está el uso del 3D (una y otra vez 😫). Después está el orden de lo que creo que son «cajas de regalo». Y los errores evidentes en la representación de los datos: el tamaño no es proporcional a los datos visualizados. En resumen, todo está mal.
¿Cómo puede mejorarse este DataViz?
Un histograma habría sido suficiente. Los datos podrían haberse ordenado en orden descendente.
Publicado en Data y IT.