8 april 2024 1023 woorden, 5 min. gelezen

Datavisualisatie: 6 slechte voorbeelden geanalyseerd

Door Pierre-Nicolas Schwab Gepromoveerd in marketing, directeur van IntoTheMinds
In dit artikel bekijk ik 6 voorbeelden van datavisualisaties (dataviz) met min of meer ernstige fouten.

Als u deze blog volgt, weet u dat ik een passie heb voor data en in het bijzonder datavisualisatie. Dat is een discipline die zich specialiseert in de grafische weergave van gegevens. En in sommige gevallen wordt het verheven tot kunstvorm. In het artikel van vandaag neem ik u graag mee in de fouten die u te allen tijde moet vermijden. We gaan dieper in op 6 dataviz-producten met min of meer ernstige fouten.

Neem contact op met het marketingonderzoeksbureau IntoTheMinds

1. Een ‘treemap’ waar je hoofdpijn van krijgt

Dit soort datavisualisatie wordt een ‘treemap’ genoemd. Het wordt gebruikt om waarden weer te geven in de vorm van gebieden. Het grootste gebied staat linksboven en het kleinste rechtsonder. De treemap die u ziet, is bedoeld om landen in te delen naar aantal inwoners en naar continent.

Datavisualisatie Gemaakte fouten

Gemaakte fouten

Deze treemap bevat verschillende fouten:

    • Ten eerste is er een overvloed aan onnodige informatie. Aangezien de treemap waarden classificeert, had de maker ervan zich moeten afvragen of het wel nodig was om waarden op te nemen. Tegelijkertijd zou deze dataviz nutteloos zijn als de waarden niet waren opgenomen. Het menselijk brein heeft grote moeite met het vergelijken van verschillende gebieden.
    • Ik daag u uit om de waarden rechtsonder te lezen. Ze zijn onleesbaar en daarom zinloos
    • De continenten zijn niet ingedeeld volgens het treemap-principe. Dit is een meer subtiele fout

2. Moeilijk te vergelijken gebieden

Deze datavisualisatie toont de import van verschillende landen over de hele wereld en het aandeel van Russisch gas in deze import. Er is een kleur toegevoegd om het continent aan te geven. Als we het continent buiten beschouwing laten, zijn er 2 variabelen om weer te geven.

Datavisualisatie Een onnodig ingewikkeld histogram

Gemaakte fouten

Er worden verschillende fouten gemaakt:

    • Het gebruik van gebieden maakt vergelijkingen moeilijk. Kunt u mij bijvoorbeeld vertellen of Zweden meer importeert dan Spanje?
    • De abscis-schaal is onlogisch en overbodig, met landnamen boven elk gegevenspunt.
    • Uiteindelijk is de bijdrage van kleur vrij beperkt. Er is slechts één land vertegenwoordigd voor het Amerikaanse continent.

De oplossing

We hadden 2 schalen met continue variabelen moeten gebruiken. Het aandeel gas op de y-as past daar perfect bij. De hoeveelheid geïmporteerd gas had op de x-as moeten staan.

3. Een onnodig ingewikkeld histogram

Zelfs de meest onschuldige histogrammen kunnen vreselijke datavisualisaties zijn. Dit is een van mijn favorieten. Als ik hem voor het eerst aan iemand toon, zijn de reacties veelzeggend. Het duurt lang voordat iemand begrijpt wat er wordt weergegeven. En bij verschillende gelegenheden heb ik mensen zien opgeven vanwege de vereiste cognitieve belasting.

Datavisualisatie Gemaakte fouten

 

Gemaakte fouten

Er zijn zoveel fouten gemaakt dat ik zelf moeilijk weet waar ik moet beginnen:
de x-as is omgekeerd (de meest recente periode staat links) en het is niet duidelijk wat de opeenvolging van 2 data voorstelt. We kunnen alleen maar raden dat het een vergelijking is of misschien een tijdsperiode die 2 jaar overschrijdt.

De 3 balken roepen vragen op: wat is hun relatie? Wat doen ze naast elkaar?
Er zijn kleuren aan verbonden, die onderaan de grafiek worden uitgelegd. Dit dwingt de lezer om heen en weer te gaan tussen de legenda en het histogram om te proberen te begrijpen wat hij ziet.

Uitleg en mogelijke verbeteringen

Deze grafiek geeft de inkomstenbronnen van een bedrijf voor 2 belastingjaren weer. De balken naast het totaal geven in werkelijkheid de verdeling van de inkomsten in subcategorieën weer:

    • Inkomsten exclusief overheidssubsidies
    • Advertentie-inkomsten

Deze dataviz is volledig nutteloos. Dezelfde informatie had in een enkele balk weergegeven kunnen worden. Visuele indicatoren (bijvoorbeeld accolades) hadden gebruikt kunnen worden om de informatie te groeperen die gegroepeerd moest worden.

4. Slecht gebruik van het kleurverloop

Deze kaart toont de ‘mate van thermisch comfort’ tussen verschillende wijken van een agglomeratie (Brussel).Datavisualisatie Slecht gebruik van het kleurverloop

Wat is er mis?

Er zijn hier twee dingen mis.

Ten eerste het gebruik van kleuren. De hersenen associëren ze onbewust met waarnemingen:

    • Rood = warm
    • Blauw = koud

Ten tweede geeft de legende geen indicatie van objectieve temperatuurverschillen.

Datavisualisatie dataviz

Toen ik de dataset bekeek die gebruikt werd om deze datavisualisatie te maken, realiseerde ik me dat het grootste temperatuurverschil slechts 3°C was. Met andere woorden, de roodste zone was slechts 3°C warmer dan de blauwste. Dit is volledig misleidend.

Oplossingen voor betere dataviz

Het zou gepaster zijn geweest om een ander kleurverloop dan rood en blauw te gebruiken. Dit zou een verkeerde interpretatie van de kaart hebben voorkomen. Een monochroom kleurverloop zou perfect zijn geweest. Bovendien hadden de waarden die gebruikt zijn om de gegevens weer te geven, aangegeven moeten worden. Een weergave zonder numerieke waarden is niet veel waard.

5. Een 3D-afbeelding om te vergeten

Ik weet niet wiens idee deze datavisualisatie was, maar deze persoon had die dag duidelijk een gebrek aan inspiratie.

Datavisualisatie 3D-afbeelding om te vergeten

Wat loopt er fout

Het gebruik van 3D maakt het resultaat onleesbaar en onbegrijpelijk. Er lijken verschillende tinten rood te zijn en tot op de dag van vandaag weet ik nog altijd niet waarom de leraren in het groen worden weergegeven.

Lange tijd dacht ik dat het een wenteltrap was, maar toen realiseerde ik me dat de ’treden’ eigenlijk een taartdiagram waren.

Hoe deze dataviz verbeteren

Het eerste wat u moet doen, is 3D-visualisaties voor altijd verbannen. Een taartdiagram is ook niet de beste manier om te visualiseren, behalve als er maar twee categorieën te visualiseren zijn. Nogmaals, dit komt doordat de hersenen moeite hebben met het vergelijken van gebieden of hoeken.

In dit geval zou een histogram gerangschikt in aflopende volgorde van ‘prestige’ (wat het onderwerp van de enquête was) perfect gewerkt hebben. Zoals de Amerikanen zeggen: “Keep it simple and stupid”.

6. De prijs voor de meest nutteloze dataviz

Eerlijk gezegd denk ik dat deze dataviz de geschiedenisboeken in moet gaan. Niets gaat goed.

Datavisualisatie dataviz-praktijken

Slechte dataviz-praktijken

Ten eerste is er het gebruik van 3D (altijd weer 😫). Dan is er de opstelling van wat volgens mij ‘geschenkverpakkingen’ zijn. En dan zijn er nog de duidelijke fouten in de weergave van de gegevens: de grootte staat niet in verhouding tot de gegevens die bekeken worden. Kortom … alles loopt fout.

Hoe kan deze dataviz worden verbeterd?

Een histogram zou de oplossing zijn geweest. De gegevens hadden in aflopende volgorde gerangschikt kunnen worden.



Posted in Data en IT.

Plaats uw mening

Je e-mailadres zal niet getoond worden. Vereiste velden zijn gemarkeerd met *