Iron Viz (Engelse site) is als een ‘wereldbeker’ waarin wordt gestreden voor een plaats bij de beste drie ontwikkelaars van Tableau, een software waarmee data kan worden gevisualiseerd. Dit jaar besloot ik aan deze wedstrijd deel te nemen (bekijk hier mijn bijdrage [Engels]). In dit artikel kom ik terug op mijn eigen ervaring, op hetgeen ik geleerd heb uit de voorbereiding op de wedstrijd en op de moeilijkheden waarmee ik te maken kreeg.
6 tips voor een goede #Dataviz
- Neem uw tijd om een rijke, kwalitatief hoogwaardige primaire gegevensbron te kiezen in plaats van meerdere koppelingen uit te voeren
- Verrijk de gegevensbron van waaruit u werkt met een krachtige ETL (ik koos voor Anatella, waarover ik het al eerder had in dit artikel)
- Beperk u tot 2 koppelingen
- Maak geen gebruik van meerdere afzonderlijke gegevensbronnen: dat verhindert om een volledig verhaal te vertellen
- Geef de voorkeur aan een zwarte achtergrond voor een betere visuele weergave
- Definieer een eindig aantal scenario’s waaruit de gebruiker kan kiezen
In het kort over mijn bijdrage aan Iron Viz
Mijn visualisatie (Engels) richt zich op het probleem van obesitas in de Verenigde Staten en bestaat uit 2 delen:
- Deel A: obesitas in de Verenigde Staten via 2 visualisaties: weergave van statistieken per staat in de vorm van een isometrische hex-kaart, en een joyplot die clusters met overgewicht op het niveau van de Amerikaanse provincies toont (meer dan 3000)
- Deel B: een perspectief om de Verenigde Staten op een meer globale schaal te plaatsen en de evolutie van obesitas in de laatste 30 jaar te volgen
Een goed onderwerp vinden: de belangrijkste uitdaging
Het thema van dit jaar (Engels) was ‘gezondheid en welzijn’, een relevant thema ‘in deze tijden van’ corona. Het voordeel was dat dit op oneindig veel manieren behandeld kon worden; het nadeel was dat dit op oneindig veel manieren behandeld kon worden. Te veel mogelijkheden is dodelijk voor de keuze en dat is precies het probleem waarmee ik te maken had. Waar een interessant idee vinden om te behandelen? Welke gegevens zijn interessant genoeg om te verwerken?
Ik vond al heel vroeg inspiratie in de relatie tussen de twee termen die de titel vormen: ‘gezondheid’ enerzijds en ‘welzijn’ anderzijds. Mijn eerste idee was om geluk als indicator van welzijn te gebruiken en dat tegenover een andere indicator te plaatsen.
Het was na urenlange omzwervingen op open datasites dat ik uiteindelijk koos voor het thema obesitas. Het enige wat ik nog moest doen, was nagaan wat er met deze gegevens verteld kan worden.
Techniek of storytelling?
De website van Tableau Public (Engels) staat vol met prachtige voorbeelden van visualisaties. Sommige ervan zijn verrassend eenvoudig, andere bevatten bijzonder complexe visualisaties waarvoor complexe ontwikkelingen nodig zijn. De beste ontwikkelaars vinden er plezier in om de mogelijkheden van Tableau te gebruiken om nieuwe soorten visualisaties te ontwerpen, zoals koorddiagrammen (bekijk hier het prachtige voorbeeld van Marc Reid [Engels]) en Sankey-diagrammen.
De moeilijke keuze die ontstaat wanneer u deelneemt aan Iron Viz is of u de voorkeur geeft aan het verhaal dat de data kan vertellen (storytelling) of aan een technische demonstratie.
Ik koos voor de 2e optie en achteraf gezien denk ik niet dat het mijn beste keuze was. Mijn streven om een joy plot te maken had voorrang op de wens om een verhaal te vertellen, dus ik bouwde mijn bijdrage aan de Iron Viz eerst rond de joy plot alvorens te denken aan storytelling.
Geef de voorkeur aan een eindig aantal scenario’s
Het was bij het zien van een bijdrage van een andere deelnemer (Engels) dat ik besefte dat ik een fout had gemaakt. Hoewel mijn visualisaties een verhaal vertellen, leiden acties op de ene niet tot veranderingen op de andere. Daarom denk ik dat het succes van een visualisatie afhangt van het vermogen om de gebruiker nieuwsgierig te maken. Om dat te bereiken, moeten veranderingen zichtbaar worden gemaakt.
Ik denk dat het daarom belangrijk is om bij dit soort oefeningen een beperkt aantal scenario’s te bepalen. Elk scenario moet overeenkomen met een vooraf gekozen interessante case. De selectie van deze case maakt het mogelijk om opvallende en interessante verschillen te visualiseren. Het Sankey-diagram is bijzonder geschikt hiervoor:
- de verschillen worden weergegeven als “paden” die de gebruiker kan volgen in de richting van het dashboard
- de andere “paden” blijven zichtbaar als watermerk, zodat u de verschillen kunt zien.
Stijl: zwart is makkelijker
De visuele kracht van visualisaties op een zwarte achtergrond is onmiskenbaar. Ik had dat al gemerkt bij mijn visualisatie over migraties naar de Europese Unie (zie hieronder). Deze keer probeerde ik een visualisatie op een lichte achtergrond, wat wel wat uitdagingen stelde. Een zwarte achtergrond geeft immers een zekere homogeniteit aan het dashboard, iets dat ik niet terugvind bij een witte achtergrond.
Voorbereiding van de gegevens
Dikwijls horen we dat 90% van de tijd van een datawetenschapper naar de voorbereiding van de gegevens gaat. In mijn geval zou ik zeggen dat dit meer rond de 50% lag, omdat de gegevens al heel zuiver waren. Wat het meeste tijd in beslag nam, was de afstemming van de geografische gegevens, vooral het bepalen van de centroïden voor de weergave per geografische zone. Veel tijd ging ook naar de voorbereiding van het gaas achter de joy plot. Tableau Prep Builder kon me daarbij niet helpen omdat ik een te fijnmazig gaas had ontworpen dat te veel bronnen gebruikte. Ik maakt in totaal gebruik van maar liefst tien gegevensbronnen voor mijn bijdrage aan Iron Viz en dat was een vergissing. Als ik het opnieuw zou doen, zou ik meer tijd besteden aan het kiezen van een volledige en kwaliteitsvolle hoofdgegevensbron en niet meer dan 2 koppelingen met externe bronnen.
De positieve kanten van mijn deelname aan Iron Viz
Ongeacht de uitslag van Iron Viz, de grote winnaar ben ik. De uren die ik aan deze uitdaging heb besteed, hebben mij in staat gesteld een veelvoud aan nieuwe technieken te leren en te innoveren met een nieuw type van visualisatie: een isometrische hex-kaart (zie hieronder).
De tientallen uren die ik besteedde aan de voorbereiding van Iron Viz hebben me ook nieuwe ideeën opgeleverd, waarmee ik de komende maanden kan gaan experimenteren om mijn profiel in Tableau Public aan te vullen. Hebt u ook deelgenomen aan Iron Viz? Deel uw ervaring met ons in het commentaarveld.
Geplaatst in Data en IT.