Les 5 niveaux de la data visualisation : exemples et conseils [guide ultime]

Les 5 niveaux de la data visualisation : exemples et conseils [guide ultime]

Après avoir écrit mon guide de la data visualisation, j’ai voulu développer dans un article séparé les 5 niveaux de la visualisation des données que j’y esquissais brièvement. Si vous voulez savoir où vous en êtes au niveau de votre pratique de la BI (Business Intelligence) et de la dataviz, cet article est fait pour vous !

Sommaire


Introduction

Une bonne image vaut mieux que de longs discours. C’est bien connu et cela s’applique parfaitement à la data visualisation. La data visualisation c’est cette discipline, démocratisée par la « business intelligence » et qui a fait sa mue avec l’augmentation exponentielle du volume de données et la création de solutions logicielles dédiées (PowerBI, Tableau, Spotfire, …).

Si vous avez lu le sommaire vous savez déjà un peu à quoi vous attendre en matière de catégorisation. Avant de commencer cet article permettez-moi un petit disclaimer à l’attention des aficionados de R, python, SAP BO, Qlik, etc … Le but de cet article n’est en aucun cas de créer une hiérarchie entre ces outils. Je me limite à donner dans mon modeste article des exemples issus de ma propre pratique. N’y voyez donc pas une tentative malicieuse de discréditer ces outils mais plutôt un aveu de mes limites.


Niveau 0 : pas de data visualisation

Définition : pas de représentation graphique Outils : Powerpoint (surtout) Quoi : Tableaux avec des chiffres et encore des chiffres Qui : encore trop de monde

Le temps des tableaux Excel n’est pas encore révolu. Il y en a encore pour vous coller des tableaux remplis de chiffres dans leur reporting de fin de mois. Si vous avez commencé le mois dernier et que vous n’avez que 2 chiffres à montrer, je vous l’accorde, ça va. Mais si vous essayez de faire comprendre quelque chose d’un peu plus compliqué, ce serait quand même bien de faire un petit graphique (genre Niveau 1, pas trop compliqué).

Dans ce tableau publié en 1596, les dates de naissance et de mort d’évêques sont arrangées de telle manière à pouvoir en déduire leur âge au moment de chaque évènement.

J’ai remis le nez dans mes archives et je n’ai pas eu besoin de chercher beaucoup pour trouver les premiers exemples de ces slides imbuvables. Et curieusement ils étaient souvent l’œuvre de chercheurs présentant leurs travaux dans des conférences scientifiques. Une fois pour toute … afficher des chiffres en pagaille et des tableaux surchargés ne contribue pas à rendre un travail scientifique plus crédible.

Dites-vous d’ailleurs qu’en faisant un copier-coller d’un tableau Excel, vous êtes au niveau de ce qui se faisait il y a 500 ans. Et encore … Dans l’exemple ci-dessous les chiffres sont arrangés de manière largement plus astucieuse que la majorité des dataviz que je vois.


Niveau 1 : le graphique Excel

Définition : représentation d’une variation uni-dimensionnelle Outils : Excel Quoi : histogrammes, diagrammes circulaires, courbes, … Qui : tout le monde a priori

Le niveau 1 de la dataviz c’est quand un graphique se contente de montrer une évolution (temporelle par exemple). C’est plus rapide à comprendre que d’analyser un tableau plein de chiffres, mais ça ne va pas beaucoup plus loin. Le niveau 1 de la data visualisation vous fait gagner du temps de cerveau. La plupart des graphiques réalisés sous Excel tombe dans cette catégorie.

Il n’y a pas de honte à utiliser Excel pour faire un simple graphique. Parfois ça va même plus vite que sous Tableau ou PowerBI. Ce qui serait dommage ce serait de se contenter d’un graphique mal fait alors qu’Excel vous donne quand même la possibilité de faire quelque chose de sympa. Pourquoi dès lors se contenter de cela …

Excel histogram

alors qu’il est parfaitement possible, sous Excel, de parvenir à un rendu plus qualitatif ? Cole Nussbaumer Knaflic, dans son livre « Storytelling with data« , en donne quelques bons exemples comme le graphique ci-dessous.

data visualisation sous excel


Niveau 2 : dashboards et corrélations

Définition : représentation de 2 variables ou plus sur un même graph Outils : Excel, PowerBI, Tableau, Spotfire, … Quoi : visualisation de 2 variables ou plus afin de révéler des corrélations qui autrement demeureraient invisibles, tableaux de bord Qui : data analystes et managers

Le niveau 2 de la data visualisation se passe de préférence dans un logiciel spécialisé et permet d’aller au-delà d’une représentation uni-dimensionnelle. Les axes des abscisses et ordonnées peuvent être combinés avec des variations de couleur et de taille, donnant ainsi la possibilité de visualiser 4 dimensions.Dans le niveau 2 on range également les représentations cartographiques qui permettent de saisir les liens sous-jacents qui peuvent exister entre les données.

Les visualisations de ce type peuplent l’univers de la BI (Business Intelligence) qui se nourrit de tableaux de bord. Généralement elles sont le fait de personnes qui maîtrisent bien les outils comme Tableau, PowerBI, … mais qui ne possèdent pas le bagage technique suffisant pour aller au-delà des représentations standard. Pour leur défense je dirais qu’il est également compliqué, dans certaines organisations, d’arriver avec des représentations visuelles qui sortent de l’ordinaire. En effet certains départements BI travaillent depuis des années sans se remettre en cause. Des tableaux de bord sont servis à longueur d’année à des top-managers incapables de digérer des chiffres autres que ceux auxquels ils sont habitués. J’ai pu constater que même dans des organisations qui se revendiquent comme « data-driven », le manque de connaissances « data » de certains top managers est une chape de plomb qui muselle les plus doués des analystes. Le principe de Peter est une réalité bien vivante.

Puisque le niveau 2 de la data visualisation est celui où sont restés bloqués la plupart des personnes, permettez-moi d’approfondir un peu le sujet.

Il est tout à fait possible d’utiliser Excel pour créer des visualisations complexes. Mais si vous optez pour l’outil de Microsoft, de grâce gardez à l’esprit le conseil de Jorge Camoes dans son livre « Data at work » :

Vous ne voulez pas que votre audience pense « c’est un graphique Excel » ou, pire encore, « Est-ce que nous payons pour des graphiques sous Excel ? Le but est que votre audience voit les données, pas l’outil.

Et effectivement, quand on voit ce que Jorge Camoes arrive à réaliser avec Excel, on réalise bien vite la distance qui nous sépare des meilleurs (voir ci-dessous).

jorge camoes troops vs. costs

Le travail et les compétences de Jorge restent une exception. Le gros de la production des visualisations de niveau 2 se fait sur des outils de BI. Pour avoir un aperçu de ce qui se fait de mieux avec Tableau, rendez-vous sur la page « Viz of the Day« . Vous y trouverez des dashboards comme celui de George Gorczynski intitulé « Shape of democracy ».

data visualisation sous Tableau : "shape of democracy"

Power BI offre également une page regroupant d’excellents exemples de tableaux de bord créés avec cet outil. Le tableau de bord ci-dessous est atypique car la visualisation radiale proposée (une variante du « chord diagram ») est rarement utilisée mais prend ici tout son sens.

data visualisation sous PowerBI


Niveau 3 : la data visualisation devient interactive

Définition : l’utilisateur devient acteur de ses propres découvertes grâce à des fonctionnalités qui lui permettent d’interagir avec la visualisation Quoi : visualisation des données sous forme interactive; possibilité d’exploration des relations entre donnés par l’utilisateur lui-même Outils : outils spécialisés pour la BI et la dataviz Qui : data scientists et data analystes avancés

Le niveau 3 de la data visualisation ajoute la notion d’interactivité. Il nécessite certains talents en programmation ou des connaissances avancées des outils spécialisés (Tableau, PowerBI, …) afin d’exploiter ces derniers au maximum de leur potentiel.

Le propre du niveau 3 c’est de rendre l’utilisateur acteur de ses propres découvertes autour des données. Pour que cette interaction avec l’utilisateur fonctionne, il faut également ajouter une dimension de « story telling ». Ceci se fait généralement par le biais de différentes couches visuelles qui, parcourues les unes après les autres, permettent à l’utilisateur de se plonger dans les données et de devenir autonome. L’utilisateur ne consomme plus passivement les graphiques et représentations visuelles proposées par d’autres. Il découvre par lui-même en sélectionnant certains données, en faisant varier des échelles, en zoomant, …  En bref il n’est plus passif et s’approprie les données, ce qui augmente sa capacité à les valoriser dans d’autres environnements.

Voici quelques exemples de dataviz de Niveau 3. Attention les yeux !

Le travail de Christian Felix lui a valu de gagner l’Iron Viz 2020 avec la visualisation ci-dessous. Je vous invite à « jouer » vous-même avec les données en vous rendant ici.

The air we breathe iron viz 2020 winner Le Joy Plot d’Alexander Varlamov est également remarquable. Il est combiné de manière très intelligente avec une représentation géographique afin de révéler des insights. Cliquez ici pour jouer avec les données.

data visualisation : Joy Plot

Dans une visualisation consacrée aux migrations vers l’Union Européenne, j’ai essayé modestement de me rapprocher du niveau 3 et ai retenté l’exercice lors de l’IronViz 2020.


Niveau 4 : Art et data visualisation font bon ménage

Définition : une dimension esthétique est ajoutée, qui se fait parfois au détriment de l’aspect fonctionnel Outils : Illustrator, Photoshop, en combinaison avec des outils techniques Quoi :  dimension esthétique de la data visualisation privilégiée, parfois au détriment des aspects fonctionnels. Qui : data artists, graphistes

Le niveau 4 de la data visualisation est un niveau à part, qui dépasse les simples besoins fonctionnels couverts par les niveaux précédents. Le niveau 4 ajoute en effet une dimension esthétique à la data visualisation. Cette dernière se doit d’être belle, quitte à perdre en interactivité ou à rendre le message moins évident à comprendre. Ce type de visualisation est généralement réalisé avec d’autres outils que ceux employés dans les entreprises. En effet les Tableau, PowerBI et autres Spotfire ne sont pas conçus pour « créer du Beau » mais plutôt pour créer de l’efficacité. En conséquence, le niveau 4 requiert des outils comme Photoshop ou Illustrator. Dans cette catégorie on retrouve également des animations vidéos ainsi que d’autres formats innovants et captivants.

Voici quelques exemples de visualisation qui se classent dans le niveau 4.

Visualisation de musique sous forme de vidéo (Nicholas Rougeux)

Nicholas Rougeux a eu l’idée de représenter des morceaux de musique classique sous forme de données. Il a utilisé des fichiers .mdi pour convertir la musique en données, puis a testé différents types de visualisations. Le résultat final est représenté sous forme d’une représentation circulaire qui permet de comprendre les différents mouvements, les octaves ainsi que la durée des notes. Retrouvez ses explications dans la vidéo ci-dessous.

Poésie et données peuvent faire bon ménage (Federica Fragapane)

Ce qui caractérise le travail de Federica Fragapane c’est indubitablement un sens inné de la légèreté et de l’élégance.  Federica parvient, par un choix subtil des formes et des couleurs, à insuffler une certaine poésie dans son travail. Elle collabore notamment avec la rubrique culturelle du Corriere della Serra. Son travail peut être découvert également via son compte instagram.

Une data visualisation au service de la démocratie (Karim Douieb)

Karim Douieb a connu une gloire un peu particulière dans la période apocalyptique qui a suivi les élections américaines. Une visualisation qu’il avait créée en 2019 a été réutilisée pour contrer les arguments du camp républicain. Ce dernier essayait de faire passer le résultat des élections pour un raz-de-marée rouge. L’animation de Karim a fait le buzz car elle montre de manière absolument fascinante qu’il n’existe pas de lien entre l’étendue des territoires qui ont voté républicain, et le nombre de personnes qui y habitent. Je remercie Karim de m’avoir prêté sa vidéo pour cet article.


Conclusion

Cet article vous a présenté une classification des différents types de data visualisation. L’explosion du volume de données disponibles a conduit à la naissance de solutions logicielles spécialisées comme Tableau, PowerBI, SpotFire, … Pourtant, bon nombre de visualisations sont encore réalisées avec Microsoft Excel (Niveau 1) et ceux qui utilisent des logiciels spécialisées s’en tiennent souvent à des visualisation de données très conventionnelles (Niveau 2).

Si le niveau 4 s’adresse à des experts bien particuliers maîtrisant des outils graphiques, je pense que le niveau 3 est à la portée de tous. Dépasser les dogmes et atteindre le niveau 3 vous permettra en particulier de faire remarquer votre travail. Pour y parvenir il faudra vous mettre dans la peau de l’utilisateur et lui raconter une histoire dont il sera le héros. Ajoutez de l’interactivité à vos dataviz, concevez-les comme des cartes au trésor. Les utilisateurs se sentiront intelligents et deviendront accrocs à votre travail.


Publié dans Data et IT.