16 octobre 2019 665 mots, 3 min. de lecture

Data mining : où crée-t-on le plus d’entreprises en France ?

Par Pierre-Nicolas Schwab Docteur en marketing, directeur de IntoTheMinds
Où crée-t-on le plus d’entreprises en France ? Cette question est essentielle pour comprendre les dynamiques qui sont à l’œuvre dans les différents départements français. En utilisant les données de l’INSEE nous avons souhaité vous proposer une réponse simple. Toutefois, […]

Où crée-t-on le plus d’entreprises en France ? Cette question est essentielle pour comprendre les dynamiques qui sont à l’œuvre dans les différents départements français.
En utilisant les données de l’INSEE nous avons souhaité vous proposer une réponse simple. Toutefois, comme souvent, les données réservent des surprises et obtenir un bon (et beau) résultat nous a demandé quelques efforts.
Si la business intelligence et en particulier l’utilisation de Tableau vous intéressent, vous trouverez dans ce billet l’occasion de d’apprendre à réaliser une visualisation par quantile.

Origine des données

Chercher des données de qualité sur les entreprises françaises ? Direction l’INSEE bien sûr. Comme toujours rien de mieux que les instituts nationaux de statistiques pour trouver des données sur un marché.
L’INSEE vous propose des données mensuelles pour les différents types d’entreprises : sociétés, micro-entreprises, entreprises individuelles. Cerise sur le gâteau, les données sont disponibles sur une très grande période temporelle (depuis 2000).
Faites toutefois attention quand vous analysez ces données car les micro-entreprises n’existent que depuis 2009.

Visualisation géographique des données

création d'entreprises dans les départements français en 2017

Visualisation de la création d’entreprises dans les départements français en utilisant un gradient de couleur sous Tableau (source des données : INSEE, 2017)

Visualiser d’une manière simple la dynamique territoriale peut paraître aisée mais comme souvent lorsque les disparités sont grandes, le résultat était décevant. En effet, l’utilisation du gradient de couleur proposé par défaut dans Tableau conduit inévitablement à une carte où n’apparaissent aucunes différences notables. La région parisienne concentrant une part très importante des créations d’entreprises, les autres régions se retrouvent en bas du gradient de couleur et ne se distinguent par conséquent pas les unse des autres. L’exercice de data mining serait donc raté si nous nous arrêtions là.
Nous avons donc dû recourir à une astuce pour que les différences deviennent palpables, visibles, et que la dynamique territoriale et temporelle prenne tout son sens.

Visualisation par quantiles

Création d'entreprises dans les départements français en 2018.

Création d’entreprises dans les départements français en 2018. Visualisation par quartiles. Source des données : INSEE.

L’astuce que nous avons utilisée se base sur une visualisation par quantiles (par quartiles dans le cas présent) que nous avions déjà utilisée avec succès dans un autre exercice de data mining (visualisation de l’économie souterraine). Les valeurs de créations d’entreprises sont affectées dans 4 classes (des « buckets ») : les 25% inférieurs, 25-50%, 50-75%, les 75% supérieurs.
Et toute de suite les différences apparaissent plus clairement.
Certains pourraient objecter qu’il aurait été plus simple d’utiliser un gradient de couleur à 4 intervalles. Et en effet certaines différences seraient apparues plus clairement. Mais dans la mesure où les intervalles sont répartis de manière égales, les grands écarts continuent à produire leurs effets et le résultat, visuellement, est décevant. Une visualisation par quartiles est donc beaucoup plus parlante et à notre préférence.

Résultats

Les résultats sont comme d’habitude disponibles dans notre espace Tableau Public. Pour ceux qui préfèrent voir directement le résultat sans en passer par Tableau, nous avons réalisé une petite animation gif. Vous y verrez qu’au final le classement des départements change peu d’une année à l’autre. Les zones les plus ou les moins propices à la création d’entreprises restent les mêmes. Bien entendu la densité de population joue forcément un rôle sur le nombre d’entreprises créées. Il serait logique d’attendre que les départements les plus peuplés soient aussi ceux qui créent le plus d’entreprises. Le prochain exercice consistera donc à analyser le taux de créations d’entreprises par habitant et d’identifier les départements les plus dynamiques.

 

Retrouvez-nous dans notre prochain billet pour obtenir la réponse à cette question.



Publié dans Data et IT.

Donnez votre avis

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *