Gagnez de l’argent en répondant à nos enquêtes

Inscrivez-vous dès maintenant !
Le blog de la société IntoTheMinds
Conseils en Data & IT
Combien de hashtags faut-il mettre dans vos posts Linkedin ? [Etude]
May17

Combien de hashtags faut-il mettre dans vos posts Linkedin ? [Etude]

Combien d’hashtags faut-il mettre dans vos posts Linkedin pour en augmenter sa visibilité ? D’ailleurs, est-ce une bonne chose de mettre des hashtags et comment réagit l’algorithme de Linkedin ? J’ai analysé 4,988 millions de posts Linkedin dans plus de 100 pays et je vous apporte la réponse dans cet article. Si vous souhaitez recevoir d’autres résultats exclusifs par email, n’hésitez pas à vous...

Read More
Data Mining : définitions, 5 outils gratuits et techniques
May10

Data Mining : définitions, 5 outils gratuits et techniques

Venant après le processus de collecte et de préparation des données, l’analyse des données est une étape nécessaire pour trouver un sens à un ensemble de données (le dataset). Regarder des listes de données brutes ne permet guère de construire des modèles de comportement des clients, il faut donc trouver un moyen intelligent (le “data mining” ou “exploration des données”) de passer les informations au...

Read More
La place du data wrangling dans le cycle de valorisation des données
Apr19

La place du data wrangling dans le cycle de valorisation des données

Dans le monde de la data, le data wrangling est un peu le mot à la mode ces derniers temps. Nous vous en avons déjà proposé un aperçu général ici. Dans l’article d’aujourd’hui nous vous l’expliquons plus en détail et positionnons le data wrangling au sein du cycle de mise en valeur des données. Sommaire Rappel sur le data wrangling Etape 1 : l’acquisition des données Etape 2 : le stockage des données...

Read More
Excel domine le monde de l’entreprise … et ce n’est pas près de changer
Apr16

Excel domine le monde de l’entreprise … et ce n’est pas près de changer

Rares sont les marques qui ont un taux de pénétration de 100%. Microsoft est de celle-là. Plus fort encore, on peut affirmer qu’un de ses produits, Microsoft Excel, est utilisé par 99,99% des entreprises dans le monde. Microsoft Excel est partout. Vous n’en pouvez plus ? Et bien il va falloir vous y faire car ce n’est pas près de changer. Mais si Excel a des qualités indéniables, il faut aussi s’interroger sur...

Read More
Data Wrangling : définition, étapes, outils [guide 2021]
Mar29

Data Wrangling : définition, étapes, outils [guide 2021]

Le terme “Data wrangling” est également connu sous le nom de “Data Munging”. Ce terme technique peut sembler intimidant à première vue. L’ambition de cet article est de le démystifier. Le data wrangling est défini comme une partie importante d’un processus plus large appelé “préparation des données“. Le traitement des données est le processus mis en œuvre pour collecter, sélectionner,...

Read More
Benchmark ETL : quel temps faut-il pour traiter 1 milliard de lignes ?
Mar26

Benchmark ETL : quel temps faut-il pour traiter 1 milliard de lignes ?

Dans un article précédent, je mettais en avant l’importance de la vitesse de traitement pour le choix d’une solution de data preparation (ETL). J’avais réalisé un premier benchmark entre Alteryx, Tableau Prep et Anatella sur un fichier de 108 millions de lignes. Cette fois-ci j’ai répété l’opération sur 1,039 milliard de lignes et j’ai ajouté Talend au benchmark. Les résultats sont inattendus...

Read More
Data preparation : comment choisir la solution adaptée à vos besoins ?
Mar22

Data preparation : comment choisir la solution adaptée à vos besoins ?

J’utilise régulièrement 4 solutions de data preparation : Alteryx, Tableau Prep , Talend et Anatella. Le benchmark de G2 en recense pas moins de 40.  Dans cet article je vous explique pourquoi le benchmark G2 n’est pas forcément pertinent, et quels critères utiliser pour comparer les solutions ETL (Extract – Transform – Load) les plus adaptées à vos besoins. Sommaire Qu’est-ce qu’un ETL ? Les...

Read More
Benchmark : quel ETL choisir pour manipuler des fichiers de grande taille ?
Mar15

Benchmark : quel ETL choisir pour manipuler des fichiers de grande taille ?

En matière de data preparation, force est de constater qu’une grande partie des processus se passent encore “offline”, avec des archives extraites des bases de données relationnelles. Et quand il s’agit pour les data engineers de manipuler ces archives, mieux vaut avoir un ETL qui tienne la charge. Dans l’article d’aujourd’hui je vous propose d’aborder le sujet passionnant des fichiers...

Read More
Comment automatiser l’extraction de données à partir de fichiers Excel
Feb01

Comment automatiser l’extraction de données à partir de fichiers Excel

Voici le problème auquel j’ai été confronté récemment. Un client m’a demandé de traiter des données qui provenaient de centaines de fichiers Excel. Franchement je n’avais pas envie de passer des heures à extraire manuellement ces données. Alors j’ai automatisé le processus grâce à Anatella et ai visualisé les données sous Tableau par la suite. Voici un petit tuto de data preparation et une bonne manière de...

Read More
SEO : 50000 pages analysées et 2m de requêtes facilement accessibles
Jan25

SEO : 50000 pages analysées et 2m de requêtes facilement accessibles

Étude SEO. Nous avons analysé 50000 pages web, couvrant 185 mots-clés en lien avec la “data science” dans 16 pays. Les données brutes viennent d’Ahrefs. Nous avons utilisé Anatella pour préparer et nettoyer les données, et Tableau pour les visualiser. Le résultat principal révélé par cette étude est que des opportunités inexploitées existent de se classer en 1ère page de Google sur des mots-clés anglais en dehors des...

Read More
Data preparation : définition, exemples, conseils [guide 2021]
Jan18

Data preparation : définition, exemples, conseils [guide 2021]

Pour parler de la data preparation, quoi de mieux que de partir d’un constat. Dans le monde de la data, il y une règle que tout le monde connaît : 80% du temps d’un data scientist est passé à préparer ses données ; et seulement 20% à travailler vraiment dessus, notamment à les visualiser. Dans cet article nous donnons un coup de projecteur sur la data preparation : les problèmes les plus souvent rencontrés, les outils et...

Read More
Les 5 niveaux de la data visualisation : exemples et conseils [guide 2021]
Jan11

Les 5 niveaux de la data visualisation : exemples et conseils [guide 2021]

Après avoir écrit mon guide de la data visualisation, j’ai voulu développer dans un article séparé les 5 niveaux de la visualisation des données que j’y esquissais brièvement. Si vous voulez savoir où vous en êtes au niveau de votre pratique de la BI (Business Intelligence) et de la dataviz, cet article est fait pour vous ! Sommaire Introduction Niveau 0 (pas de dataviz) Niveau 1 (vous travaillez encore sous Excel ?)...

Read More
Data visualisation : définition, exemples, outils, conseils [guide 2021]
Dec09

Data visualisation : définition, exemples, outils, conseils [guide 2021]

La Data Visualisation (“visualisation des données” en français, ou dataviz pour les initiés) est la discipline qui s’attache à représenter sous forme graphique des données brutes. Visualiser les données doit avoir pour but de créer de la valeur. Ces dernières années ont vu l’émergence de nouveaux outils et pratiques autour de la data visualisation, mais également celle de nouveaux métiers. Dans cet article nous...

Read More
La data science expliquée par un enfant
Nov20

La data science expliquée par un enfant

Le terme “data science” reste opaque pour le commun des mortels. Pourtant ces 2 mots sont souvent repris dans la presse comme l’une des disciplines les plus tendance du moment. Pour démystifier les termes utilisés dans le domaine de la data, nous avons lancé une série de vidéos animées par notre présentateur-vedette : Pierre-Raffaele (10 ans au moment du tournage) 🙂 Après le succès de sa série sur “Le Monde du...

Read More
[Podcast] L’essence du Data Art et de la Data Visualisation
Oct09

[Podcast] L’essence du Data Art et de la Data Visualisation

Nicholas Rougeux se définit comme un “data artiste” (“data artist” en anglais) et le moins qu’on puisse dire c’est que son talent pour visualiser les données est évident. Tellement évident même qu’il commercialise son travail sous forme de posters … et je m’en suis même fait offrir un pour mon anniversaire 🙂 Courez voir son blog (www.c82.net) si vous manquez d’inspiration ou...

Read More
Tutoriel: comment créer un Joyplot sous Tableau
Oct02

Tutoriel: comment créer un Joyplot sous Tableau

Après vous avoir expliqué comment créer une hexmap isométrique, je m’attaque à un sujet plus difficile : créer un joyplot sous Tableau. J’ai utilisé un joyplot dans la visualisation que j’ai soumise à l’IronViz. Comme ce type de graphique est relativement rare est que j’ai un peu galéré pour parvenir au résultat escompté, je me suis dit qu’un tutoriel serait le bienvenu. Sommaire Définition du...

Read More
Hexmap isométrique sous Tableau : un guide pas-à-pas
Aug10

Hexmap isométrique sous Tableau : un guide pas-à-pas

Dans le cadre de ma participation à l’Iron Viz 2020, j’ai créé un nouveau type de visualisation sous Tableau qui m’a valu beaucoup de commentaires positifs. Je l’ai appelé “hexmap isométrique’ (isometric hexmap). Dans cet article j’explique comment reproduire ce type de représentation et vous donne accès aux fichiers sources. Vous pouvez accéder à la version interactive sur Tableau Public. Si...

Read More
Tableau Iron Viz 2020 : réflexions sur ma première participation
Aug04

Tableau Iron Viz 2020 : réflexions sur ma première participation

L’Iron Viz est le “championnat du monde” qui couronne les 3 meilleurs développeurs Tableau, un logiciel qui permet de visualiser les données. Cette année j’ai décidé d’y participer également (accéder à ma contribution ici). Dans cet article je reviens sur mon expérience, ce que la préparation du concours m’a appris et sur les difficultés que j’ai rencontrées. 6 conseils pour une bonne #Dataviz...

Read More
Migrations en Europe : visualisation interactive sous Tableau
Jul13

Migrations en Europe : visualisation interactive sous Tableau

Comment représenter de manière attractive les migrations vers les pays de l’Union Européenne ? C’est la question à laquelle j’ai voulu répondre en utilisant Tableau Software. Si la question était simple, la réponse était loin de l’être et il m’a fallu quelques jours de réflexion pour trouver la bonne solution et le bon design. Je vous la présente ci-dessous avec le modus operandi pour la reproduire....

Read More
Fuzzy matching entre tables : 2 ETL comparés (Tableau Prep Builder vs. Anatella)
Jun12

Fuzzy matching entre tables : 2 ETL comparés (Tableau Prep Builder vs. Anatella)

Si vous manipulez des données à des fins d’analyses et/ou de visualisations, vous avez sans doute déjà rencontré ce problème. Vous devez faire une jointure entre 2 bases de données mais les entrées dans le champ de référence ne sont pas exactement les mêmes. Différences d’orthographe, nomenclatures différentes, … les raisons sont multiples et variées. Dans le cadre d’une recherche que je fais pour visualiser...

Read More