Gagnez de l’argent en répondant à nos enquêtes

Inscrivez-vous dès maintenant !
Le blog de la société IntoTheMinds
Conseils en Data & IT
Dialoguer avec les morts, le futur de l’intelligence artificielle ?
Déc01

Dialoguer avec les morts, le futur de l’intelligence artificielle ?

Les deadbots sont une nouvelle application de l’intelligence artificielle. Personnellement, elle me fait peur. Les deadbots sont des chatbots qui vous permettent de converser avec des personnes décédées en en imitant les réponses. Leur développement s’inscrit dans un contexte plus global de virtualisation des relations et d’effacement des frontières entre le monde physique et le monde digital. Joshua Barbeau a parlé...

Read More
On pardonne plus facilement les erreurs aux algorithmes qu’aux humains
Nov26

On pardonne plus facilement les erreurs aux algorithmes qu’aux humains

Les algorithmes ont pris le pouvoir. Ils sont chargés de prendre de plus en plus de décisions. Des décisions de plus en plus complexes qui affectent tous les pans de nos vies. Pourtant les algorithmes ne sont pas parfaits. Ils font aussi des erreurs. Alors une question se pose : pour une même erreur, pardonnons-nous plus facilement aux algorithmes qu’aux êtres humains ? Une étude de 2021 apporte un éclairage inédit sur la...

Read More
Comment favoriser la découverte avec les algorithmes de recommandation
Nov22

Comment favoriser la découverte avec les algorithmes de recommandation

La conférence ReCSys 2021 sur les algorithmes de recommandation vient de se terminer. Le mode hybride n’a pas facilité les interactions mais les présentations intéressantes se sont succédé et n’auront pas manqué de susciter, çà et là, de nouvelles idées. Tel a été le cas de la keynote de Cynthia Liem (Delft University of Technology).  Cynthia a la particularité de combiner 2 talents : elle est chercheuse en informatique...

Read More
Cloud Act et RGPD : peut-on héberger ses données dans le Cloud ?
Nov17

Cloud Act et RGPD : peut-on héberger ses données dans le Cloud ?

L’utilisation que vous faites de services dans le Cloud vous conduit-elle à enfreindre le RGPD ? Pouvez-vous stocker vos données sur AWS, Azure, … tout en respectant le RGPD ? Le Cloud Act américain sème le doute et crée une incertitude juridique dont nous avons débattu avec Me. Jérôme Tassi, avocat au barreau de Paris. Introduction Le point de départ de cet article (et de la vidéo qui l’accompagne) est une réflexion...

Read More
Le panda est l’émoji qui rapporte le plus sur Linkedin
Juin28

Le panda est l’émoji qui rapporte le plus sur Linkedin

L’analyse de 2,9 millions d’émojis sur Linkedin livre une information surprenante : le  🐼 est l’émoji qui susciterait le plus de réactions. Ce cas d’étude nous offre une occasion de jeter un regard critique sur les données et de comprendre l’origine d’un phénomène qui pollue Linkedin. Suivez-moi pour un exercice de data mining passionnant. Pour en savoir plus sur les facteurs qui impactent la...

Read More
Les émojis les plus utilisés sur Linkedin [analyse et statistiques]
Juin21

Les émojis les plus utilisés sur Linkedin [analyse et statistiques]

Quels sont les émojis les plus utilisés sur Linkedin ? Les émojis les plus utilisés sur Linkedin varient-ils en fonction de la langue et du pays ? Dans cette analyse découvrez les statistiques exclusives sur l’utilisation des émojis sur Linkedin. Si vous êtes passionné par les statistiques sur Linkedin, ne manquez pas mes autres billets sur le sujet : statistiques sur les hashtags, les 3 facteurs qui expliquent 55% de la...

Read More
Quels sont les hashtags les plus populaires sur Linkedin ?
Juin16

Quels sont les hashtags les plus populaires sur Linkedin ?

Les hashtags sur Linkedin sont sans doute un des sujets les plus populaires au sujet de ce réseau social. Des hypothèses existent sur l’utilisation que fait l’algorithme de Linkedin des hashtags. Pourtant, j’ai démontré statistiquement ici que les hashtags n’avaient pas d’impact significatif sur la viralité des posts. Quoi qu’il en soit, le dataset dont je dispose (4,6 millions de posts) permet...

Read More
Linkedin : les sentiments exprimés et leur effet sur la viralité
Juin14

Linkedin : les sentiments exprimés et leur effet sur la viralité

Tout le monde s’accorde pour dire que le contenu des posts Linkedin est déterminant dans la probabilité qu’ils deviennent viraux. Aujourd’hui je ne vais pas répondre à la question « De quoi faut-il parler sur Linkedin ? » mais plutôt « Comment faut-il en parler ?« . J’ai utilisé un corpus de 4 millions de posts Linkedin pour mesurer les sentiments exprimés et analyser la corrélation avec leur viralité. Cette...

Read More
Tutoriel Tableau : un diagramme radial et une carte circulaire
Juin09

Tutoriel Tableau : un diagramme radial et une carte circulaire

Comment faire un diagramme radial sous Tableau ? Comment y intégrer une carte géographique circulaire ? Dans cet article je vous guide pas à pas dans la réalisation de cette data visualisation. Introduction Pour ma prochaine étude sur les levées de fonds en Europe, j’ai voulu tester une data visualisation sous forme de diagramme radial. Pour obtenir un résultat encore plus intéressant, j’ai intégré en son centre une carte...

Read More
Les 11 défis de la data préparation et du data wrangling
Juin07

Les 11 défis de la data préparation et du data wrangling

Les évènements de 2020 ont accéléré le basculement vers le télétravail et les relations digitales. Avec la digitalisation, une autre transformation est également en marche: la transformation analytique. Pour faire face à cette révolution des données, je trouve que les entreprises ne disposent pas forcément des bons outils quand il s’agit de préparer et d’analyser les données (c’est la data preparation ou le data...

Read More
Data preparation : comment gagner 85% de temps de traitement
Juin02

Data preparation : comment gagner 85% de temps de traitement

Dans un article précédent j’avais réalisé un benchmark de 4 solutions ETL pour le traitement d’un fichier d’un milliard de lignes. Aujourd’hui je teste l’effet du SSD et des formats de fichiers propriétaires sur la vitesse de traitement dans Alteryx, Tableau Prep, Talend et Anatella. Les résultats sont assez inattendus. Introduction et rappel Dans mon analyse précédente j’avais comparé la vitesse de...

Read More
Les 3 facteurs qui déterminent 55% du succès de vos posts Linkedin
Mai31

Les 3 facteurs qui déterminent 55% du succès de vos posts Linkedin

Comprendre le fonctionnement de l’algorithme de Linkedin est une nécessité pour rester visible sur ce réseau social. Dans cet article je vous révèle les résultats d’une analyse que j’ai réalisé sur 4,599 millions de posts Linkedin dans 193 pays. Les résultats sont étonnants et mettent à mal pas mal de préconçus. Seulement 3 facteurs jouent un rôle sur la visibilité des posts Linkedin. Cet article reprend en outre les...

Read More
Voici le facteur qui compte le plus pour la viralité de vos posts Linkedin
Mai28

Voici le facteur qui compte le plus pour la viralité de vos posts Linkedin

Après avoir abordé l’effet des émojis et du nombre de mots sur la viralité des posts Linkedin, il est temps de révéler LE facteur qui écrase tous les autres. Ce facteur compte pour 1/3 dans le succès de vos posts Linkedin. Vous devriez donc prendre le temps de lire les résultats de l’étude que je viens de mener sur 4,6 millions de posts Linkedin dans 193 pays. Les résultats inédits présentés ici ont été obtenus grâce à des...

Read More
Linkedin : statistiques d’engagement par pays et par langue
Mai26

Linkedin : statistiques d’engagement par pays et par langue

Comment varie l’engagement sur Linkedin en fonction de la langue et du pays ? Au niveau mondial, 71,06% des posts Linkedin ne reçoivent aucun commentaire, et 24,39% aucun Like. L’analyse de 4,599 millions de posts Linkedin nous offre une vue objective sur les différences importantes qui existent. Les données proviennent d’un dataset mis à disposition par Linkalyze. La préparation des données a été réalisée en...

Read More
Linkedin : l’étonnant effet des émojis sur la viralité des posts
Mai25

Linkedin : l’étonnant effet des émojis sur la viralité des posts

Faut-il mettre des émojis dans vos posts Linkedin et si oui combien ? Dans l’article d’aujourd’hui je vous révèle les résultats d’une étude que j’ai menée sur 4,599 millions de posts Linkedin. Cette étude suit celles que j’ai déjà publiées sur l’impact des hashtags et du nombre de mots. Si vous voulez être les premiers à recevoir mes résultats, abonnez-vous à ma newsletter (n’oubliez pas...

Read More
224 mots, le nombre magique pour booster la viralité de vos posts Linkedin
Mai19

224 mots, le nombre magique pour booster la viralité de vos posts Linkedin

Le nombre de mots est un des facteurs qui détermine le succès d’un post sur Linkedin, au même titre que les hashtags. J’ai réalisé une analyse sur près de 5 millions de posts dans 100 pays qui montre une corrélation linéaire entre le nombre de mots d’un post sur Linkedin et son nombre de likes / commentaires. Les posts qui comprennent entre 224 et 227 mots sont 6x plus de chances d’obtenir plus de 100 réactions...

Read More
Combien de hashtags faut-il mettre dans vos posts Linkedin ? [Etude]
Mai17

Combien de hashtags faut-il mettre dans vos posts Linkedin ? [Etude]

Combien d’hashtags faut-il mettre dans vos posts Linkedin pour en augmenter sa visibilité ? D’ailleurs, est-ce une bonne chose de mettre des hashtags et comment réagit l’algorithme de Linkedin ? J’ai analysé 4,988 millions de posts Linkedin dans plus de 100 pays et je vous apporte la réponse dans cet article. Si vous souhaitez recevoir d’autres résultats exclusifs par email, n’hésitez pas à vous...

Read More
Data Mining : définitions, 5 outils gratuits et techniques
Mai10

Data Mining : définitions, 5 outils gratuits et techniques

Venant après le processus de collecte et de préparation des données, l’analyse des données est une étape nécessaire pour trouver un sens à un ensemble de données (le dataset). Regarder des listes de données brutes ne permet guère de construire des modèles de comportement des clients, il faut donc trouver un moyen intelligent (le « data mining » ou « exploration des données ») de passer les informations au crible. En utilisant...

Read More
L’IA enrichit l’expérience des visiteurs de l’exposition Alechinsky
Avr30

L’IA enrichit l’expérience des visiteurs de l’exposition Alechinsky

Dans un contexte où la culture est sévèrement impactée par la crise du Covid, il est plus que jamais important de fidéliser les visiteurs. J’avais proposé différentes pistes de réflexions pour améliorer l’expérience client dans les musées et vous propose aujourd’hui de découvrir une initiative des Musées Royaux des Beaux-Arts de Bruxelles. Une exposition consacrée à l’artiste belge Pierre Alechinsky vient de...

Read More
La place du data wrangling dans le cycle de valorisation des données
Avr19

La place du data wrangling dans le cycle de valorisation des données

Dans le monde de la data, le data wrangling est un peu le mot à la mode ces derniers temps. Nous vous en avons déjà proposé un aperçu général ici. Dans l’article d’aujourd’hui nous vous l’expliquons plus en détail et positionnons le data wrangling au sein du cycle de mise en valeur des données. Sommaire Rappel sur le data wrangling Etape 1 : l’acquisition des données Etape 2 : le stockage des données...

Read More
Excel domine le monde de l’entreprise … et ce n’est pas près de changer
Avr16

Excel domine le monde de l’entreprise … et ce n’est pas près de changer

Rares sont les marques qui ont un taux de pénétration de 100%. Microsoft est de celle-là. Plus fort encore, on peut affirmer qu’un de ses produits, Microsoft Excel, est utilisé par 99,99% des entreprises dans le monde. Microsoft Excel est partout. Vous n’en pouvez plus ? Et bien il va falloir vous y faire car ce n’est pas près de changer. Mais si Excel a des qualités indéniables, il faut aussi s’interroger sur...

Read More
Data Wrangling : définition, étapes, outils [guide 2021]
Mar29

Data Wrangling : définition, étapes, outils [guide 2021]

Le terme « Data wrangling » est également connu sous le nom de « Data Munging ». Ce terme technique peut sembler intimidant à première vue. L’ambition de cet article est de le démystifier. Le data wrangling est défini comme une partie importante d’un processus plus large appelé « préparation des données« . Le traitement des données est le processus mis en œuvre pour collecter, sélectionner, structurer, enrichir et...

Read More
Benchmark ETL : quel temps faut-il pour traiter 1 milliard de lignes ?
Mar26

Benchmark ETL : quel temps faut-il pour traiter 1 milliard de lignes ?

Dans un article précédent, je mettais en avant l’importance de la vitesse de traitement pour le choix d’une solution de data preparation (ETL). J’avais réalisé un premier benchmark entre Alteryx, Tableau Prep et Anatella sur un fichier de 108 millions de lignes. Cette fois-ci j’ai répété l’opération sur 1,039 milliard de lignes et j’ai ajouté Talend au benchmark. Les résultats sont inattendus...

Read More
Data preparation : comment choisir la solution adaptée à vos besoins ?
Mar22

Data preparation : comment choisir la solution adaptée à vos besoins ?

J’utilise régulièrement 4 solutions de data preparation : Alteryx, Tableau Prep , Talend et Anatella. Le benchmark de G2 en recense pas moins de 40.  Dans cet article je vous explique pourquoi le benchmark G2 n’est pas forcément pertinent, et quels critères utiliser pour comparer les solutions ETL (Extract – Transform – Load) les plus adaptées à vos besoins. Sommaire Qu’est-ce qu’un ETL ? Les...

Read More
Benchmark : quel ETL choisir pour manipuler des fichiers de grande taille ?
Mar15

Benchmark : quel ETL choisir pour manipuler des fichiers de grande taille ?

En matière de data preparation, force est de constater qu’une grande partie des processus se passent encore « offline », avec des archives extraites des bases de données relationnelles. Et quand il s’agit pour les data engineers de manipuler ces archives, mieux vaut avoir un ETL qui tienne la charge. Dans l’article d’aujourd’hui je vous propose d’aborder le sujet passionnant des fichiers de grande...

Read More
ETL : utilisation des opérateurs ternaires pour l’extraction de données dans Excel
Fév12

ETL : utilisation des opérateurs ternaires pour l’extraction de données dans Excel

Comment utiliser une solution ETL pour extraire des informations d’un fichier Excel et les réconcilier ? Après vous avoir expliqué une méthode pour automatiser l’extraction à partir de nombreux fichiers Excel, dans le billet d’aujourd’hui je vais plus en profondeur et vous explique comment j’ai utilisé des opérateurs ternaires pour extraire l’information voulue. Présentation du problème Le problème...

Read More
Comment automatiser l’extraction de données à partir de fichiers Excel
Fév01

Comment automatiser l’extraction de données à partir de fichiers Excel

Voici le problème auquel j’ai été confronté récemment. Un client m’a demandé de traiter des données qui provenaient de centaines de fichiers Excel. Franchement je n’avais pas envie de passer des heures à extraire manuellement ces données. Alors j’ai automatisé le processus grâce à Anatella et ai visualisé les données sous Tableau par la suite. Voici un petit tuto de data preparation et une bonne manière de...

Read More
SEO : 50000 pages analysées et 2m de requêtes facilement accessibles
Jan25

SEO : 50000 pages analysées et 2m de requêtes facilement accessibles

Étude SEO. Nous avons analysé 50000 pages web, couvrant 185 mots-clés en lien avec la « data science » dans 16 pays. Les données brutes viennent d’Ahrefs. Nous avons utilisé Anatella pour préparer et nettoyer les données, et Tableau pour les visualiser. Le résultat principal révélé par cette étude est que des opportunités inexploitées existent de se classer en 1ère page de Google sur des mots-clés anglais en dehors des pays...

Read More
Data preparation : définition, exemples, conseils [guide 2021]
Jan18

Data preparation : définition, exemples, conseils [guide 2021]

Pour parler de la data preparation, quoi de mieux que de partir d’un constat. Dans le monde de la data, il y une règle que tout le monde connaît : 80% du temps d’un data scientist est passé à préparer ses données ; et seulement 20% à travailler vraiment dessus, notamment à les visualiser. Dans cet article nous donnons un coup de projecteur sur la data preparation : les problèmes les plus souvent rencontrés, les outils et...

Read More
Les 5 niveaux de la data visualisation : exemples et conseils [guide 2021]
Jan11

Les 5 niveaux de la data visualisation : exemples et conseils [guide 2021]

Après avoir écrit mon guide de la data visualisation, j’ai voulu développer dans un article séparé les 5 niveaux de la visualisation des données que j’y esquissais brièvement. Si vous voulez savoir où vous en êtes au niveau de votre pratique de la BI (Business Intelligence) et de la dataviz, cet article est fait pour vous ! Sommaire Introduction Niveau 0 (pas de dataviz) Niveau 1 (vous travaillez encore sous Excel ?)...

Read More
Data visualisation : définition, exemples, outils, conseils [guide 2021]
Déc09

Data visualisation : définition, exemples, outils, conseils [guide 2021]

La Data Visualisation (« visualisation des données » en français, ou dataviz pour les initiés) est la discipline qui s’attache à représenter sous forme graphique des données brutes. Visualiser les données doit avoir pour but de créer de la valeur. Ces dernières années ont vu l’émergence de nouveaux outils et pratiques autour de la data visualisation, mais également celle de nouveaux métiers. Dans cet article nous...

Read More
[Podcast] L’apprentissage des outils numériques aux enfants
Nov23

[Podcast] L’apprentissage des outils numériques aux enfants

Nathalie Kuborn (We Are Coders), Gaëlle Girardeau (Cood) et Christophe Coquis (Geek Junior) nous parlent de l’apprentissage de l’informatique, des outils numériques et de l’introduction à la culture numérique pour les enfants : marché, parcours et conseils. Marché de l’apprentissage des outils numériques aux enfants L’émergence d’un besoin Le marché de l’apprentissage informatique aux enfants est en pleine émergence. Pour Gaëlle, cela...

Read More
La data science expliquée par un enfant
Nov20

La data science expliquée par un enfant

Le terme « data science » reste opaque pour le commun des mortels. Pourtant ces 2 mots sont souvent repris dans la presse comme l’une des disciplines les plus tendance du moment. Pour démystifier les termes utilisés dans le domaine de la data, nous avons lancé une série de vidéos animées par notre présentateur-vedette : Pierre-Raffaele (10 ans au moment du tournage) 🙂 Après le succès de sa série sur « Le Monde du Business », il...

Read More
[Podcast] L’essence du Data Art et de la Data Visualisation
Oct09

[Podcast] L’essence du Data Art et de la Data Visualisation

Nicholas Rougeux se définit comme un « data artiste » (« data artist » en anglais) et le moins qu’on puisse dire c’est que son talent pour visualiser les données est évident. Tellement évident même qu’il commercialise son travail sous forme de posters … et je m’en suis même fait offrir un pour mon anniversaire 🙂 Courez voir son blog (www.c82.net) si vous manquez d’inspiration ou si vous voulez voir...

Read More
Tutoriel: comment créer un Joyplot sous Tableau
Oct02

Tutoriel: comment créer un Joyplot sous Tableau

Après vous avoir expliqué comment créer une hexmap isométrique, je m’attaque à un sujet plus difficile : créer un joyplot sous Tableau. J’ai utilisé un joyplot dans la visualisation que j’ai soumise à l’IronViz. Comme ce type de graphique est relativement rare est que j’ai un peu galéré pour parvenir au résultat escompté, je me suis dit qu’un tutoriel serait le bienvenu. Sommaire Définition du...

Read More
Covid-19 : impact sur le marché du conseil IT et perspectives
Sep25

Covid-19 : impact sur le marché du conseil IT et perspectives

La crise du Covid-19 a eu un impact énorme sur le marché de l’informatique. Certains pans de ce secteur en ont profité (pensez à tout ce qui tourne autour du télétravail) mais d’autres ont également énormément souffert. C’est le cas du conseil en IT. D’après une étude de Whoz publiée en Juin 2020, 13% des projets avait été abandonnés et 21% avaient été mis « on hold ». Jean-Philippe Couturier, le CEO de Whoz,...

Read More