Le blog de la société IntoTheMinds
Conseils en Data & IT
Le panda est l’émoji qui rapporte le plus sur Linkedin
Juin28

Le panda est l’émoji qui rapporte le plus sur Linkedin

L’analyse de 2,9 millions d’émojis sur Linkedin livre une information surprenante : le  ? est l’émoji qui susciterait le plus de réactions. Ce cas d’étude nous offre une occasion de jeter un regard critique sur les données et de comprendre l’origine d’un phénomène qui pollue Linkedin. Suivez-moi pour un exercice de data mining passionnant. Pour en savoir plus sur les facteurs qui impactent la viralité sur Linkedin, je vous invite à lire mon analyse complète ici...

Lire la suite
Les émojis les plus utilisés sur Linkedin [analyse et statistiques]
Juin21

Les émojis les plus utilisés sur Linkedin [analyse et statistiques]

Quels sont les émojis les plus utilisés sur Linkedin ? Les émojis les plus utilisés sur Linkedin varient-ils en fonction de la langue et du pays ? Dans cette analyse découvrez les statistiques exclusives sur l’utilisation des émojis sur Linkedin. Si vous êtes passionné par les statistiques sur Linkedin, ne manquez pas mes autres billets sur le sujet : statistiques sur les hashtags, les 3 facteurs qui expliquent 55% de la viralité d’un post Linkedin et...

Lire la suite
Quels sont les hashtags les plus populaires sur Linkedin ?
Juin16

Quels sont les hashtags les plus populaires sur Linkedin ?

Les hashtags sur Linkedin sont sans doute un des sujets les plus populaires au sujet de ce réseau social. Des hypothèses existent sur l’utilisation que fait l’algorithme de Linkedin des hashtags. Pourtant, j’ai démontré statistiquement ici que les hashtags n’avaient pas d’impact significatif sur la viralité des posts. Quoi qu’il en soit, le dataset dont je dispose (4,6 millions de posts) permet d’offrir un aperçu intéressant des hashtags les plus utilisés dans le monde, ainsi que...

Lire la suite
Tutoriel Tableau : un diagramme radial et une carte circulaire
Juin09

Tutoriel Tableau : un diagramme radial et une carte circulaire

Comment faire un diagramme radial sous Tableau ? Comment y intégrer une carte géographique circulaire ? Dans cet article je vous guide pas à pas dans la réalisation de cette data visualisation. Introduction Pour ma prochaine étude sur les levées de fonds en Europe, j’ai voulu tester une data visualisation sous forme de diagramme radial. Pour obtenir un résultat encore plus intéressant, j’ai intégré en son centre une carte interactive circulaire. Vous trouverez 2 parties dans...

Lire la suite
Data Mining : définitions, 5 outils gratuits et techniques
Mai10

Data Mining : définitions, 5 outils gratuits et techniques

Venant après le processus de collecte et de préparation des données, l’analyse des données est une étape nécessaire pour trouver un sens à un ensemble de données (le dataset). Regarder des listes de données brutes ne permet guère de construire des modèles de comportement des clients, il faut donc trouver un moyen intelligent (le « data mining » ou « exploration des données ») de passer les informations au crible. En utilisant des approches statistiques ainsi que des algorithmes, il...

Lire la suite
Data Wrangling : définition, étapes, outils [guide 2021]
Mar29

Data Wrangling : définition, étapes, outils [guide 2021]

Le terme « Data wrangling » est également connu sous le nom de « Data Munging ». Ce terme technique peut sembler intimidant à première vue. L’ambition de cet article est de le démystifier. Le data wrangling est défini comme une partie importante d’un processus plus large appelé « préparation des données« . Le traitement des données est le processus mis en Å“uvre pour collecter, sélectionner, structurer, enrichir et finalement transformer les informations dans le but de répondre à une question spécifique....

Lire la suite
Benchmark : quel ETL choisir pour manipuler des fichiers de grande taille ?
Mar15

Benchmark : quel ETL choisir pour manipuler des fichiers de grande taille ?

En matière de data preparation, force est de constater qu’une grande partie des processus se passent encore « offline », avec des archives extraites des bases de données relationnelles. Et quand il s’agit pour les data engineers de manipuler ces archives, mieux vaut avoir un ETL qui tienne la charge. Dans l’article d’aujourd’hui je vous propose d’aborder le sujet passionnant des fichiers de grande taille en comparant 2 ETL’s que j’utilise au quotidien : Alteryx et Anatella. Seulement...

Lire la suite
ETL : utilisation des opérateurs ternaires pour l’extraction de données dans Excel
Fév12

ETL : utilisation des opérateurs ternaires pour l’extraction de données dans Excel

Comment utiliser un outil ETL pour extraire des informations d’un fichier Excel et les réconcilier ? Après vous avoir expliqué une méthode pour automatiser l’extraction à partir de nombreux fichiers Excel, dans le billet d’aujourd’hui je vais plus en profondeur et vous explique comment j’ai utilisé des opérateurs ternaires pour extraire l’information voulue. Présentation du problème Le problème auquel j’ai été confronté est relativement courant. Vous avez un fichier peu structuré rempli par un utilisateur ou...

Lire la suite
Data visualisation : définition, exemples, outils, conseils [guide 2023]
Déc09

Data visualisation : définition, exemples, outils, conseils [guide 2023]

La Data Visualisation (« visualisation des données » en français, ou « dataviz » pour les initiés) est la discipline qui s’attache à représenter sous forme graphique des données brutes. Visualiser les données doit avoir pour but de créer de la valeur. Ces dernières années ont vu l’émergence de nouveaux outils et pratiques autour de la data visualisation, mais également celle de nouveaux métiers. J’ai mis cet article à jour en Avril 2023 pour refléter les évolutions des solutions de...

Lire la suite
[Podcast] L’essence du Data Art et de la Data Visualisation
Oct09

[Podcast] L’essence du Data Art et de la Data Visualisation

Nicholas Rougeux se définit comme un « data artiste » (« data artist » en anglais) et le moins qu’on puisse dire c’est que son talent pour visualiser les données est évident. Tellement évident même qu’il commercialise son travail sous forme de posters … et je m’en suis même fait offrir un pour mon anniversaire 🙂 Courez voir son blog (www.c82.net) si vous manquez d’inspiration ou si vous voulez voir ce qu’il se fait de mieux en matière de « dataviz »....

Lire la suite
Google MyActivity vous redonne le contrôle de vos données. Vérité ou mensonge ?
Juil20

Google MyActivity vous redonne le contrôle de vos données. Vérité ou mensonge ?

C’est maintenant officiel. Les entreprises sont allées trop loin dans la collecte et l’utilisation de données comportementales. Voilà une déclaration qui mérite d’être explicité. Quel évènement peut me permettre d’affirmer chose pareille. Mon argument c’est que Google a fait un geste très important, annonciateur d’un changement plus profond. Google a effet annoncé qu’il donnait à chaque utilisateur la possibilité d’accéder aux données qui sont collectées sur lui et de s’y opposer, cela grâce à Google MyActivity....

Lire la suite
L’application « Spott » d’Appiness promise à un bel avenir
Mai15

L’application « Spott » d’Appiness promise à un bel avenir

La semaine dernière j’ai été invité par le directeur de l’innovation à la VRT (télévision publique néerlandophone de Belgique) à leur événement creative circle III. Il s’agissait pour la VRT de présenter les innovations actuellement en cours d’étude dans leur laboratoire. Ce dernier, dénommé Sandox, accueille par période de 3 mois des entrepreneurs désireux de se frotter à la réalité du business. Les présentations et démonstrations furent données par 5 jeunes pousses : Fisheye, Limecraft, Moovly,...

Lire la suite
iOT : un objet qui transforme le partage musical
Avr22

iOT : un objet qui transforme le partage musical

La musique peut être vécue et consommée de nombreuses manières. Mais aujourd’hui, il est essentiellement digitale (en dépit de la renaissance du vinyle) et l’expérience client s’est adaptée. Beyond.io, une agence anversoise spécialisée dans l’internet des objets, a voulu repenser cette expérience client. Le projet X-II a été leur réponse. Le partage musical : une expérience qui a changé Le projet X-II a été lancé afin de proposer une nouvelle expérience autour de la musique, et...

Lire la suite
Assurances: vers la fin du partage des risques ?
Avr18

Assurances: vers la fin du partage des risques ?

Il existe un principe important sous-jacent à toute assurance: le partage des risques. Les bons conducteurs paient une partie du risque que représentent les mauvais conducteurs; les personnes en bonne santé paient pour ceux qui sont malades (c’est la mutualisation du risque; les Américains appellent cela une gestion «socialiste»). En Europe continentale toutefois les assurances ont toujours favorisé une approche de groupe au détriment d’une approche individualiste. La révolution des données (Big Data) sonne peut-être le...

Lire la suite
Mobile Me : votre voiture n’a pas de secrets pour Mercedes
Avr11

Mobile Me : votre voiture n’a pas de secrets pour Mercedes

Aujourd’hui, les voitures peuvent être connectés à votre smartphone; non seulement pour faire des appels, mais aussi pour la contrôler à distance. L’application Mobile Me de Mercedes permet au propriétaire de surveiller les fonctionnalités de base et celles plus avancées de son véhicule grâce à son smartphone. La présence d’une carte SIM présente dans les véhicules modernes est le catalyseur de cette connectivité améliorée; mais elle permet aussi à Mercedes de devenir un fournisseur de données...

Lire la suite
Les boîtes noires sont-elles l’avenir de l’assurance automobile ?
Mar25

Les boîtes noires sont-elles l’avenir de l’assurance automobile ?

Les capteurs télématiques, également appelés boîtes intelligentes ou boîtes noires, sont des dispositifs installés dans une voiture pour surveiller le comportement du conducteur (vitesse, accélération, décélération, …). Ils sont de plus en plus utilisés par les compagnies d’assurance pour développer une offre dite « pay-as-you-drive » dans laquelle votre comportement de conduite détermine le prix que vous payez. Cette offre tarifaire peut être particulièrement intéressante pour les jeunes conducteurs qui sont d’ordinaire obligés de payer des primes d’assurance...

Lire la suite
Nouvelles émoticônes : l’algorithme de Facebook encore meilleur
Mar24

Nouvelles émoticônes : l’algorithme de Facebook encore meilleur

L’algorithme de Facebook sera encore plus précis avec les derniers boutons récemment ajoutés par le réseau social. Le bouton « dislike » s’est mué en légende urbaine pendant des années (même Mark Zuckerberg y avait fait référence et avait laissé espérer ses plus fervents aficionados), mais finalement Facebook a choisi d’ajouter une nouvelle gamme d’emoji permettant d’attacher de nouvelles émotions aux contenus. Ces nouvelles fonctionnalités s’appellent « J’adore », « haha », « wouah », « Grrr », « triste ». Ces boutons, sans vous le remarquiez, permettront à...

Lire la suite
Big Data : quel rôle pour les bases de données tierces
Mar21

Big Data : quel rôle pour les bases de données tierces

La collecte et l’intégration des bases de données tierces fera l’objet d’une présentatin que je donnerai à l’occasion de la conférence Big Data de l’Union Européenne des Radiodiffuseurs (UER) à Genève les 22-23 Mars 2016. Je présenterai trois cas concrets très intéressants de sociétés qui ont utilisé des base de données tierce pour enrichir leur compréhension du comportement client et améliorer la précision de leurs algorithmes. Je commencerai par la compagnie aérienne TAM (dont nous avons déjà parlé sur ce...

Lire la suite
Big Data : votre responsabilité en 4 points essentiels
Mar09

Big Data : votre responsabilité en 4 points essentiels

J’ai assisté cette semaine à un séminaire sur les aspects juridiques associés au Big Data. Ce séminaire, animé par Philippe Laurent (avocat au barreau de Bruxelles) était très instructif. En particulier un cadre conceptuel a été proposé pour distinguer les différentes situations susceptibles de se présenter à vous si vous vous lancez dans le Big Data (ou dans le small data). Ce cadre m’a semblé tellement limpide et utile que j’ai immédiatement pensé à en faire...

Lire la suite
Algorithmes: notre liberté est-elle menacée ?
Fév22

Algorithmes: notre liberté est-elle menacée ?

Si vous suivez l’actualité vous avez sans doute entendu parler de cette nouvelle étonnante : un algorithme a vaincu le champion européen du jeu de Go. Encore impensable il y a quelques années, cette victoire de la machine sur l’Homme marque une étape importante dans les progrès de l’intelligence artificielle (AI) ; à tel point qu’un article y a été consacré dans la revue Nature du 28 Janvier 2016. Les spécialistes du Big Data pensaient en effet...

Lire la suite
Facebook mis en demeure : vers plus de transparence dans le Big Data ?
Fév12

Facebook mis en demeure : vers plus de transparence dans le Big Data ?

Pas plus tard que lundi, nous annoncions la prochaine révolution Big Data: les algorithmes deviendraient plus transparents. Nous soutenions que les consommateurs étaient de plus en plus conscients de la sensibilité de leurs données et finiraient par exiger des explications sur la façon dont ces dernières sont utilisées, menant de fait à plus de transparence dans le Big Data. Lundi soir (08 Février 2016) l’autorité française de protection des données (CNIL) en collaboration avec la répression...

Lire la suite
Big Data : voici la prochaine révolution
Fév08

Big Data : voici la prochaine révolution

C’est le début de la prochaine révolution Big Data. Elle s’est déroulée en toute discrétion. Un projet de loi a été voté en France mi-Janvier qui va forcer l’administration fiscale à révéler les variables dans les algorithmes utilisés pour prendre des décisions individuelles. En d’autres termes, si vous êtes choisi pour un contrôle fiscal par exemple, vous serez en droit de demander des comptes et d’obtenir des informations sur les variables qui auront conduit à ce...

Lire la suite
Quel est l’avenir de la radio?
Oct12

Quel est l’avenir de la radio?

L’espoir que nous avions il y a quelques années de voir les jeunes auditeurs habitués aux applications mobiles et au streaming revenir à ce qu’on appelle la consommation linéaire, a disparu (voir notre dernier article sur les habitudes de consommation de la radio). Nous sommes actuellement dans une période de transition, comme l’a souligné le CEO de la BBC dans un récent discours, et nous ne savons pas exactement quelle en sera l’issue. L’incertitude est maximale...

Lire la suite
Les nouvelles générations n’écouteront plus jamais la radio … comme avant
Oct07

Les nouvelles générations n’écouteront plus jamais la radio … comme avant

J’ai récemment donné une présentation sur le Big Data et le Data Mining lors des Radio Days de l’UER à Riga (Lettonie) où j’ai rencontré les responsables marketing et opérationnels des différentes radiodiffuseurs européens. Voici les deux grandes conclusions sur le marché de la radio que j’aimerais partager avec vous: La consommation du média « Radio » est stable depuis plus d’une décennie, quel que soit le pays Les usages se modifient au sein de la nouvelle génération...

Lire la suite
Et si les banques se servaient de Facebook pour décider de l’obtention d’un prêt ?
Sep08

Et si les banques se servaient de Facebook pour décider de l’obtention d’un prêt ?

Avez-vous entendu parler du « dernier » brevet de Facebook pour évaluer, sur la base de votre réseau social, si un prêt pour sera accordé ou pas ? Tout le monde en parle mais malgré tous mes efforts j’ai été incapable de trouver ce fameux brevet dans les archives récentes de l’US Patent and Trademark Office. Comment c’est curieux … Pourtant, de nombreux articles font le lien vers un document officiel. Je suppose que peu de journalistes ont...

Lire la suite
Immobilier : Realo vous révèle qui sont vos voisins. Où est le problème ?
Juin17

Immobilier : Realo vous révèle qui sont vos voisins. Où est le problème ?

La nouvelle a fait le buzz ce 17 Juin en Belgique. Un site web appelé Realo a déclenché la polémique soudainement après des mois d’existence (voir par exemple cet article). Leur cartographie du marché immobilier belge affichait non seulement des propriétés à vendre et les prix estimés, mais aussi des indicateurs sociaux tels que les niveaux de revenus, d’éducation, de chômage et d’étrangers par quartier. Voilà qui confirme ce que nous disions sur l’impact du Big...

Lire la suite
Big Data : TAM airlines crée une expérience client unique
Juin12

Big Data : TAM airlines crée une expérience client unique

Grâce à nos amis de Creapills, nous avons relevé lors de notre veille marketing cette initiative de TAM Airlines qui mise sur le Big Data et les Data Analytics pour accroître la satisfaction de ses passagers. Enfin une utilisation intelligente du Big Data et du Data Mining. TAM Airlines a utilisé un Facebook Connect pour obtenir des renseignements personnels sur ses passagers. Pour ceux d’entre vous qui ne savent pas ce qu’est un Facebook Connect, il...

Lire la suite
Big Data : aura-t-on encore besoin des instituts d’étude de marché dans 10 ans ?
Mai04

Big Data : aura-t-on encore besoin des instituts d’étude de marché dans 10 ans ?

Les mastodontes de l’étude de marché et du sondage pourraient bien entrer dans une zone de turbulences très intenses. Leur business model risque en effet d’être chamboulé par le Big Data. Lisez la suite de cet article pour découvrir deux exemples étonnants qui illustrent la révolution induite par le Big Data et le data mining dans les secteurs de l’immobilier et des médias. L’analyse des parts de marché : un business qui pèse des milliards De...

Lire la suite
Data Mining : votre assureur vous espionne-t-il sur Facebook ?
Avr29

Data Mining : votre assureur vous espionne-t-il sur Facebook ?

Avez-vous jamais pensé que ce que vous postez sur Facebook peut avoir un impact direct sur le prix que vous payez pour certains produits et services ? Si vous voulez tomber de votre chaise, prenez le temps de lire cet article jusqu’au bout. Vous ne verrez plus jamais Facebook de la même manière après cela. Nous avons juste commencé une mission passionnante dans le domaine du CRM, Big Data et du data mining. Dans ce cadre...

Lire la suite
Data mining : visualisez vos données pour de meilleurs résultats
Mar30

Data mining : visualisez vos données pour de meilleurs résultats

Faire du data mining peut devenir un exercice rapidement épuisant  si vous ne savez pas où vous allez. On peut facilement se perdre et tirer des conclusions erronées. Voici un moyen pour éviter de vous fourvoyer. L’analyse factorielle exploratoire L’analyse factorielle exploratoire et l’analyse factorielle de confirmation (EFA et CFA en anglais) fournissent des moyens numériques pour explorer les données et de construire des modèles provisoires. Au final le data mining reste un exercice de recherche où vous essayez de...

Lire la suite
Data Mining: un exemple concret pour les PME
Jan21

Data Mining: un exemple concret pour les PME

L’un des sujets que nous aimerions traiter plus souvent en 2015 sur ce blog est le data mining (en français dans le texte « l’exploration des données »). Vous avez tous entendu parler de Big Data, de data mining, de business intelligence ; mais ce que ces termes recouvrent vraiment reste mystérieux pour la plupart d’entre nous. Je crois qu’il y a aussi un désir de garder ces termes opaque et flous de sorte qu’ils semblent effectivement...

Lire la suite