8 juin 2016 703 mots, 3 min. de lecture

Les data scientists ne sont PAS la solution

Par Pierre-Nicolas Schwab Docteur en marketing, directeur de IntoTheMinds
Dans le secteur des medias une complainte se fait entendre de plus en plus souvent à propos des data scientists. Ils n’auraient aucune affinité pour les aspects métier. Le manque d’empathie des spécialistes business pour le monde de la data […]

Dans le secteur des medias une complainte se fait entendre de plus en plus souvent à propos des data scientists. Ils n’auraient aucune affinité pour les aspects métier. Le manque d’empathie des spécialistes business pour le monde de la data science ne fait que creuser le fossé que beaucoup d’entreprises déplorent entre ces deux catégories de personnel.

Corrélation ne signifie pas causalité

Le manque de compréhension « métier » devient particulièrement visible lors de la réalisation de modèles prédictifs. Trop souvent les data scientists recherchent des corrélations sans vérifier que ces dernières fassent sens (à ce stade, vous jugerez peut-être intéressant de jeter un œil à ce site qui répertorie les corrélations vides de sens).

Mais au fond, pourquoi les data scientists devraient-ils perdre du temps à vérifier que les modèles tiennent la route d’un point de vue métier ? Un collègue suggérait que justement le propre des data scientists est précisément de rechercher des corrélations auxquelles l’entreprise n’aurait jamais pu penser sans l’aide du Big Data. D’un point de vue purement technique, cette thèse est défendable. Si les corrélations n’ont pas de sens « métier », la réutilisation du modèle sur des données récentes invalidera le modèle.

Le Big Data n’explique pas le lien de causalité

Il y a 20 ans, en l’absence de puissance de calcul suivante, les économètres échafaudaient des hypothèses qu’ils tentaient de vérifier grâce aux données. Ces hypothèses étaient basées sur une compréhension a priori du comportement de l’Humain.

Aujourd’hui, la puissance de calcul étant disponible pour un coût dérisoire, les data scientists ne s’embarrassent plus de modèles préalables. Ils calculent toutes les corrélations possibles, quitte à produire un modèle unique pour chaque individu.

L’approche grégaire a laissé la place à une approche individualiste.

Le Big Data produit des modèles purement mathématiques desquels les aspects sociologiques ont été éliminés. Dns l’entreprise cette connaissance sociologique du comportement des clients était l’apanage des spécialistes métier, qui perdent du terrain. Si cela peut ressembler à un progrès pour certains (on passe d’une connaissance métier perçue comme subjective à une objectivation rassurante des connaissances) les conséquences me semblent importantes.

Que se passe-t-il quand la sociologie est abandonnée au profit du Big Data ?

Mettre toutes ses billes dans le quantitatif (le Big Data en l’occurrence) est un signe annonciateur de problèmes stratégiques à moyen-terme. C’est le débat éternel en marketing qualitatif et marketing quantitatif qui recommence.

En poussant les data scientists à produire des modèles par dizaines, en multipliant les segments pour lancer des campagnes toujours plus précises, nous perdons lentement mais sûrement la connaissance essentielle du « pourquoi ». Pourquoi un individu fait-il ce que nous observons ? Or cette connaissance est essentielle pour se projeter dans le futur, anticiper les tendances, pour innover et répondre aux demandes émergentes (et non encore documentées dans les données) des clients.

Conclusion

Comme je le dit souvent le Big Data n’est qu’un outil parmi d’autres. Il a toutefois été présenté comme une panacée, un moyen de rationaliser et d’être plus efficace. Si cela est sans doute vrai dans la gestion quotidienne de l’entreprise, le Big Data ne peut en aucun cas remplacer la formulation d’une stratégie d’entreprise. Le Big Data ne vous dira pas non plus quels produits vos clients voudront acheter dans 2 ans. Tout simplement par que ces produits n’existant pas, ils ne génèrent aucune donnée. N’oubliez pas que le Big Data se base sur le passé. Or la formulation de l’avenir, la capacité à innover est et doit rester une compétence entre les mains des humains.

Photo : shutterstock


Publié dans Data et IT, Marketing.

2 commentaires

  1. Le constat et la conclusion sont intéressants. Cependant, le chemin entre les deux est très biaisé. Penser qu’un data-scientist honnête et compétent produise un modèle par individu est proche de la caricature. Il est désagréable de penser que des méthodes sont meilleures que le cerveau humain pour explorer des espaces de dimensions supérieures à 3. Plus simplement : les maths aident à se représenter un grand nombre de variables.
    Cependant, mon expérience des projets « data » dans les entreprises montre au contraire que ce sont les statisticiens qui recadrent les managers sur la nécessité de poser une vraie question métier avant d’utiliser des outils. J’ai les larmes aux yeux quand j’entends des millions se décider sur des phrases du type « on va implémenter du machine learning dans une optique de big data », j’ai envie de me tirer une balle. Je lève la main et je demande : « mais pour répondre à quelle question » et on me dit : « mais c’est du big data de la silicon valley et cap gémini en a vendu au copain. C’est à pleurer. Je crois qu’opposer experts métiers et data scientists c’est comme opposer le bateau à moteur et le navigateur. Les deux écueils sont 1) penser que parce qu’on a un bon navigateur, on peut traverser l’atlantique à la rame 2) penser que parce qu’on a un bon moteur, il suffit de naviguer à fond pour arriver au bon endroit sans se soucier de la direction.
    Pardon pour le commentaire trop long, mais c’est tellement fatigant, cette fautive dichotomie.

  2. Bonjour,

    merci tout d’abord pour votre réaction.
    Je ne peux que vous rejoindre sur la « caricature » (assumée) d’un modèle par individu. Toutefois ne faut-il pas être conscient que c’est là une demande du marché qui sera rendue possible par les évolutions technologiques à l’avenir ? Dominique Cardon lui-même n’a-t-il pas écrit que l’output des algorithmes est désormais le « modèle » alors que ce dernier était un input il y a 20 ans ?
    Je n’ai pas eu la chance de rencontrer des data scientists qui recadrent les managers pour l’instant. Sans doute que la maturité de l’entreprise et le caractère du data scientist en question sont déterminant.
    Mais je vous rejoins complètement sur la métaphore du bateau à moteur. L’intégration des compétences métier et technique est indispensable.

Donnez votre avis

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *