25 mai 2021 809 mots, 4 min. de lecture

Linkedin : l’étonnant effet des émojis sur la viralité des posts

Par Pierre-Nicolas Schwab Docteur en marketing, directeur de IntoTheMinds
Faut-il mettre des émojis dans vos posts Linkedin et si oui combien ? Dans l’article d’aujourd’hui je vous révèle les résultats d’une étude que j’ai menée sur 4,599 millions de posts Linkedin. Cette étude suit celles que j’ai déjà publiées […]

Faut-il mettre des émojis dans vos posts Linkedin et si oui combien ? Dans l’article d’aujourd’hui je vous révèle les résultats d’une étude que j’ai menée sur 4,599 millions de posts Linkedin.
Cette étude suit celles que j’ai déjà publiées sur l’impact des hashtags et du nombre de mots.

Si vous voulez être les premiers à recevoir mes résultats, abonnez-vous à ma newsletter (n’oubliez pas de cliquer sur le lien de validation qui vous sera envoyé par email).

Les résultats en bref

  • En utilisant 15 ou 16 émojis dans votre post Linkedin, vous multipliez par 2,5 la probabilité d’obtenir 100 réactions. Pour faire simple, plus vous mettez d’émojis dans vos posts Linkedin, plus la visibilité de votre post augmente.
  • Sur la base de 4,599m de posts Linkedin analysés, on observe en outre que 80% des posts ne contiennent pas d’émojis
  • 90,42% des posts Linkedin contiennent 0, 1 ou 2 émojis
  • 1,5% des posts Linkedin contiennent plus de 10 émojis.


banner emoticons emojis

Résultats détaillés

L’analyse descriptive du dataset montre tout d’abord que 80,12% des messages sur Linkedin ne contiennent pas d’émojis. C’est une bonne illustration de la loi de Pareto.

90,42% des posts Linkedin contiennent 0, 1 ou 2 émojis et seulement 1,5% en contiennent plus de 10. Le maximum observé est un post contenant 1190 émojis !

Le modèle de prédiction réalisé avec Timi Modeler montre que la probabilité moyenne d’obtenir 100 likes sur un post Linkedin est de 3,5987%. Cette probabilité a été calculée en limitant les observations aux auteurs disposant d’un maximum de 25000 maximum (soit 99% du dataset). J’ai ainsi voulu éliminer les valeurs aberrantes (trop de réactions) dues à des réseaux de grande taille caractéristiques des personnalités connues (Barack Obama, Bill Gates, …). Vous trouverez dans le tableau en bas de cet article l’ensemble des résultats.

J’ai repris les résultats sous Tableau et ai éliminé la valeur aberrante lié au post contenant 1190 émojis.
J’ai également inclus (en orange ci-dessous) le pourcentage de posts en fonction du nombre d’émojis contenus.

corrélation entre le nombre d'émoticones et la visibilité d'un post linkedinUne fonction polynomiale donne un très bon « fit » (R²=0,96, voir ligne bleue en pointillés) et on constate qu’une asymptote est atteinte vers 18 émojis. Pas besoin d’en inclure beaucoup plus donc.

Voici les enseignements importants que je tire de cette analyse :

  • ne pas inclure d’émojis fait diminuer statistiquement vos chances d’obtenir 100 likes.
  • 15 ou 16 émojis semblent être l’optimum pour augmenter vos chances d’obtenir 100 likes d’après le modèle de prédiction, et 18 si je suis la régression réalisée sous Tableau.
  • 80% des messages sur Linkedin ne contiennent pas d’émojis : en mettre permet donc de se différencier

Comme pour les autres analyses que j’ai publiées, la question de la causalité reste essentielle. A ce stade il est impossible de dire ce qui provoque les réactions. L’algorithme de Linkedin « pousse »t-il plus les publications qui contiennent des émojis, ou bien l’œil humain est-il plus attiré par les publication qui les contiennent ? Pour percer ce mystère il faudra encore beaucoup de travail et peut-être une étude d’eye tracking.


Méthodologie

Pour réaliser cette étude nous je me suis basé sur un dataset de 4,599 millions de posts Linkedin fournis par Linkalyze. Les données ont été préparées avec Anatella et la modélisation réalisée avec Modeller (ces 2 solutions étant fournies par la société Timi).

data preparation Linkedin dataset Anatella

La partie data preparation a principalement consisté en la réconciliation de 2 bases de données au format json (voir schéma ci-dessous) :

  • base de données des posts Linkedin
  • base de données des auteurs

Les émojis n’étant pas lisible directement, une expression régulière a été utilisée pour les extraire et les compter. Pour ceux qui veulent la réutiliser, la voici :

/(?:[\u2000-\u32FF]|[\ud83c-\ud83e][\udc00-\udfff])(?:\u200d(?:[\u2000-\u32FF]|[\ud83c-\ud83e][\udc00-\udfff]))*/g

Il a fallu ensuite éliminer manuellement d’autres signes qui étaient extraits également mais n’étaient pas des émojis.

La modélisation a consisté à prédire la probabilité d’atteindre 100 réactions avec un post Linkedin (Likes + commentaires). J’ai pour ce faire créé une variable « ManyReactions » qui identifie les posts ayant atteint la barre symbolique des 100 réactions.

Dans la modélisation « ManyReactions » devient la variable dépendante. Toutes les autres variables du dataset deviennent des variables indépendantes.

variable many reactions dans timi modeler


Corrélation entre le nombre d’émojis sur un post Linkedin et la probabilité de viralité

Nombre d’émojis Probabilité d’obtenir 100 likes sur le post Linkedin
0 3,09%
1 4,24%
2 4,85%
3 5,46%
4 5,93%
5 6,77%
6 6,98%
7 7,58%
8 8,12%
9 8,82%
10 8,69%
11 8,80%
12 8,81%
13 8,86%
14 9,55%
15-16 10,38%
17-18 9,96%
19-21 9,99%
22-28 9,88%
29-1190 7,13%

 


Remerciements

Merci à Frank Vanden Berghen pour son aide dans la programmation de la fonctionnalité d’extraction des émojis.



Publié dans Data et IT.

1 commentaire

  1. Merci pour ce post interessant. Question: le nombre de followers semble être (de loin) la variable qui impacte le plus le passage du seuil des 100 likes. Serait il possible de scinder les résultats par nombre de followers VS emojis? Car si tous ceux qui ont un nombre de followers >10k mettent 18+ emojis alors il est « normal » que le taux augmente, ce n’est pas lié aux emojis mais aux followers. Savoir la probabilité d’atteindre 100 likes avec 18 emojis et <1k followers et comparer avec ceux qui en ont plus permettrait de savoir si les emojis ont un réel impact (en neuropsychologie c'est démontré mais le taux me parait trop fort) ou si c'est seulement une pratique admise parmi ceux qui ont beaucoup de followers.
    Merci pour ces recherches passionnantes.
    Guillaume

Donnez votre avis

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *