31 oktober 2018 700 woorden, 3 min. gelezen

Aanbevelingssystemen: houd rekening met inactieve gebruikers

Door Pierre-Nicolas Schwab Gepromoveerd in marketing, directeur van IntoTheMinds
Een van de meest interessante presentaties op de RecSys 2018-conferentie was voor mij ongetwijfeld die over het werk van Qian Zhao, Martijn Willemsen, Gediminas Adomavicius, F. Maxwell Harper en Joe Konstan (de volledige titel is: “Interpreting User Inaction in Recommender […]

Een van de meest interessante presentaties op de RecSys 2018-conferentie was voor mij ongetwijfeld die over het werk van Qian Zhao, Martijn Willemsen, Gediminas Adomavicius, F. Maxwell Harper en Joe Konstan (de volledige titel is: “Interpreting User Inaction in Recommender Systems“, Engelse site).

Op het gebied van datawetenschap en in het bijzonder van aanbevelingssystemen zijn we zo gefocust op de interpretatie van impliciete of expliciete signalen dat we vergeten rekening te houden met de afwezigheid van een signaal. Maar zoals uit dit onderzoek blijkt, is de afwezigheid van een signaal al een stuk informatie op zich dat soms het verschil kan maken. Zoals de auteurs terecht stellen: “Voor de meeste systemen lokt het merendeel van de weergegeven elementen geen actie uit van de gebruikers” (wat de makers ervan aan het denken zou moeten zetten).
Het geven van meer aandacht aan de interpretatie van inactiviteit kan dus een winnende strategie blijken te zijn bij het ontwerpen van aanbevelingssystemen.

Segmentatie van gebruikers van Discover Weekly op Spotify

De presentatie van Zhao en collega’s maakte een interessante link met de presentatie van Spotify op de eerste dag van RecSys, waar de segmentatie van Spotify-gebruikers via “Discover Weekly” werd onthuld. Op basis van hun acties heeft Jean Garcia-Gathright aangetoond dat de belangrijkste gebruikersgroep de groep was die NIET met de aanbevelingen interageerde. Dit zal niemand a posteriori verbazen, maar het is nuttig om het in herinnering te brengen om dit belangrijke bewijs niet uit het oog te verliezen.

“bij de meeste systemen leidt het merendeel van de getoonde elementen niet tot actie van de gebruikers”

7 categorieën van inactiviteit

De belangrijkste bijdrage van het werk van Zhao en zijn collega’s is het voorstel van een categorisering van inactiviteit en het testen van correlaties van de geschiedenis van inactiviteit op toekomstige aanbevelingen.

De auteurs gebruikten concepten uit de psychologie om een lijst van inactiviteitscategorieën te definiëren en te valideren die de redenen voor het niet consumeren van de aanbevelingen omvatten. Deze categorieën zijn (in afnemende volgorde van belangrijkheid):

  • “Niet gezien”: de gebruiker heeft de aanbeveling niet opgemerkt (38,6%)
  • “Niet nu”: het ontbreken van een passende context voor het volgen van de aanbeveling (18,2%)
  • “Al gezien”: aanbevolen titel die al door de gebruiker is bekeken (14,6%)
  • “De andere is beter”: effecten van concurrentie van andere aanbevolen titels (9,5%)
  • “Op een later tijdstip bekijken”: later bekijken om meer informatie te krijgen om een beslissing te kunnen nemen (6,9%)
  • “Niet mijn smaak”: niet naar wens van de gebruiker (5,8%)
  • “Vastbesloten om te kijken”: de beslissing van de gebruiker is al genomen (5,8%)

Rekening houdend met het gecombineerde gewicht (meer dan 50% van de gevallen), moet bijzondere aandacht worden besteed aan aandacht (“Niet gezien”) en context (“Niet nu”) en moet daarmee rekening mee worden gehouden bij het ontwerpen van aanbevelingssystemen.

Categorieën van inactiviteit en de respectieve correlaties ervan met aanbevelingen

Expliciete acties kunnen helpen bij het voorspellen van inactiviteit

De studie richtte zich vervolgens op het onderzoeken van de correlaties tussen een reeks expliciete acties (evaluatie van een film, klikken op een aanbeveling, toevoegen aan favorieten of afspeellijsten, enz.) en de verschillende categorieën van inactiviteit. Het doel is om aan de hand van een expliciete actie te voorspellen waarom een gebruiker inactief is gebleven.
De volledige correlatietabel is beschikbaar in het artikel (tabel 2). Ik beperken mij daarom tot het geven van enkele concrete voorbeelden:

  • Wanneer de kans hoog is dat de gebruiker een film een hoge waardering geeft, neemt de kans toe dat hij of zij de film al eerder heeft bekeken.
  • Wanneer de kans hoog is dat de gebruiker een film een hoge waardering geeft, is de kans laag dat hij of zij de film later zal bekijken.

De twee bovenstaande voorbeelden zijn zinvol, maar lijken ook een beetje “voor de hand liggend”. Andere resultaten zijn veel moeilijker te interpreteren en zelfs tegenstrijdig.

Belangrijkste conclusies

De belangrijkste conclusies die uit deze studie kunnen worden getrokken zijn de volgende:

  • Inactiviteit is een signaal, zoals elk ander signaal, dat nuttig kan zijn om rekening mee te houden bij het ontwerpen van aanbevelingssystemen
  • Er werden 7 categorieën van inactiviteit geïdentificeerd
  • Een reden voor de inactiviteit van de gebruiker kan worden afgeleid uit zijn acties

Image : shutterstock



Posted in big data, Onderzoek.

Plaats uw mening

Je e-mailadres zal niet getoond worden. Vereiste velden zijn gemarkeerd met *