12 februari 2020 1477 woorden, 6 min. gelezen Laatste update : 23 februari 2020

Hoe aanbevelingsalgoritmen hacken?

Door Pierre-Nicolas Schwab Gepromoveerd in marketing, directeur van IntoTheMinds
Een aanbevelingsalgoritme hacken kan een zeer lucratieve bezigheid zijn. Sommige aanbevelingsalgoritmen zijn immers alomtegenwoordig in ons digitale leven en beïnvloeden sterk ons gedrag. Eigenlijk zijn we zonder het goed te beseffen afhankelijk geworden van algoritmen. Zo is 35% van de […]

Een aanbevelingsalgoritme hacken kan een zeer lucratieve bezigheid zijn. Sommige aanbevelingsalgoritmen zijn immers alomtegenwoordig in ons digitale leven en beïnvloeden sterk ons gedrag. Eigenlijk zijn we zonder het goed te beseffen afhankelijk geworden van algoritmen. Zo is 35% van de aankopen op Amazon het directe gevolg van een algoritmische aanbeveling. 80% van de films die op Netflix worden bekeken en 75% van de video’s op YouTube worden via algoritmen aanbevolen. Pagerank, het algoritme van Google, is wellicht het meest bestudeerde aanbevelingsalgoritme, het algoritme dat het onderwerp is van de meeste hackpogingen omdat het een grote economische impact heeft. Meer dan 70% van de kliks op Google gaan immers naar de eerste 3 posities. Maar los van Google merken we dat het hacken van algoritmen nog niet zo vaak werd onderzocht. Dit merkten we ook tijdens de laatste RecSys-conferentie (Engelse site). Zoals het project van Simon Weckert echter aantoont, is het hacken van een algoritme doenbaar (zie onderstaande video). En verrassend genoeg is het zelfs relatief “gemakkelijk” is als men het vroeg genoeg doet. Het geheim van het manipuleren van algoritmen ligt in het sturen van foutieve informatie naar het algoritme en deze techniek is echt heel moeilijk tegen te gaan.

Samenvatting

Wat moet je doen om een aanbevelingsalgoritme voor de gek te houden?

De meeste algoritmen die content aanbevelen, functioneren op basis van dezelfde regels en gegevens om te “voeden”:

  • een of meer engagementgegevens (de “likes”, commentaren, aantal delingen)
  • snelheid (d.w.z. de snelheid waarmee iemand zich engageert na het bekijken van inhoud inhoud)
  • website-specifieke gegevens (kijken in het geval van een videosite als YouTube, betalen van een geldbedrag om een project te ondersteunen in het geval van Kickstarter)

Als u dit eenmaal begrijpt, kunt u zich organiseren om het algoritme te gaan manipuleren. Het enige wat u hoeft te doen is informatie naar het algoritme te sturen die de werking ervan verstoort tot het leidt tot een reactie in de gewenste richting. Effect is gegarandeerd … alleszins op korte termijn.

Hacken van aanbevelingsalgoritmen: wat zijn de gevolgen?

De gevolgen kunnen aanzienlijk zijn, en niet alleen financieel.

Google

We gaan niet dieper in op het algoritme van Google. De inleiding in dit artikel geeft u een goed overzicht van de gevolgen. Ik geef u deze alleen in de vorm van onderstaande grafiek.

TripAdvisor

Het algoritme van Tripadvisor werkt op basis van klantenbeoordelingen. Het hacken van het algoritme komt dus neer op het vermenigvuldigen van lovende commentaren, zelfs als dat betekent dat je ze zelf moet maken. Dit is wat TripAdvisor ertoe bracht om La Mère Poulard te straffen (Franse site) een schijnbaar banaal restaurant gelegen in een zeer toeristische plaats: Mont-Saint-Michel. Het fenomeen van valse berichten is zodanig dat TripAdvisor een “rode badge” heeft geïntroduceerd die bezoekers waarschuwt voor het waarschijnlijke bestaan van valse opmerkingen over een bepaald profiel. Het DGCCRF (het Franse directoraat voor fraudebestrijding) schat dat 45% van de online opgestelde adviezen vals is (Franse site).

 Kickstarter

Een eigen crowdfunding-campagne in de top 10 van meest populaire zien staan op de homepage van Kickstarter homepage zal onvermijdelijk bezoekers aantrekken … en de kans verhogen op financiering van het project. Hackers hebben zich daarom gespecialiseerd in het manipuleren van het Kickstarter-algoritme. Ze gebruiken privégroepen om in korte tijd een hoge mate van betrokkenheid te genereren, waardoor ze een hoge snelheid en een hoge mate van betrokkenheid kunnen hebben en snel de top van de gemarkeerde campagnes kunnen bereiken. Het enige probleem is om deze positie te behouden. Dit “massa-effect” heeft immers slechts een beperkte impact in tijd en daarom is het noodzakelijk om een steeds groter publiek te kunnen mobiliseren (met name door hoge reclamebudgetten uit te geven) om zijn positie aan de top van de ranglijst te garanderen.

Linkedin

De werking van het Linkedin-algoritme is vrij goed bekend. De algemene werking van het algoritme wordt hier (Engelse site) door Pete Davis uitgelegd, maar hij heeft natuurlijk niet onthuld hoe het algoritme “gemanipuleerd” moet worden. Het blijkt dat een bepalend criterium voor het vermogen van een post om een groot publiek te bereiken de snelheid ervan is. Dat wil zeggen dat de post in kwestie snel commitment moet genereren (likes, comments, sharing). Ter indicatie: binnen het eerste uur na publicatie dient een maximum aan reacties te worden gewaarborgd. Ik interviewde een Linkedin-expert, Bruno Fridlansky, om ons zijn tips en trucs te geven over hoe je je Linkedin-posten viraal kunt maken.

De 3 gouden regels voor een populaire post op Linkedin

Om uw Linkedin-post een groot publiek (buiten uw 2de cirkel) te kunnen bereiken, moet het Linkedin-algoritme de volgende signalen ontvangen:

  • een maximum aan opmerkingen binnen het eerste uur van de publicatie
  • reageer op elke opmerking binnen de 2 uur
  • geen hyperlink in de post

Interview: de tips van Bruno Fridlansky om het viraal gaan van uw Linkedin-berichten te verhogen.

Wat zijn de hefbomen om te profiteren van het algoritme van Linkedin?

“Wat vandaag de dag de betrokkenheid meet… is de feedback die we krijgen op onze publicaties en de reactie van de auteur op de feedback. Bestaat er dan een goed moment om te publiceren? Nee, niets is onzinniger dan de infografieken met uurgemiddelden. Om deze te volgen, zou er op dinsdag, donderdag, tussen 10 en 11 uur ’s ochtends moeten worden gepubliceerd. Het zijn niet meer dan gemiddelden en gemiddelden betekenen niets. Het juiste moment om te publiceren is voor mij als je weet dat je binnen twee uur beschikbaar kunt zijn om te reageren op opmerkingen, omdat het een hulpmiddel is om gesprekken te voeren. Als je wilt communiceren, heeft het geen zin. Je gaat geen connecties maken. Het doel van dit hulpmiddel is om een verbinding te maken met mensen en professionele relaties aan te gaan. Dus je gaat publiceren op het moment dat je weet dat je beschikbaar bent om te reageren op de mensen die commentaar geven. En wat is een goede publicatie? Daarin kan de vorm inderdaad wel een rol spelen. Wat betekent dat dan? Linkedin zal publicaties met tekst promoten, met een PDF-document of een native video, d.w.z. een video die we rechtstreeks naar Linkedin uploaden. Aan de andere kant zal het publicaties met externe links eerder bestraffen. Want dat doet Linkedin-leden weggaan en dat is uit den boze voor het netwerk. Ze willen dat de leden binnen Linkedin blijven. Tot zover de vorm. Vervolgens, wat ga je zeggen als je het over jezelf hebt? Dat ik me heel volks Professionnal Branling noem, daarin is niemand geïnteresseerd, behalve jullie kleine ecosystemen. Maar op dat moment zijn we onder ons. Nee, wat je nodig hebt, is het toevoegen van waarde. Wat ga je publiceren dat waarde toevoegt aan je gesprekspartners? Hoe ga je hen iets aanleren? Hen laten evolueren? Hen aan het denken zetten en samen nadenken over de opmerkingen die op elkaar inwerken. Vertel me niet over jou, vertel me over mij. Dat is alles waar ik in geïnteresseerd ben. Zo reageert iedereen.”

Het juiste moment om te publiceren is wanneer je weet dat je binnen twee uur beschikbaar kunt zijn.

Googlemaps

In een eerder artikel hadden we het al over het experiment van Simon Weckert, een Duitse kunstenaar die Google Maps “hackte” om het te laten lijken op een file in een Berlijnse straat. De gevolgen kunnen belangrijk zijn omdat door het kunstmatig creëren van een file het mogelijk wordt om het autoverkeer om te leiden en bepaalde bedrijven te bevoordelen/te benadelen. McDonalds voerde ook een grootschalig experiment uit in Californië dat Waze-reclame combineerde met traditionele billboards om klanten naar zijn verkooppunten te brengen.

Conclusie

Algoritmen beheersen ons leven. Onmogelijk om in de digitale wereld te bewegen zonder in contact te komen met een algoritme, vooral een aanbevelingsalgoritme. Of het nu gaat om een aankoop op Amazon (35% van de verkoop) of het bekijken van een video op Netflix (80% van de bekeken video’s), de algoritmes adviseren ons en we volgen (vaak blindelings) hun voorschriften. Dus algoritmen kunnen ons manipuleren.

De ontwerpers van deze computerprogramma’s zweren bij hoog en laag dat de algoritmen objectief zijn. Dat zijn ze waarschijnlijk ook tot op zekere hoogte. Maar de technieken die we in dit artikel hebben gezien zijn een heel andere vorm van hacken, omdat het hier om valse signalen gaat die naar het algoritme worden gestuurd met de bedoeling het te misleiden. Het algoritme vertoont dus geen tekenen van slechte werking, maar reageert zoals verwacht op de prikkels die naar het algoritme worden gestuurd. Men zal zich herinneren dat het algoritme van Google op dezelfde manier is “gehackt” door degenen die “link farms” hebben gecreëerd. Deze “hyperlink-fraude” werd ontdekt en het algoritme werd verbeterd, maar fraudeurs zijn altijd een stap voor en het zal nooit mogelijk zijn om alle mogelijke kapingen van een algoritme op voorhand te voorspellen.



Posted in big data.

Plaats uw mening

Je e-mailadres zal niet getoond worden. Vereiste velden zijn gemarkeerd met *