L’hacking di un algoritmo di raccomandazione è un’operazione che può essere molto redditizia. In effetti, alcuni algoritmi di raccomandazione sono onnipresenti nella nostra vita digitale e influenzano fortemente il nostro comportamento. Siamo diventati dipendenti dagli algoritmi senza rendercene conto. Ad esempio, il 35% degli acquisti su Amazon sono la diretta conseguenza di una raccomandazione algoritmica. Un algoritmo suggerisce l’80% dei film guardati su Netflix e il 75% dei video su YouTube. Pagerank, l’algoritmo di Google, è probabilmente l’algoritmo di raccomandazione più studiato, quello che è oggetto dei più tentativi di “hacking” perché ha un notevole impatto economico. Più del 70% dei clic va alle prime tre posizioni in Google. Ma a parte Google, bisogna ammettere che l’hacking di algoritmi è un argomento che è stato ampiamente trascurato. Lo abbiamo notato durante l’ultima conferenza RecSys. Tuttavia, come mostra il progetto di Simon Weckert, è possibile hackerare un algoritmo (guardate il video qui sotto). E ciò che stupisce è che è anche relativamente “facile” quando si interviene in una fase iniziale. Il segreto della manipolazione dell’algoritmo risiede nell’invio di informazioni false all’algoritmo e questa tecnica è molto complicata da prevenire.
Sommario
Cosa si deve fare per ingannare un algoritmo di raccomandazione?
La maggior parte degli algoritmi che consigliano i contenuti, utilizzano le stesse regole per funzionare, i dati corrispondenti per “alimentare”:
- una o più metriche di coinvolgimento (mi piace, commenti, numero di condivisioni)
- la velocità (cioè la velocità con cui il contenuto coinvolge chi lo ha visto)
- metriche site specific (visualizzazione nel caso di un sito web di video come YouTube, pagamento di una somma di denaro per sostenere un progetto nel caso di Kickstarter)
Una volta capito questo, si può manipolare l’algoritmo. Basta inviare informazioni all’algoritmo che interromperanno le prestazioni e porteranno a un risultato positivo nella direzione desiderata. Gli effetti sono garantiti, comunque a breve termine.
Algoritmi di raccomandazione dell’hacking: quali sono le conseguenze?
Le conseguenze possono essere significative, e non solo finanziarie.
Non torneremo all’algoritmo di Google. L’introduzione di questo articolo fornirà una buona panoramica delle conseguenze. Li spiegherò solo sotto forma di grafico qui sotto.
Tripadvisor
L’algoritmo di TripAdvisor funziona in base alle valutazioni dei passeggeri. Hackerare l’algoritmo equivale quindi a moltiplicare il numero di commenti complementari, anche a costo di inventarli. È questo che ha portato TripAdvisor a punire La Mère Poulard, un ristorante apparentemente banale situato in un luogo molto turistico: Mont-Saint-Michel. Il fenomeno delle recensioni false è tale che TripAdvisor ha messo in atto un “bollino rosso” che avverte i visitatori della probabile esistenza di commenti falsi su un determinato profilo. La DGCCRF (il dipartimento per la repressione delle frodi in Francia) stima che il 45% delle recensioni online siano false.
Kickstarter
Vedere la sua campagna di crowdfunding inserita tra le prime 10 più popolari sulla homepage di Kickstarter attira inevitabilmente visitatori e aumenta le possibilità che il suo progetto venga finanziato. Gli hacker si sono quindi specializzati nella manipolazione dell’algoritmo di Kickstarter. Usano gruppi privati per generare un impegno sostanziale in un breve periodo, che consente di avere un’alta velocità, un alto coinvolgimento e di essere rapidamente in cima alle campagne evidenziate. L’unico problema è mantenere quella posizione. Infatti, questo “effetto massa” ha solo un impatto limitato nel tempo, ed è quindi necessario riuscire a mobilitare audience sempre più alte (in particolare spendendo alti budget pubblicitari) per garantire la propria posizione ai vertici della classifica.
Il funzionamento dell’algoritmo di LinkedIn è abbastanza noto. Il funzionamento generale dell’algoritmo è stato spiegato qui da Pete Davis, ma non ha rivelato come “manipolare” l’algoritmo, ovviamente. Sembra che un criterio determinante nella capacità di un post di raggiungere un vasto pubblico sia la sua velocità. Vale a dire che il post in questione deve generare engagement (mi piace, commenti, condivisioni) velocemente. A titolo indicativo, deve essere garantito un massimo di reazioni entro la prima ora successiva alla pubblicazione. Ho intervistato un esperto di LinkedIn, Bruno Fridlansky, per darci i suoi suggerimenti e trucchi per rendere virali i post su LinkedIn.
Le tre regole d’oro per un post popolare su LinkedIn
Affinché un post su LinkedIn raggiunga un pubblico significativo (oltre la tua seconda cerchia), l’algoritmo di LinkedIn deve ricevere i seguenti segnali:
- un massimo di commenti entro la prima ora dalla pubblicazione
- rispondere a ogni commento entro 2 ore
- nessun collegamento ipertestuale nel post
Intervista: i consigli di Bruno Fridlansky per aumentare la viralità dei tuoi post su LinkedIn.
Quali sono le leve con cui devi giocare per sfruttare l’algoritmo di LinkedIn?
“Ciò che misura il coinvolgimento oggi… è il feedback che riceviamo sui nostri post e la risposta dell’autore ai commenti. Quindi, è un’ora buona per pubblicare? No, non ci sono più cazzate di queste infografiche che escono con le medie orarie. Se dobbiamo rispettarli, vale a dire, dobbiamo pubblicare martedì, giovedì, tra le 10.00 e le 11.00. Sono solo medie e le medie non significano nulla. Dico che il momento migliore per postare è quando sai che puoi essere disponibile entro due ore a rispondere ai commenti, perché è uno strumento per fare conversazioni. Se vuoi comunicare, non serve. Non avrai nessuna relazione. Lo scopo di questo strumento è quello di connettersi con gli umani e stabilire relazioni professionali. Quindi, pubblicherai quando sai che sarai in grado di rispondere alle persone che ti commenteranno. Che cos’è un buon post? Lì, infatti, il formato può giocare. Cioè? Linkedin promuoverà pubblicazioni con testo o testo, con un documento PDF o un video nativo, ovvero un video che verrà caricato direttamente su Linkedin. Al contrario, penalizzerà piuttosto le pubblicazioni con link verso l’esterno. In effetti, caccia le persone da Linkedin e questo è fuori discussione per la rete. Vogliono che i membri rimangano su Linkedin. Si tratta del formato. Dopodiché, cosa dici se parli di te stesso? Quello che io molto volgarmente chiamo Professional Branling non interessa a nessuno se non ai tuoi piccoli ecosistemi. Ma in quel momento siamo tra di noi. No, quello che serve è aggiungere valore. Cosa pubblicherai che porterà valore al tuo intervistatore? Come farai a fargli imparare qualcosa? Fare progressi? Fallo pensare e poi ragionare insieme attraverso i commenti che interagiranno. Non parlarmi di te, parlami di me. Questo è solo ciò che mi interessa. Ecco come reagiscono tutti. ”
Il momento giusto per pubblicare è quando sai di poter essere disponibile nelle prossime due ore.
Googlemaps
In un precedente articolo abbiamo già parlato dell’esperimento condotto da Simon Weckert, artista tedesco che ha “hackerato” Google Maps per far sembrare che ci fosse un ingorgo in una strada di Berlino. Le conseguenze possono essere significative perché creando artificialmente un ingorgo diventa possibile deviare il traffico automobilistico e favorire/svantaggiare determinate attività commerciali. McDonald’s ha condotto un esperimento su larga scala in California, che ha mescolato la pubblicità su Waze con i cartelloni pubblicitari tradizionali per portare i clienti nei suoi punti vendita.
In conclusione
Gli algoritmi governano le nostre vite. È impossibile muoversi nel mondo digitale senza essere in contatto con un algoritmo, in particolare un algoritmo di raccomandazione. Che si tratti di un acquisto su Amazon (35% delle vendite) o di guardare un video su Netflix (80% dei video visti), gli algoritmi ci consigliano e seguiamo (spesso ciecamente) le loro prescrizioni. Gli algoritmi possono, quindi, manipolarci.
I progettisti di questi programmi per computer giurano sui loro grandi Dei che gli algoritmi sono obiettivi. Probabilmente lo sono in una certa misura. Ma le tecniche che abbiamo visto in questo articolo sono un modo completamente diverso di hackerare poiché sono falsi segnali che vengono inviati all’algoritmo per ingannarlo. L’algoritmo, quindi, non mostra alcun segno di malfunzionamento ma reagisce come previsto agli stimoli che gli vengono inviati. Si ricorderà che l’algoritmo di Google era stato “hackerato” allo stesso modo da chi aveva creato “link farm”. Questa “frode sui collegamenti ipertestuali” è stata rilevata e l’algoritmo è stato migliorato. Tuttavia, i truffatori sono sempre un passo avanti e non sarà mai possibile prevedere in anticipo tutti i possibili dirottamenti di un algoritmo.
Pubblicato in Data e IT.