LinkedIn: het verrassende effect van emoji’s op het viraal gaan van berichten
Door Pierre-Nicolas Schwab •
Is het nodig om emoji's in je LinkedIn-berichten te plaatsen en zo ja, hoeveel? In het artikel van vandaag geef ik u de resultaten van een onderzoek dat ik uitvoerde op 4,599 miljoen LinkedIn-berichten. Deze studie volgt op een eerdere…
224 woorden, het magische getal om de viraliteit van uw LinkedIn-berichten te stimuleren
Het aantal woorden is een van de factoren die bepalend zijn voor het succes van een post op LinkedIn, samen met hashtags. Ik heb een analyse gemaakt van bijna 5 miljoen berichten in 100 landen waaruit blijkt dat er een…
Datamining: definities, 5 gratis tools en technieken
Na het verzamelen en voorbereiden van de gegevens is het noodzakelijk de gegevens te analyseren om de gegevensverzameling zinvol te maken. Door lijsten met ruwe gegevens te bekijken, kunnen geen patronen in het gedrag van klanten worden opgebouwd, zodat een…
Dankzij AI een rijkere bezoekerservaring op de Alechinsky-tentoonstelling
Omdat de cultuur erg zwaar getroffen is door de Covid-crisis is het belangrijker dan ooit om bezoekers aan zich te binden. Ik stelde al verschillende manieren voor om na te denken over het verbeteren van de klantenervaring in musea. Vandaag…
Data wrangling: definitie, stappen, tools [gids 2021]
De technische term "Data wrangling", ook wel "Data munging" genoemd, lijkt op het eerste gezicht intimiderend. De bedoeling van dit artikel is om het woord te demystifiëren. Data wrangling wordt gedefinieerd als een belangrijk onderdeel van een groter proces dat…
ETL benchmark: hoe lang duurt het om 1 miljard rijen te verwerken?
Door Pierre-Nicolas Schwab •
In een vorig artikel wees ik al op het belang van de verwerkingssnelheid bij de keuze van een data preparation-software (ETL). Ik maakt een eerste benchmark tussen Alteryx, Tableau Prep en Anatella op een bestand van 108 miljoen rijen. Deze…
Benchmark: welke ETL kiezen om grote bestanden te verwerken
Als we het over data preparation hebben, zien we dat een groot deel van de processen nog altijd offline verloopt, met archieven die uit relationele gegevensbanken worden getrokken. En wat de data engineers betreft die deze archieven behandelen, is het…
SEO : 50.000 pagina’s geanalyseerd en 2m gemakkelijk toegankelijke zoekopdrachten
SEO -studie. We hebben in 16 landen een studie uitgevoerd naar 50.000 webpagina’s aan de hand van185 trefwoorden die verband houden met data science. De ruwe gegevens kwamen van Ahrefs. We maakten gebruik van Anatella om de gegevens voor te…
[Podcast] kinderen vertrouwd maken met digitale tools
Nathalie Kuborn (We Are Coders), Gaëlle Girardeau (Cood) en Christophe Coquis (Junior Geek) (Franse websites) vertellen over het kinderen vertrouwd maken met informatica, digitale tools en ze een introductie geven in de digitale cultuur: markt, leerpad en tips. Markt voor…
[Podcast] De essentie van datakunst en datavisualisatie
Nicholas Rougeux noemt zichzelf een "datakunstenaar" ("data artist" in het Engels) en het minste wat we kunnen zeggen is dat hij talent heeft voor het visualiseren van gegevens. In die mate zelfs dat hij zijn werk verkoopt in de vorm…
Tutorial: een joyplot maken in Tableau
In een eerder artikel legde ik al uit hoe u een isometrische hexkaart kunt maken; deze keer pak ik een moeilijker onderwerp aan, namelijk het maken van een joyplot in Tableau. Ik maakte gebruik van een joyplot in de visualisatie…
Isometrische hexkaart met Tableau: een stap-voor-staphandleiding
Aansluitend op mijn deelname aan Iron Viz 2020 heb ik met Tableau een nieuw soort visualisatie gemaakt waarvoor ik veel positieve feedback ontving. Ik noemde het een 'isometrische hexkaart'. In dit artikel leg ik uit hoe u dit soort weergave…
Tableau Iron Viz 2020: terugblik op mijn eerste deelname
Iron Viz (Engelse site) is als een ‘wereldbeker’ waarin wordt gestreden voor een plaats bij de beste drie ontwikkelaars van Tableau, een software waarmee data kan worden gevisualiseerd. Dit jaar besloot ik aan deze wedstrijd deel te nemen (bekijk hier…
Migratie in Europa: interactieve visualisatie in Tableau
De migratiestromen naar EU-landen op een aantrekkelijke manier weergeven, dat is wat wilde bereiken met Tableau Software. Het doel was eenvoudig, maar het ‘hoe’ was dat helemaal niet. Ik moest er enkele dagen over nadenken om de juiste oplossing en…
Waarover praten op Linkedin om likes en reviews te krijgen?
Na een analyse van mijn meest geschikte publicatietijdstippen op Linkedin heb ik nu een veel moeilijker probleem aangepakt, namelijk het bepalen van de onderwerpen die me de meeste views en reacties opleveren op Linkedin. In het artikel van vandaag toon…
Fuzzy matching: vergelijking van 4 methoden om een koppeling te makken
In een vorig artikel liet ik u kennismaken met een oplossing voor een fuzzy matching tussen 2 verschillende tabellen. Daarin vergeleek ik 2 ETL-oplossingen (Extract Transform Load). Tableau Prep Builder gaf niet het gewenste resultaat en daarom wendde ik me…
Hoe aanbevelingsalgoritmen hacken?
Een aanbevelingsalgoritme hacken kan een zeer lucratieve bezigheid zijn. Sommige aanbevelingsalgoritmen zijn immers alomtegenwoordig in ons digitale leven en beïnvloeden sterk ons gedrag. Eigenlijk zijn we zonder het goed te beseffen afhankelijk geworden van algoritmen. Zo is 35% van de…
Overzicht van RecSys 2018 op de ERU-conferentie over kunstmatige intelligentie
Op 8 en 9 november vond in het hoofdkantoor van de Europese Radio-Unie (ERU) in Genève een tweedaagse conferentie plaats. Ik mocht op de eerste dag een workshop over ethiek en kunstmatige intelligentie organiseren en op de tweede dag een…
Aanbevelingsalgoritmen: houd rekening met persoonlijkheid en emoties
Op de RecSys-conferentie 2018 over aanbevelingssystemen was er op de eerste dag een zeer interessante workshop van Marko Tkalčič van de Vrije Universiteit van Bozen-Bolzano (Italië). Hij legde uit hoe emoties, humeur en persoonlijkheid vorm geven aan de manier waarop…
Cambridge Analytica schandaal: het is de schuld van de gebruiker!
Het Cambridge Analytica-schandaal is uniek in zijn genre. Het kristalliseerde de aandacht van de media (50 miljoen ‘gehackte” accounts was het minste ervan) en een burgerbeweging volgde de oproep tot het verwijderen van zijn Facebook-account. Maar dit schandaal van Cambrige…
Signs of the Times: een artistiek project over algoritmische aanbevelingen
Aanbevelingen zijn onze digitale ervaring binnengedrongen, nooit voorheen waren ze zo aanwezig. Maar wie zou ooit denken dat deze algoritmische instrumenten ook in een offline context kunnen worden gebruikt. Twee kunstenaars in Nieuw-Zeeland, Scott Kelly en Ben Polkinghorne, kozen ervoor…
Facebookzaak : naar meer transparantie van gegevens ?
Vorige maandag nog hadden we het over de volgende revolutie in de Big Data: algoritmes worden in de toekomst transparanter. Wij stelden toen dat klanten zich steeds meer bewust zullen worden van de gevoeligheid van hun gegevens, ze zullen willen weten…
Big Data wordt kunst in MoMa
Big Data visualiseren en er zin aan geven is op zich een moeilijke oefening. Er zijn niet veel pogingen geweest, maar sommige bespraken we al op deze blog (bijvoorbeeld de geografische kaarten van Jacques Levy). Visualisering geeft soms zo verrassende…