Artikelen ingedeeld onderDatawetenschappen
De plaats van data wrangling in de cyclus van gegevensvalorisatie
Door Pierre-Nicolas Schwab •
In de wereld van de data is data wrangling tegenwoordig een beetje een modewoord. In dit artikel gaven we u al een algemeen overzicht. In het artikel van vandaag lichten we het nader toe en plaatsen we data wrangling binnen…
Data wrangling: definitie, stappen, tools [gids 2021]
De technische term "Data wrangling", ook wel "Data munging" genoemd, lijkt op het eerste gezicht intimiderend. De bedoeling van dit artikel is om het woord te demystifiëren. Data wrangling wordt gedefinieerd als een belangrijk onderdeel van een groter proces dat…
ETL benchmark: hoe lang duurt het om 1 miljard rijen te verwerken?
In een vorig artikel wees ik al op het belang van de verwerkingssnelheid bij de keuze van een data preparation-software (ETL). Ik maakt een eerste benchmark tussen Alteryx, Tableau Prep en Anatella op een bestand van 108 miljoen rijen. Deze…
ETL: op basis van welke criteria uw keuze bepalen [benchmark]
Door Pierre-Nicolas Schwab •
Ik gebruik regelmatig 4 ETL-oplossingen: Alteryx, Tableau Prep, Talend en Anatella. Het zijn er maar 4 naast vele andere. De ETL-benchmark van G2 (Engelse site) vermeldt er maar liefst 40. In dit artikel leg ik u uit waarom de benchmark…
De 5 niveaus van datavisualisatie: voorbeelden en advies [gids 2021]
Door Pierre-Nicolas Schwab •
Na het schrijven van mijn gids voor datavisualisatie wilde ik in een afzonderlijke artikel verder ingaan op de 5 niveaus van datavisualisatie die ik daarin kort heb geschetst. Als u wilt weten waar u zich bevindt in uw praktijk van…
Tutorial: een joyplot maken in Tableau
Door Pierre-Nicolas Schwab •
In een eerder artikel legde ik al uit hoe u een isometrische hexkaart kunt maken; deze keer pak ik een moeilijker onderwerp aan, namelijk het maken van een joyplot in Tableau. Ik maakte gebruik van een joyplot in de visualisatie…