De blog van het marketing agentschap IntoTheMinds
Marktonderzoek en ondernemers coaching
De plaats van data wrangling in de cyclus van gegevensvalorisatie
apr19

De plaats van data wrangling in de cyclus van gegevensvalorisatie

In de wereld van de data is data wrangling tegenwoordig een beetje een modewoord. In dit artikel gaven we u al een algemeen overzicht. In het artikel van vandaag lichten we het nader toe en plaatsen we data wrangling binnen de gegevenswaardecyclus. Samenvatting Opfrissing over data wrangling #para1Stap 1: gegevensverzameling Stap 2: gegevensopslag Stap 3: gegevensverwerking Enkel voor onze abonnés: exclusieve analyse en marketing tips E-mailadres  * Inschrijven Door u te abonneren gaat u akkoord met...

Lees verder
Data wrangling: definitie, stappen, tools [gids 2021]
mrt29

Data wrangling: definitie, stappen, tools [gids 2021]

De technische term “Data wrangling”, ook wel “Data munging” genoemd, lijkt op het eerste gezicht intimiderend. De bedoeling van dit artikel is om het woord te demystifiëren. Data wrangling wordt gedefinieerd als een belangrijk onderdeel van een groter proces dat “gegevensvoorbereiding” heet. Het verwerken van gegevens is het proces van verzamelen, selecteren, structureren, verrijken en tenslotte transformeren van informatie om een specifieke vraag te beantwoorden. Deze overkoepelende vraag is gewoonlijk zeer analytisch. De verwerking van gegevens...

Lees verder
ETL benchmark: hoe lang duurt het om 1 miljard rijen te verwerken?
mrt26

ETL benchmark: hoe lang duurt het om 1 miljard rijen te verwerken?

In een vorig artikel wees ik al op het belang van de verwerkingssnelheid bij de keuze van een data preparation-software (ETL). Ik maakt een eerste benchmark tussen Alteryx, Tableau Prep en Anatella op een bestand van 108 miljoen rijen. Deze keer herhaalde ik de operatie op 1,039 miljard rijen en voegde Talend aan de benchmark toe. De resultaten zijn onverwacht aangezien de verwerkingssnelheden variëren met een factor 1 tot 20. TEASER : In mijn volgende artikel...

Lees verder
ETL: op basis van welke criteria uw keuze bepalen [benchmark]
mrt22

ETL: op basis van welke criteria uw keuze bepalen [benchmark]

Ik gebruik regelmatig 4 ETL-oplossingen: Alteryx, Tableau Prep, Talend en Anatella. Het zijn er maar 4 naast vele andere. De ETL-benchmark van G2 (Engelse site) vermeldt er maar liefst 40. In dit artikel leg ik u uit waarom de  benchmark van G2 niet noodzakelijk relevant is en welke criteria ik gebruik om een vergelijking te maken tussen ETL-tools (Extract – Transform – Load) die het meest geschikt zijn voor uw behoeften. Samenvatting Wat is een ETL?...

Lees verder
De 5 niveaus van datavisualisatie: voorbeelden en advies [gids 2021]
jan11

De 5 niveaus van datavisualisatie: voorbeelden en advies [gids 2021]

Na het schrijven van mijn gids voor datavisualisatie wilde ik in een afzonderlijke artikel verder ingaan op de 5 niveaus van datavisualisatie die ik daarin kort heb geschetst. Als u wilt weten waar u zich bevindt in uw praktijk van BI (Business Intelligence) en dataviz, dan is dit artikel iets voor u! Samenvatting Inleiding Niveau 0 (geen dataviz) Niveau 1 (u werkt nog altijd met Excel?) Niveau 2 (leve de dashboards) Niveau 3 (laat me u...

Lees verder
Tutorial: een joyplot maken in Tableau
okt02

Tutorial: een joyplot maken in Tableau

In een eerder artikel legde ik al uit hoe u een isometrische hexkaart kunt maken; deze keer pak ik een moeilijker onderwerp aan, namelijk het maken van een joyplot in Tableau. Ik maakte gebruik van een joyplot in de visualisatie die ik indiende bij IronViz. Omdat het hier om een eerder zeldzaam type van grafiek gaat en ik wat moeilijkheden ondervond om het gewenste resultaat te krijgen, dacht ik dat een tutorial wel op zijn plaats...

Lees verder