17 juni 2022 714 woorden, 3 min. gelezen

ETL: Anatella in webversie met hoge prestaties

Door Pierre-Nicolas Schwab Gepromoveerd in marketing, directeur van IntoTheMinds
Als u geïnteresseerd bent in data science, dan weet u dat gegevensvoorbereiding een zeer tijdrovende stap is. Net daarom is de keuze van een goed ETL-programma zo belangrijk. Mijn favoriete software is Anatella. Ik waardeer vooral de snelheid en de […]

Als u geïnteresseerd bent in data science, dan weet u dat gegevensvoorbereiding een zeer tijdrovende stap is. Net daarom is de keuze van een goed ETL-programma zo belangrijk. Mijn favoriete software is Anatella. Ik waardeer vooral de snelheid en de rijkdom van de voorgestelde transformaties. Dus als er een nieuw product op de markt komt, ben ik natuurlijk altijd enthousiast. In dit geval gaat het om de webversie van Anatella die de uitgeverij Timi in staat stelt een zeer uitdagende prijs aan te bieden.


Anatalla op het web: wat verandert er in de interface

Voor degenen die Anatella als desktopversie gebruiken, zou de webversie niet al te moeilijk moeten zijn. Het enige opmerkelijke verschil is de aanwezigheid van een venster aan de linkerkant dat dient als tussenpersoon voor het beheer van uw bestanden. Van nu af aan moet het slepen en neerzetten van bestanden in dit venster gebeuren en niet in het Anatella-venster zelf.

anatella web version

Voor de rest verandert er niets. Zodra u inlogt, wordt het venster geopend en past het zich aan uw schermresolutie aan. U vindt onmiddellijk uw weg en ik moet toegeven dat dit een onbetwistbaar voordeel is in vergelijking met sommige oplossingen waarvan de webversie anders is.


Enkele specifieke kenmerken

Deze webversie heeft een paar extra specifieke kenmerken. Een daarvan is bijzonder relevant omdat het een geïntegreerde schermdeling is. De oplossing, geleverd door Beyond SSL (Engelse site), laat u toe om in real time samen te werken met verschillende mensen in één Anatella-venster. Ik vond dit erg praktisch en slim. Het is niet nodig om extra software zoals AnyDesk te installeren. Alles is geïntegreerd in Anatella.

De andere nieuwe functie betreft het downloaden van bestanden. In de lokale versie van Anatella moet u een “output- connector gebruiken om gegevens naar de gewenste locatie te extraheren. Deze optie is uiteraard nog altijd beschikbaar omdat het de kern van de ETL is. De versie biedt ook de mogelijkheid om de uitvoergegevens rechtstreeks te downloaden (zie onderstaande schermafbeelding). Dit is een kleine toevoeging, maar uiteindelijk kan het u wat tijd besparen als u niet meer weet waar de gegevens worden opgeslagen.

download anatella web


Indrukwekkende prestaties

De webversies van de andere ETL’s die ik tot nu toe had getest, hadden me nooit echt verrast. Dat was waarschijnlijk te wijten aan de architectuur en de opbouw van de software zelf. Het was dan ook met nieuwsgierigheid dat ik een operatie heb gestart met 1 miljard rijen. De verrassing kwam niet onverwacht toen de resultaten van mijn vorige benchmark explodeerden.

1 billion lines handled on anatella web version

Terwijl het in mijn laatste benchmark 760 seconden duurde om de operatie te voltooien, deed de webversie van Anatella er 35,59 seconden over. De reden hiervoor is de virtuele machine waarop Anatella draait. Zelfs bij het laden van een 10 GB grote flat file met een miljard rijen op de virtuele machine, duurde de hele operatie slechts 72,63 seconden.

De keuze van de CPU is het directe gevolg van een artikel (Engelse site) waarin Frank Vanden Berghen, de uitvinder van Anatella, de single-threaded en multi-threaded prestaties van een hele reeks CPU’s vergeleek. De AMD Ryzen 9 5950x stak er met kop en schouders bovenuit (hij is omcirkeld in de grafiek hieronder). Dit is de CPU die de virtuele machine voedt waarop de webversie van Anatella draait.

best cpu for data science

Benchmark van verschillende CPU’s op de markt voor data science-toepassingen
 (credits: Timi).


Een interessant aanbod

De release van deze webversie stelt uitgever Timi in staat een zeer aantrekkelijk introductieaanbod te doen voor €99/maand. De normale prijs is €499/maand. Maar zelfs voor deze prijs is hij uiterst concurrerend. In de webversie is uw ETL onmiddellijk operationeel, perfect geconfigureerd en superefficiënt dankzij een state-of-the-art machine. Bovendien kunt u dankzij de maandelijkse abonnementsformule uw kosten tot een minimum beperken als u dat wenst. Dit is duidelijk disruptief op een markt waar jaarlijkse licenties de regel zijn.

Voor deze prijs krijg je bovendien 200Gb aan opslagruimte (op SSD) als kers op de taart. Ten slotte, om tegemoet te komen aan de wensen van de meest veeleisende personen, bevindt de server zich in Europa en is het bedrijf dat uw gegevens host Europees. Een mooie manier om 100% in overeenstemming te zijn met de GDPR en de Cloud Act.

Voor meer informatie kunt u terecht op de website van Timi.



Posted in Data en IT.

Plaats uw mening

Je e-mailadres zal niet getoond worden. Vereiste velden zijn gemarkeerd met *