17 Juni 2022 709 words, 3 min. read

ETL: Anatella in Web-Version mit hoher Leistung

By Pierre-Nicolas Schwab PhD in marketing, director of IntoTheMinds
Wenn Sie sich für Data Science interessieren, wissen Sie, dass die Datenaufbereitung ein sehr zeitaufwändiger Schritt ist. Deshalb ist die Wahl der richtigen ETL-Software so wichtig. Meine Lieblingslösung ist Anatella. Ich schätze seine Qualitäten in Bezug auf Geschwindigkeit und den Reichtum der vorgeschlagenen Transformationen. So bin ich […]

Wenn Sie sich für Data Science interessieren, wissen Sie, dass die Datenaufbereitung ein sehr zeitaufwändiger Schritt ist. Deshalb ist die Wahl der richtigen ETL-Software so wichtig. Meine Lieblingslösung ist Anatella. Ich schätze seine Qualitäten in Bezug auf Geschwindigkeit und den Reichtum der vorgeschlagenen Transformationen. So bin ich natürlich immer begeistert, wenn ein neues Produkt auf den Markt kommt. In diesem Fall ist es die Web-Version von Anatella, die es dem Herausgeber Timi ermöglicht, einen sehr störenden Preis vorzuschlagen.


Anatalla im Web: Was ändert sich in der Oberfläche

Die Web-Version sollte nicht zu desorientierend für diejenigen sein, die Anatella in ihrer Desktop-Version verwenden. Der einzige bemerkenswerte Unterschied ist das Vorhandensein eines Fensters auf der linken Seite, das als Vermittler für die Verwaltung Ihrer Dateien dient. Drag & Drop-Dateien sollten in diesem Fenster und nicht im Anatella-Fenster selbst ausgeführt werden.

anatella web version

Im Übrigen ändert sich nichts. Sobald Sie sich identifizieren, öffnet sich das Fenster und passt sich der Auflösung Ihres Bildschirms an. Sie finden sofort Ihre Lager, und ich muss zugeben, dass es ein unbestreitbarer Vorteil gegenüber einigen Lösungen ist, deren Web-Version anders ist.


Spezifische Funktionen

Auf dem Menü dieser Web-Version gibt es einige zusätzliche spezifische Funktionen. Eine davon ist besonders geeignet, da es sich um eine integrierte Bildschirmfreigabe handelt. Die Lösung, die von Beyond SSL bereitgestellt wird, ermöglicht es Ihnen, in Echtzeit mit mehreren Personen in einem Anatella-Fenster zusammenzuarbeiten. Ich fand das extrem bequem und schlau. Keine Notwendigkeit, zusätzliche Software wie AnyDesk zu installieren. Alles ist in Anatella integriert.

Die andere neue Funktion ist ein Datei-Upload. In der lokalen Version von Anatella müssen Sie einen „Output“ -Anschluss verwenden, um die Daten an den gewünschten Ort zu extrahieren. Diese Option ist natürlich weiterhin verfügbar, da sie den Kern der ETL bildet. Die Version bietet auch die Möglichkeit, die Ausgabedaten direkt herunterzuladen (siehe Abbildung unten). Dies ist ein kleiner Zusatz, aber am Ende kann es Ihnen ein wenig Zeit sparen, wenn Sie sich nicht erinnern können, wo die Daten gespeichert sind.

download anatella web


Beeindruckende Leistung

Die Web-Versionen anderer ETLs, die ich bisher getestet hatte, haben mich nie wirklich überrascht. Die Überraschung war da, weil die Ergebnisse meines vorherigen Benchmarks explodierten. Dies ist wahrscheinlich auf die Architektur und Konstruktion der Software zurückzuführen. Es war mit Neugier, dass ich eine Operation auf 1 Milliarde Linien gestartet.

1 billion lines handled on anatella web version

Während in meinem letzten Benchmark, dauerte es 760 Sekunden, um die Operation zu realisieren, kommt die Web-Version von Anatella in 35,59 Sekunden. Der Grund dafür ist die virtuelle Maschine, auf der Anatella läuft. Selbst beim Laden einer 10 GB Flachdatei mit einer Milliarde Zeilen auf die virtuelle Maschine wird der Vorgang in 72,63 Sekunden realisiert.

Die Wahl der CPU ist eine direkte Folge eines Artikels, in dem Frank Vanden Berghen, der Erfinder von Anatella, die eingängige und mehrgängige Leistung einer ganzen Reihe von CPUs verglichen hat. Am Ende dieses Benchmarks stach der AMD Ryzen 9 5950x hervor (er ist in der Grafik unten eingekreist). Es ist also die CPU, die die virtuelle Maschine ausrüstet, auf der die Web-Version von Anatella läuft.

best cpu for data science

Benchmark verschiedener CPUs auf dem Markt für Data-Science-Anwendungen (Kredit: Timi)


Ein interessantes Angebot

Die Veröffentlichung dieser Web-Version ermöglicht Timi, ein sehr attraktives Einführungsangebot für 99€/Monat vorzuschlagen. Der Normalpreis beträgt 499€/Monat. Aber selbst zu diesem Preis ist es extrem wettbewerbsfähig. In der Web-Version ist Ihr ETL dank einer hochmodernen Maschine direkt betriebsbereit, perfekt konfiguriert und leistungsstark. Darüber hinaus können Sie mit der monatlichen Abonnementformel Ihre Kosten auf ein Minimum reduzieren, wenn Sie es wünschen. Dies ist in einem Markt, in dem jährliche Lizenzen die Regel sind, ziemlich disruptiv.

Das i-Tüpfelchen auf dem i ist, dass für diesen Preis, Sie erhalten auch 200 GB Speicherplatz (auf SSD), die nichts verderben. Um die Vorrechte der sensibelsten zu erfüllen, befindet sich der Server in Europa, und das Unternehmen, das Ihre Daten hostet, ist europäisch. Eine gute Möglichkeit, 100% konform mit der DSGVO und dem Cloud Actzu sein.

Um mehr zu erfahren, besuchen Sie die Timi Website.



Posted in Data & IT.

Post your opinion

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert