Ich muss einen ETL-Parser in Java erstellen. Gibt es ein Open-Source-Tool oder -Framework zum Erstellen eines ETL-Parsers für unstrukturierte Daten?
Ich möchte einen Parser erstellen und muss das Format in der Eigenschaftendatei definieren, und der Parser muss in der Lage sein, gemäß dem Format in der Eigenschaftendatei zu analysieren.
Ich frage nicht nach dem vollständigen Code. Jeder Vorschlag wäre willkommen.
Um einfache und komplexe Etl-Prozesse zu erstellen, empfehle ich Kettle. Derzeit unter dem Namen Pentaho Data Integration. Geschrieben in Java mit schöner GUI und einfach in Java-Software zu integrieren. Quelle vorhanden. Siehe Webseite .
Das einzige Open-Source-Framework, das ich für die ETL-Verarbeitung in Java kenne (und verwende), ist Spring-Batch und es ist die einzige Implementierung (AFAIK) der jsr-352
. Ich bin mir nicht sicher, ob es zu Ihnen passt, weil ich bei einer einfachen Google-Suche einige reine ETL-Frameworks wie CloverETL
gefunden habe, aber ich habe sie noch nicht ausprobiert, daher kann ich mir keine Meinung bilden. Bisher benutze ich Spring-Batch seit fast 6 Monaten für ETL und Batch-Verarbeitung und bin sehr zufrieden damit :) Hoffe, ich konnte ein wenig helfen!
Für volle Transparenz arbeite ich für Talend.
Talend hat eine Open-Source-Version unserer Datenintegrationsfunktionen namens Talend Open Studio. Die Ausgabe von Talend ETL-Jobs ist nativer Code. Bei herkömmlichen Systemen wäre dies Java.
Talend Open Studio hat über 3 Millionen Downloads und eine große Benutzergemeinschaft unter https://www.talendforge.org/ .
Guido Leender
SchwarzPOP