FLOSS-Software zum Schreiben von PDF/A-2 mit JPEG2000-Komprimierung?

Gibt es eine kostenlose Software oder Open-Source-Lösung zum Schreiben einer JPEG2000-komprimierten PDF-Datei, insbesondere einer PDF/A-2 -Datei, auch bekannt als ISO 19005-2?

Das Erstellen einer PDF 1.1-Datei mit verlustfreier Komprimierung oder JPEG-Komprimierung ist einfach, beispielsweise mit tiff2pdf von libtiff . Sogar imagemagick kann es tun, wenn Sie Probleme mit der Speichernutzung umgehen können ; und imagemagick können theoretisch das JPEG2000/JP2-Format verwenden , wenn der entsprechende Delegate installiert ist.

Für JPEG2000 habe ich jedoch keine gute Lösung gefunden. Ich denke, Kakadu und Luratech sind einige gängige, aber sie sind proprietär. Internet Archive verwendet kakadu zum Produzieren von jp2-Dateien und luratech zum Produzieren von PDF-Dateien, aber ich glaube nicht, dass sie PDF/A-2 JPEG2000-komprimierte Dateien erzeugen.

Unterstützen FLOSS und gängige PDF-Reader das PDF/A-2-Format auch problemlos?

Dieses Tool softwarerecs.stackexchange.com/a/26102 unterstützt auch JPEG2k, sodass Sie beispielsweise mit imagemagick separate Bilder in JPEG2k codieren und sie dann mit ihm zu PDF kombinieren können. Direktlink: gitlab.mister-muffin.de/josch/img2pdf
JPEG2000 ist jedoch kein sehr gutes Format für verlustbehaftete Komprimierung, tatsächlich verliert es gegenüber modernen JPEG-Encodern, wenn Sie also speziell auf den verlustbehafteten Modus abzielen, dann würde vielleicht die Verwendung eines effizienten JPEG-Encoders (mozjpeg) gut ausreichen.
@SargeBorsch vielleicht, aber mein Anwendungsfall besteht darin, einige vorhandene JPEG2000-Dateien als PDF zu "verpacken", ohne sie zu decodieren/neu zu codieren.
der erste Vorschlag kann es tun
Update: IA hat einige weitere FLOSS-Dienstprogramme zum Generieren von PDFs eingeführt, verwendet aber vorerst immer noch Kakadu. blog.archive.org/2020/11/23/…

Antworten (1)

Erstellen von PDF/A-2 einschließlich JPEG-2000

iText ist eine in Java und C# verfügbare PDF-Bibliothek, mit der Sie PDFs erstellen können, die dem PDF/A-2-Format entsprechen. Einige Beispiele finden Sie hier .

Beachten Sie, dass Sie die iText-Kernbibliothek sowie die pdfa-Bibliothek als Addon zur Kernbibliothek benötigen. iText Core unterstützt JPEG2000-Bilder.

iText wird unter AGPLv3 veröffentlicht. Die AGPL ist eine freie Softwarelizenz, was bedeutet, dass iText freie Software ist. Das bedeutet nicht, dass Sie iText kostenlos nutzen können . Sie können iText nur verwenden, ohne eine kommerzielle Lizenz zu erwerben, wenn Ihre Software auch unter der AGPLv3 veröffentlicht ist (oder der GPLv3; Sie können Ihre Software nicht unter einer anderen Lizenz veröffentlichen).

Anzeigen von PDF/A

PDF/A-2 baut auf ISO-32000-1 auf. Es ist eine Teilmenge, die einige Verpflichtungen (z. B. die Verpflichtung zum Einbetten von Schriftarten, die Verpflichtung zum Bereitstellen von Farbprofilen, ...) und Einschränkungen (z. B. Javascript ist verboten, Verschlüsselung ist verboten, ...) beinhaltet. Diese Verpflichtungen und Einschränkungen sollen sicherstellen, dass jeder PDF-Viewer das Dokument zuverlässig darstellt.

Keine dieser Verpflichtungen oder Einschränkungen hindert einen Betrachter, der ein reguläres PDF (ISO-32000-1) darstellen kann, daran, ein PDF/A-Dokument darzustellen. Als Antwort auf Ihre Zusatzfrage: Jeder PDF-Viewer, der vorgibt, ISO-32000-1 zu unterstützen, unterstützt automatisch auch ISO-19005-2.

Aktualisieren

iText ist eine Bibliothek für Entwickler. Das bedeutet, dass Sie Code schreiben müssen, um ein PDF-Dokument zu erstellen. Wir haben eine Java-Version (iText), eine C#-Version (iTextSharp) und eine Android/GAE-Version (iTextG). Es gibt keine GUI (es ist eine Bibliothek) und eine CLI wäre schwierig: Normalerweise werden PDFs erstellt, um Daten aus einer Datenbank zu veröffentlichen. Wie würden Sie eine Verbindung zu einer Datenbank herstellen, eine Abfrage durchführen und die Ergebnisse dieser Abfrage über etwas so Einfaches wie eine CLI organisieren?

Warum sollten wir iText und tiff2pdf kombinieren? iText unterstützt die Konvertierung von TIFF in PDF. Warum sollten wir iText und ImageMagick kombinieren? iText unterstützt die gängigsten Bildformate und die Bildbearbeitung kann einfach über Standard-Java- oder C#-Funktionen durchgeführt werden.

Ich bin mir nicht sicher, ob ich Ihre Frage zu TIFF verstehe. TIFF ist ein sterbendes Format. Es ist auch ein Schmerz: Der TIFF-Standard wurde auf so viele verschiedene Arten interpretiert, dass jeder seine eigene TIFF-Variante zu kreieren scheint. Wenn Sie sich die Änderungsprotokolle von iText ansehen, sehen Sie, dass wir in den letzten 15 Jahren in vielen Versionen Korrekturen zur Unterstützung von "schmutzigen" TIFFs bereitgestellt haben.

Welche Leser behaupten, dass sie ISO-32000-1 unterstützen? Das ist eine schwierige Frage. Einige mögen sagen, dass sie ISO-32000-1 unterstützen, aber "vergessen", dass JPEG-2000 Teil dieser Spezifikation ist.

JPEG-2000 ist keine Voraussetzung für PDF/A. Tatsächlich war die Unterstützung für JPEG-2000 eines der neuen Dinge, die in PDF/A-2 eingeführt wurden (sie war in PDF/A-1 nicht vorhanden). Sie können problemlos eine PDF/A-2-Datei erstellen, die kein JPEG-2000-Bild enthält. Aber vielleicht interpretiere ich deine Frage falsch. Sie meinten wahrscheinlich, dass Viewer, die ISO-32000-1 (und ISO-19005-2) vollständig unterstützen, JPEG-2000 unterstützen müssen. Das stimmt, und ich habe keine Ahnung, welche Betrachter JPEG-2000 dekodieren können.

Interessant, schön, dass ein iText-Entwickler meine Frage so schnell gefunden hat! AGPL ist eine großartige Lizenz, ich bin froh, wenn ich gezwungen bin, mich daran zu halten. Gibt es schon eine CLI oder GUI? Würden Sie Lizenzen für die Aufnahme als Delegierter von ImageMagick (oder tiff2pdf) verkaufen oder würden Sie ein solches kombiniertes Paket erstellen und verkaufen? Bezüglich YATP, gibt es eine gute Liste von Fallstricken/Empfehlungen, um gute interoperable TIFFs zu erstellen (vielleicht eine andere Frage)? Zur Kompatibilität, was die Leser sagen, unterstützen sie dann ISO-32000-1 (vielleicht eine andere Frage). Wenn JPEG2000 keine Voraussetzung für PDF/A war, vermute ich, dass viele es nicht dekodieren können.
Ich werde meine Antwort aktualisieren.
Danke schön. Der größte Teil der digitalisierten Geschichte unserer Kultur wird im TIFF-Format gespeichert, ob es Ihnen gefällt oder nicht. || Glauben Sie, dass es machbar ist, PDFs aus TIFF-Originalen im Handumdrehen zu generieren, zB auf einem Buchbetrachter oder Bildserver wie iipimage.sourceforge.net ? || Tatsächlich meinte ich, dass viele es wahrscheinlich ignoriert haben, weil PDF/A-Dokumente JPEG2000 nicht verwenden können und JPEG2000 im Allgemeinen nicht viel verwendet wird. Ich habe die Frage auf softwarerecs.stackexchange.com/questions/25497/… aufgeteilt.
Sie können iText verwenden, um das TIFF auf einem Gerät im Handumdrehen in PDF zu konvertieren. Aber: Wollen Sie das wirklich? Buchbetrachter haben normalerweise begrenzte CPU und Speicher. Die Bereitstellung von PDF anstelle von TIFF könnte besser sein und es könnte spontan erfolgen, aber Sie können es auch so machen, wie es die New York Times im Jahr 2007 getan hat, siehe dieses Testimonial .