PDF mit gescanntem Bild der PDF vergleichen

Ich vermute, das ist ein langer Schuss, aber hier geht es.

Wir senden ein PDF per E-Mail an einen Kunden, er druckt es aus, unterschreibt es und kommentiert es vielleicht, scannt es wieder ein und sendet es dann per E-Mail an uns zurück. Das zurückkommende PDF ist also nicht schön formatiert, sondern ein als PDF gespeichertes Bild. Ich muss die beiden PDFs vergleichen und die Anmerkungen finden.

Gibt es Bibliotheken vorzugsweise in C# (bezahlt und kostenlos), die dabei hilfreich wären?

Danke

Antworten (1)

Das Unternehmen, für das ich arbeite, hat ein Imaging-SDK, das Ihnen dabei helfen könnte. Die Idee, die ich im Kopf habe, ist folgende:

  1. Laden Sie sowohl die Original- als auch die geänderten PDF-Seiten als Bilder mit derselben Auflösung. Der Code dafür ist einfach:

    RasterCodecs _codecs = new RasterCodecs();
    RasterImage imageBefore = _codecs.Load(pdf1);
    RasterImage imageAfter = _codecs.Load(pdf2);

  2. Richten Sie beide Bilder so aus, dass entsprechende Bereiche die gleichen Koordinaten haben. Dieser Teil erfordert etwas Arbeit, wurde aber bereits in diesem Forumsbeitrag erledigt . Beim Entwerfen Ihres Programms müssen Sie bestimmte Suchschlüsselwörter an ungefähren Positionen identifizieren, aber danach wird der Ausrichtungsprozess mithilfe von OCR automatisiert.

  3. Sobald Sie die beiden Bilder ausgerichtet haben, können Sie eines voneinander subtrahieren (oder XOR), um Bereiche zu erhalten, in denen sie sich unterscheiden. Dies geschieht mit der CombineFastCommand-Klasse

Wenn Sie unser SDK ausprobieren möchten, haben wir eine voll funktionsfähige kostenlose Evaluierung, die Sie hier finden können . Die Evaluierung wird mit kostenlosem E-Mail- und Online-Chat-Support geliefert, und Sie können sich vor und während der Evaluierung mit allen Fragen an den Support wenden , einschließlich technischer Fragen zu unseren Funktionen und Beispielcodeprogrammen.