Gibt es eine PDF-Software, die die Anmerkungen/Kommentare anhand von Suchkriterien finden, extrahieren, auswählen und dann zusammenfassen kann?

  • Hier ist die Situation : Ich habe 700 PDF-Dateien in einem Ordner (diese Dateien müssen da sein!). Jede Datei enthält Dutzende oder Hunderte von Anmerkungen/Kommentaren. Jede Anmerkung/Kommentar hat Schlüsselwörter, um ein Projekt oder ein Thema zu identifizieren .

  • Hier ist die Notwendigkeit : Für ein bestimmtes Projekt/Thema, Sammeln aller Anmerkungen/Kommentare aus allen PDF-Dateien in diesem Ordner in einer PDF-Datei, Anmerkungen/Kommentare, die sich auf dieses bestimmte Projekt beziehen.

  • Details : Hier gibt es zwei Operationen: 1) Finden/Extrahieren der Anmerkungen/Kommentare; 2) dann nur die gefundenen Anmerkungen/Kommentare auswählen und in einer pdf-Datei zusammenfassen.

  • Hier ist die Frage : Gibt es eine PDF-Software, die in der Lage ist, die Anmerkungen/Kommentare basierend auf einem Suchkriterium als Schlüsselwort , beispielsweise dem Namen eines Projekts , zu finden, zu extrahieren, auszuwählen und dann zusammenzufassen ?

  • Meine Erfahrung : Ich habe viele Software ausprobiert, aber ohne Erfolg. XChange Editor 6 kam dem nahe. Er kann die erste Operation durchführen. Der Suchbereich kann nur diese Anmerkungen/Kommentare basierend auf einer bestimmten Schlüsselwortsuche aus allen PDF-Dateien anzeigen (die Suche kann innerhalb von Anmerkungen/Kommentaren durchgeführt werden). Dies ist leistungsstark, da Sie durch die gefundenen Anmerkungen/Kommentare navigieren können. Aber da er nicht in der Lage ist, die zweite Operation durchzuführen, dh nur die gefundenen Anmerkungen/Kommentare auszuwählen und zusammenzufassen, muss ich die Suche jedes Mal wiederholen, wenn ich an einem bestimmten Projekt oder Thema arbeiten möchte.

Hier ist ein Screenshot, um zu verstehen, was ich meine:

Geben Sie hier die Bildbeschreibung ein

Wie Sie sehen können, verwende ich den XChange Editor. Also, wie gesagt, XChange Editor geht den halben Weg. Auf der linken Seite sehen wir den hervorgehobenen Text in Gelb mit der Popup-Nachricht, die sich öffnet. Ich füge der ersten Zeile der Popup-Nachricht den Projektcode 0025 und ein Betreff-Tag/Schlüsselwort hinzu, in diesem Fall lautet das Tag „Frege“. Auf diese Zeile folgt der hervorgehobene Text, den XChange automatisch in die Popup-Meldung kopiert hat.

Rechts sehen Sie das Suchfenster. Der Suchbereich führt die erste von mir definierte Operation aus: Finden/Extrahieren der Anmerkungen/Kommentare basierend auf einem Suchkriterium. In diesem Fall lautet das Suchkriterium „0025“, wie Sie im Abschnitt „ Erweitertes Kriterium “ sehen können . Dies ist möglich, da ich mit der Schaltfläche Optionen... festlegen kann, dass nur innerhalb von Kommentaren gesucht werden soll. Unterhalb der Suchoptionen befinden sich die Ergebnisse. Es ist wirklich leistungsfähig, da ich durch alle von der Suchmaschine gefundenen Kommentare navigieren kann.

Jetzt möchte ich diese Ergebnisse, diese Kommentare, Kommentare, die aus vielen PDF-Dateien stammen (jede fettgedruckte Zeile im Ergebnisfenster ist eine PDF-Datei), in einer einzigen PDF-Datei sammeln oder zusammenfassen. Diese zweite Operation kann der XChange Editor nicht ausführen. Und übrigens ist keiner der vorhandenen PDF-Editoren, die ich ausprobiert habe, dazu in der Lage. Sicher, der XChange-Editor kann Kommentare aus einer einzelnen Datei nach Sortierkriterien (Typ, Autor, Datum usw.) zusammenfassen, aber nicht nach Suchkriterien (wie "0025" in meinem Beispiel).

Also, wenn ich darf, wiederhole ich meine Frage:

Gibt es eine PDF-Software, die in der Lage ist, die Anmerkungen/Kommentare aus einer Reihe von PDF-Dateien basierend auf einem Suchkriterium zu finden, zu extrahieren, auszuwählen und dann zusammenzufassen , beispielsweise den Namen eines Projekts als "0025" in meinem Fall? Wenn es um kostenpflichtige Lösungen geht, bin ich bereit, bis zu 10$/Jahr zu zahlen.

Danke vielmals,

Francois

Izzy ändere meinen Beitrag. Ist es legal?
Ja, auf dieser Seite ist jeder willkommen, die Beiträge anderer zu verbessern, solange der Geist der Frage noch vorhanden ist und keine Anforderungsinformationen verloren gehen. Aber in diesem speziellen Fall bin ich mir nicht sicher, warum @Izzy die Budgetinformationen entfernt hat, die relevant erschienen.
@NicolasRaoul Ich habe es nicht entfernt , ich habe es hinzugefügt (integrierte Fakten aus Kommentaren). Es war Francois selbst, der es wieder entfernte. Sie müssen ihn also fragen, warum er das getan hat – da stimme ich Ihnen zu, das ist relevant. // Francois: Wie Nicolas sagte, wir helfen uns gegenseitig, uns zu verbessern. Fakten sollten im Fragepost selbst enthalten sein, da sie in Kommentaren untergehen. Zur Rechtmäßigkeit: Sie haben ausdrücklich zugestimmt, Ihre Inhalte unter eine CC-Lizenz zu stellen, siehe ganz unten auf dieser Seite ;)
PS: Izzy hat es wieder getan. Izzy & Nicolas sind hier Moderatoren (wie man an dem ♦ an ihren Nicks erkennen kann), also kümmern sie sich besonders um die Qualität dieser Seite – und versuchen, wie alle Community-Mitglieder hier, besonders Neulingen zu helfen, damit ihre Fragen beantwortet werden beste Chancen auf gute Antworten. Weshalb wesentliche Details sichtbar sein sollten ;)
@Izzy und Raoul Tut mir leid, ich habe deine Vorgehensweise bei StackExchange nicht verstanden. Dies ist kein Standardansatz für die meisten Diskussionsforen. Trotzdem, wenn Sie mir trotzdem helfen können.
"Dies ist kein Standardansatz für die meisten Diskussionsforen." Sicher nicht. Dies ist eine Q&R-Seite, kein Forum :) Diskussionen finden in unserem Chatroom statt (10 weitere Vertreter, und Sie können ihn auch benutzen). Auf der Hauptseite haben wir Fragen und Antworten, aber keine Diskussionen. Kommentare dienen der Verdeutlichung, weshalb die Essenz vorzugsweise bei der bzw. Frage Antwort. Unsere Tour erklärt einiges davon.

Antworten (1)

Zotero mit pdftotextTools (wird auf Anfrage automatisch installiert) kann eine Volltextsuche durchführen, Anmerkungen und Inhaltsverzeichnisse extrahieren und Berichte in einer riesigen Datenbank mit Tausenden von PDFs erstellen.