Beste Kameraeinstellungen zum Fotografieren von Text?

Ich verwende mein S95, um Textdokumente (sowohl Papier als auch Mikrofilm) für OCR zu fotografieren. Ich habe bereits nach den Problemen gefragt, wie man am besten einen Computerbildschirm für Mikrofilm fotografiert, aber ich habe darüber nachgedacht, wie man Text am besten so fotografiert, dass der Text klar und deutlich herauskommt. Hier sind meine aktuellen Gedanken, aber ich würde gerne hören, was jemand mit mehr Fotografieerfahrung als ich zu sagen hat:

  1. Ich verwende eine kleinere Anzahl von Megapixeln (etwa 6-7 MP statt des Maximums des S95, das 10 MP beträgt), damit die resultierenden PDF-Dateien meinen Computer nicht zerstören, wenn ich tatsächlich durch sie scrolle

  2. Blende - niedriger (z. B. f/6.3), damit der Text scharf bleibt, wenn die Kamera nicht genau parallel zur Seite steht

  3. Verschlusszeit - Hier gibt es einen Kompromiss, da Bibliotheken im Allgemeinen weniger Licht haben, also würde ich gerne die Verschlusszeit verringern, um die Belichtung zu erhöhen, aber ohne Stativ besteht die Möglichkeit, dass die Kamera wackelt

  4. ISO - Ich bin mir nicht ganz sicher, wie sich das auswirken würde.

  5. Weißabgleich - Auch hier bin ich mir nicht ganz sicher.

Ich habe mit verschiedenen Einstellungen an meiner Kamera experimentiert, aber ich lerne gerade erst etwas über Fotografie und würde gerne wissen, ob jemand Vorschläge hat, wie man am besten Text, aus Büchern oder aus Dokumenten fotografiert, der leicht zu lesen ist.

Warum nicht einfach das richtige Werkzeug für den Job verwenden und einen Scanner verwenden?
Können Sie Ihren Workflow näher erläutern? Funktioniert die OCR bei den JPEGs oder konvertieren Sie die JPEGs zuerst in PDF? Wie ist die Druckqualität? Ist es gealtert oder ist alles ziemlich frisch?
"Warum nicht einfach das richtige Werkzeug für den Job verwenden und einen Scanner verwenden?" - Weil viele der Dokumente, mit denen ich arbeite, nicht gescannt werden können. Sie sind entweder sehr zerbrechlich, oder die Bibliothek erlaubt Ihnen nicht zu scannen, oder die Bibliothek berechnet exorbitante Kosten für das Scannen von mehr als 0,50 $/Seite.
"Können Sie Ihren Arbeitsablauf näher erläutern?" - Ich konvertiere die JPGs in PDF und arbeite mit ihnen auf dem Computer, drucke einige davon aus, um sie zu markieren.
Ich möchte, dass Folgendes gesagt wurde: Ich hoffe, dass Ihre Verwendung Urheberrechte angemessen respektiert, sofern und soweit relevant. :) Vorausgesetzt, ich hoffe, Sie finden Ihre Antworten!
@lindes - guter Anruf
"Ich hoffe, dass Ihre Verwendungen Urheberrechte angemessen respektieren" - Ja, meine Arbeit befasst sich mit Dokumenten außerhalb der Urheberrechtsbeschränkungen (ich bin Historiker und studiere hauptsächlich Europa des späten 19. Jahrhunderts)
Das mag ketzerisch klingen, aber ich habe gelesen, dass Point-and-Shoot-Kameras von Canon im automatischen Modus recht vernünftig sind. Haben Sie versucht, Bilder zu machen, die die Kamera denken lassen? Sie könnten mit den Ergebnissen zufrieden sein und dann versuchen, sie basierend auf der "Expertenmeinung" der Kamera zu verbessern. Probieren schadet nicht :)
@ahockley: Ein weiterer Grund, nicht zu scannen, ist, dass es sehr lange dauert. Mit einer DSLR schaffe ich etwa 20 Seiten pro Minute auf einem Tisch, aber ein Scanner, der schnell einen Dokumenteneinzug verwendet und viel kostet.
Eigentlich bringt @josenunoferreira einen interessanten Punkt zur Sprache - ich erinnere mich an eine Point-and-Shoot-Kamera, die sogar einen bestimmten Modus nur für solche Dinge hatte. Es würde Seitenränder erkennen, Keystone-Korrektur durchführen (und/oder Sie warnen) und Bilder mit hohem Kontrast (sogar Schwarzweiß?) Erstellen, die wahrscheinlich perfekt für OCR sind. Wenn ich mich nur erinnern könnte, welche Kamera das war ... Samsung NV10, vielleicht?? Ich vergesse. Etwas, das ich nie besessen habe, nur einmal damit gespielt. Aber vielleicht hat deine Kamera einen solchen Modus, oder eine Kamera mit einem würde sich lohnen? Dann wieder ... diybookscanner.org/forum/viewtopic.php?f=1&t=663
@lindes Kauf einer bestimmten Kamera könnte etwas übertrieben sein: P auch: dpreview.com/news/1008/10081918canonpowershots95.asp#specs Ich sehe keinen Szenenmodus, der so aussieht. versuchen Sie es vollautomatisch, @jason, lassen Sie uns einige Ergebnisse sehen!
@josenunoferreira ja, ist es wahrscheinlich... aber man weiß ja nie... es war nur ein gedanke als ergänzung zu deinem kommentar. :) Aber ja, es gibt andere Software da draußen, die anscheinend gute Konvertierungen macht, also ist das wahrscheinlich Butter zu verwenden.

Antworten (8)

Wenn Ihre Kamera über einen Schwarz-Weiß-Modus verfügt, würde ich das versuchen, um Ihre Nachbearbeitungszeit zu verkürzen. Darüber hinaus funktionieren viele OCR-Programme, mit denen ich gearbeitet habe, in Schwarzweiß viel besser.

Sie sollten so parallel wie möglich zur Seite gehen, denn um das Verwackeln der Kamera beim Halten in der Hand zu reduzieren, benötigen Sie wahrscheinlich die größte Blende, um die Verschlusszeit zu maximieren. Der kleine Sensor Ihres s95 sollte Ihren DOF so weit erhöhen, dass ich die Blende so weit öffnen würde, wie Sie können.

In Anbetracht dessen, dass Sie dies nur durch OCR ausführen werden, drehen Sie Ihre ISO auf das, was Ihnen eine angemessene Belichtung mit minimalem Wackeln ermöglicht. Die OCR beschwert sich viel seltener über das zusätzliche Rauschen als über verschwommene Buchstaben.

Wenn Sie nur über Text sprechen, sollte der Weißabgleich für Ihre "Innen" -Einstellung für Ihre Kamera gelten - aber ehrlich gesagt, machen Sie sich darüber keine allzu großen Sorgen.

Ihre Megapixel sind möglicherweise nur dann von Bedeutung, wenn Ihr Dokumenttext unglaublich klein ist und Sie diese Detailebene klar auflösen müssen, aber ich würde vermuten, dass 6-7 für die meisten Dinge in Ordnung sind.

Sie meinen wahrscheinlich "senkrecht zur Seite". Wenn Sie parallel sind, wird es schwierig, den Text zu lesen. ;-)
@Craig Walker - er hat die Begriffe "parallel" zur Seite verwendet und ich habe verstanden, was er meinte, also habe ich nicht versucht, ihn zu verwirren. Ganz zu schweigen davon, dass der Sensor selbst parallel wäre, ebenso wie der Sucher. Es hängt nur davon ab, auf welchen Teil der Kamera Sie sich beziehen. Der Begriff war beabsichtigt.
Verwenden Sie so viele Megapixel wie möglich, die OCR-Dokumente sind das, was zählt, und sie sind relativ klein und solange die Quelle nur Text ist, ohnehin von der Kameraauflösung unbeeinflusst. Ich verwende Abbyy FineReader und es funktioniert besser bei Bildern mit höherer Auflösung (z. B. 21 MP statt 10 MP). Nehmen Sie also mit 10 MP auf.
fair genug.
+1 für S/W-Modus. RGB für die Textverarbeitung verschwendet Pixel.

Sie scheinen die Einstellungen bereits gut verstanden zu haben. Kamerawackeln wird die Lesbarkeit von Text mehr als alles andere ruinieren, also würde ich das zuerst optimieren. Wenn Sie kein Stativ verwenden können, stellen Sie sicher, dass Ihre Verschlusszeit mindestens 1 über Ihrer Brennweite liegt (35-mm-Äquivalent). Das Herauszoomen erleichtert dies. Verwenden Sie die Bildstabilisierung, wenn Sie eine haben.

Die Blende kann ziemlich weit eingestellt werden, stellen Sie nur sicher, dass Sie parallel zur Seite sind. Eine große Blende hilft bei der Verschlusszeit, auch hier ist Unschärfe aufgrund einer großen Blende nichts im Vergleich zu Unschärfe aufgrund von Kamerabewegungen!

ISO, was auch immer Sie brauchen, um eine gute Belichtung zu erhalten. Rauschen sollte die Lesbarkeit nicht beeinträchtigen, bis es wirklich schlimm wird.

Das Aufnehmen eines benutzerdefinierten Weißabgleichs basierend auf dem Papier selbst wäre vorzuziehen, aber die OCR-Software sollte in der Lage sein, mit einem cremefarbenen Hintergrund fertig zu werden.

  1. Ich nehme an, Sie konvertieren JPEGs in PDFs. Ich empfehle, das Maximum zu erfassen und ein Programm zum Verkleinern auf 6-7 MP zu verwenden, wobei das Schärfen nach dem Verkleinern und vor der Konvertierung in PDF angewendet wird.

  2. Zur Verdeutlichung benötigen Sie eine schmalere Blende für eine größere Schärfentiefe, was einer höheren Blendenzahl entspricht. (z. B. Sie wollen f/8 statt f/2). Versuchen Sie bei Text zur Lesbarkeit, die Kamera so senkrecht wie möglich zu halten, damit Sie sich keine Gedanken über die Schärfentiefe machen müssen. Es ist eine gute Idee, von weit geöffnet etwas abzublenden, um Aberrationen wie CA zu reduzieren, die Sie bei schwarz auf weißem Text sehen werden. Je näher Sie am Papier sind, desto geringer wird die Schärfentiefe.

  3. Dies wird wahrscheinlich die größte Auswirkung auf die Lesbarkeit haben, wenn Sie die Hand halten. Wenn Sie in der Hand halten, möchten Sie eine Verschlusszeit so wählen, dass sie kürzer als 1 / (äquivalente 35-mm-Brennweite) oder sogar schneller ist. Dies hängt davon ab, welche Zoomeinstellung Sie auf Ihrem P&S verwenden. Wenn Sie das breite Ende verwenden, können Sie mit längeren Verschlusszeiten davonkommen, es kann jedoch zu tonnenförmigen Verzerrungen kommen. Wenn Sie Textdokumente und keinen Computerbildschirm fotografieren, empfehle ich, einen Blitz auszuprobieren.

    Wenn möglich, stützen Sie das Dokument auf (mit Klebeband oder etwas Ähnlichem, damit es flach ist), damit Sie die Kamera auf etwas ablegen und eine so lange Verschlusszeit erzielen können, wie Sie möchten. Sie können auch einen Sitzsack oder kleine Gegenstände verwenden, um die Kamera auszurichten, während sie ruht. Außerdem können Sie Wasserflaschen-Stativadapter für ein P & S erhalten.

  4. Blende, Verschlusszeit und ISO bilden ein Belichtungsdreieck. Lesen Sie hier darüber . Je höher der ISO-Wert, desto enger die Blende und die kürzere Verschlusszeit, die Sie verwenden können, aber das Bild wird verrauschter. Ich empfehle einen niedrigen ISO-Wert (400 oder weniger) für ein P&S mit Text.

  5. Wählen Sie den Weißabgleich für Ihre Lichtsituation. Wenn Sie Leuchtstoff haben, verwenden Sie diesen. Wenn Sie Blitz verwenden, verwenden Sie den Blitz-Weißabgleich.

Ich denke nicht, dass f / 8 realistisch ist, um in Innenräumen mit der Hand zu fotografieren (es sei denn, Sie verwenden einen Blitz, Sie müssen zuerst die Bibliothek um Erlaubnis fragen). Außerdem wird f / 8 mit einem kleinen Sensor ablenken, der Schärfegewinn ist minimal im Vergleich zur erforderlichen Erhöhung der Verschlusszeit / ISO.
@ Matt f / 8 ist ein Beispiel, um zu zeigen, dass er eine höhere Zahl möchte, um die Schärfentiefe zu erhöhen (und andere Aberrationen wie CA zu reduzieren, die möglicherweise sichtbar sind). Ich habe ihm keine Richtlinien gegeben, da ich nicht sicher bin, wie viel Licht er hat. Ablenkung? Du meinst Beugung?
Ja, ich meinte Beugung - ich schreibe dies auf meinem Handy, das die lästige Angewohnheit hat, meine Wörter automatisch zu korrigieren, selbst wenn ich sie richtig schreibe. CA wird kein großes Problem sein (im Vergleich zu Kameraverwacklungen), ich denke, Sie sollten am besten von weit offen anhalten, wenn Licht ein großes Problem ist ...
Du liebst Technik nicht? Ja, ich würde sagen, eine Stufe von weit offen ist eine gute Richtlinie und stimme zu, dass das Wackeln der Kamera der springende Punkt wäre.
Das ist ein wirklich guter Vorschlag, mit maximalen MPs zu drehen und dann auf dem Computer herunterzusampeln. Ich kann mir vorstellen, dass Schärfen + zusätzlicher Kontrast zu viel schärferem Text führt, der leichter zu lesen ist.

Ich stimme den Vorschlägen zu, in der höchsten verfügbaren Auflösung zu fotografieren und im Computer zu verkleinern. Wählen Sie außerdem das JPEG mit der höchsten Qualität, das Sie von Ihrer Kamera erhalten können, oder nehmen Sie sogar RAW-Dateien auf, wenn Ihre Kamera dies zulässt, und konvertieren Sie sie in TIFF oder PNG. Die verlustbehaftete Komprimierung in JPEG kann Artefakte um die Tinte/Papier-Grenze herum erzeugen, die Ihre OCR-Software verwirren könnten.

Im Allgemeinen möchten Sie Einstellungen verwenden, mit denen Sie das schärfste Bild erhalten, das Sie erhalten können. Dinge wie Kontrast, Weißabgleich usw. können alle im Computer geändert werden. Tatsächlich könnte Ihnen das Erhöhen des Kontrasts mit dem Ebenenwerkzeug oder dem Kontrast-/Helligkeitswerkzeug in Photoshop oder GIMP sehr helfen.

Außerdem wird durch die Konvertierung in das Graustufenformat die Größe Ihrer Dateien erheblich reduziert. Und wenn Sie das tun und den Kontrast erhöhen, müssen Sie sich nicht wirklich um den Weißabgleich kümmern. Sie können mit dem Weißabgleich experimentieren, einige Einstellungen können jedoch einen besseren Kontrast erzeugen als andere (es hängt von Ihrer Beleuchtung ab).

Wenn Ihr Computer damit umgehen kann, nehmen Sie alle Anpassungen (Graustufen, Kontrast, Helligkeit) vor, bevor Sie die Größe verkleinern, und wenden Sie nach der Verkleinerung einen Schärfefilter auf das Bild an.

Ein paar Gedanken, die mir an anderer Stelle nicht aufgefallen sind, um die Mischung zu ergänzen:

  • Wenn Sie " heranzoomen " (mehr Tele ) fotografieren, werden Sie weiter von der Seite entfernt fotografieren, wodurch Sie ein konsistenteres Bild in Bezug auf die Textgröße erhalten (Wörter in einer Ecke sind näher an der gleiche Größe wie Wörter in der Mitte; bei Weitwinkel kann es diesbezüglich zu Verzerrungen kommen). Ich bin mir nicht sicher, was hier die "ideale" Einstellung ist, und es ist ein Kompromiss gegen die erforderlichen Verschlusszeiten, möglicherweise nur etwas, worüber man nachdenken muss.

  • Sie sollten " überbelichten " gegenüber dem, was Ihre Kamera wahrscheinlich standardmäßig für richtig hält (es sei denn, sie ist schlau genug zu erraten, dass es sich um Papier handelt - ich setze das in Anführungszeichen, weil Sie es nicht wirklich überbelichten möchten , einfach überbelichten, basierend auf dem Abmessen einer weißen Seite), da der Primärton (das Papier selbst) die Hauptsache ist, für die die Kamera zu belichten versucht, und wenn Sie das Papier als Mittelgrau belichten, haben Sie ein schlammiger Ausgangspunkt. Wenn Sie anderthalb bis zwei Blendenstufen "überbelichten" (gehen Sie einfach nicht so weit, dass Hervorhebungen abgeschnitten werden), sollte der Text immer noch schön und dunkel sein, aber das Papier wird schön und hell sein und Kontrasttrennungen erzeugen ( und damit OCR) einfacher.

  • Versuchen Sie, eine gleichmäßige Beleuchtung zu haben – wenn eine Ecke der Seite viel heller oder dunkler ist als eine andere, wird es schwieriger, die Dinge in das reine Schwarz und reine Weiß zu trennen, das Sie höchstwahrscheinlich für OCR-Zwecke wünschen.

  • Ein "Kopierständer" ist ideal für Projekte wie dieses, obwohl ich vermute, dass er über das hinausgeht, was Sie leicht in der Bibliothek haben könnten ... Abhängig von der Konfiguration Ihrer Bibliothek ist es jedoch möglich, dass irgendwo (vielleicht ein Regal darüber) vorhanden ist der Schreibtisch oder eine Stange, die Beleuchtung oder ähnliches hält?), dass Sie eine Superklemme mit einem Kugelkopf platzieren könnten ( hier ist eine , aber jede Superklemme mit einem entsprechend großen (je nach Kopf) "Bolzen" und einer Art Stativ Kopf tun würde), und Ihre Kamera wird dann über der Schreibtischoberfläche (oder was auch immer) montiert, so dass Sie eine konsistente Positionierung und Stabilität haben, falls Sie längere Belichtungen benötigen. Im Grunde würde dies einem Kopierständer für "arme Leute" gleichkommen.

    Sie können auch einen kurzen Selbstauslöser oder eine Fernbedienung verwenden (ich nehme an, Ihre Kamera hat einen 2-Sekunden-Selbstauslösermodus und vielleicht einen benutzerdefinierten, der noch kürzer sein könnte), um ein Verwackeln der Kamera durch Drücken der Taste zu vermeiden.

Das ist alles, woran ich im Moment denke. Hoffentlich ist das hilfreich.

Ich habe den gleichen Job wie du Landman Photo und mache das seit vielen Jahren. Die meisten Leute wissen nicht, wovon sie reden, vertrau mir!!!

  1. Die Kamera auf M oder manuell

  2. Iso 100-200, je höher die Nummer, desto heller, aber es wird mehr Körnung oder Rauschen im Bild angezeigt

  3. Verschlusszeit 1/100 bis 1/160 (normalerweise ist 1/125 am besten, je niedriger desto heller, aber Sie erhalten mehr Begräbnisse oder Wiederholungen)

  4. Blende oder f2.7 (warum brauchen Sie ein tiefes Sichtfeld, es ist eine flache Seite)

  5. Nehmen Sie in Farbe auf, 6 bis 10 Megapixel, sehen Sie sich Ihre Weißabgleicheinstellungen an, normalerweise fluoreszierend 1 oder 2, schalten Sie die meisten Glocken und Pfeifen aus, wenn Sie sich nicht sicher sind, schalten Sie sie aus

  6. belichte bilder auf comp mit acdc

Einige kleine Vorschläge, aber ich denke, Ihr Setup sieht gut aus

  1. Verwenden Sie ein Stativ. Dadurch werden Probleme mit Kameraverwacklungen beseitigt und Sie können so lange belichten, wie Sie benötigen.

  2. Vermeiden Sie Licht, das in einem Winkel direkt auf das Papier fällt, das direkt in die Linse reflektiert werden und ein Glanzlicht verursachen kann, wo Sie es nicht wollen. Dies bedeutet normalerweise, dass das Licht von den Seiten kommt.

  3. ISO: Als Faustregel gilt, dass man zu einem niedrigeren Wert tendieren sollte, aber ich bin mir sicher, dass jeder materielle Unterschied schnell offensichtlich wird.

Abgesehen davon fällt mir keine Verbesserungsmöglichkeit für dein Setup ein. Um ehrlich zu sein, denke ich, dass Sie es haben.

Können Sie ein gutes (und relativ preiswertes) Stativ empfehlen, das nützlich wäre, und mir erlauben, die Kamera umzudrehen, sodass sie parallel zu den Seiten zeigt, die ich fotografiere? Ich habe mir die Joby-Stative angesehen und sie sehen vielversprechend aus, aber ich habe gehört, dass sie sich oft verschieben, wenn Sie den Auslöser drücken.
@Jason, fairer Punkt. Ich habe eine Joby, die ich mag, aber um zu verhindern, dass sie sich bewegt, wenn Sie den Auslöser drücken, verwenden Sie einfach einen Fernauslöser oder den Selbstauslöser. Dies ist eigentlich ein guter Tipp, wenn Sie eine langsame Verschlusszeit verwenden. Die schlechte Nachricht ist, dass jedes Stativ, das schwer genug ist, um sehr stabil zu sein, nicht billig sein wird. Das tut mir leid! (Wenn du es anders herausfindest, lass es mich wissen!) ;)

Es hört sich so an, als hätten Sie die meisten Antworten bereits :-P Ich werde nur ein paar Kommentare zu Ihren Punkten hinzufügen:

  1. Auflösung: Sie haben Recht, Sie brauchen hier nicht viel Auflösung, besonders wenn Sie die Bilder nur auf dem Bildschirm betrachten. Ich würde es wahrscheinlich selbst auf das Doppelte der maximalen typischen Bildschirmauflösung begrenzen.

  2. Blende: Sie haben Recht, wenn Sie eine kleinere Blende auswählen, um ein wenig Spielraum für die Schärfentiefe zu erhalten. Allerdings wirst du wahrscheinlich nicht viel brauchen. Spielen Sie mit dem Schärfentiefenrechner für Ihre Brennweite, ermitteln Sie einen angemessenen DOF und wählen Sie dann die größtmögliche Blende. (Stellen Sie jedoch sicher, dass Sie ein oder zwei Stufen unter Ihrer maximalen Blende sind, um die beste Schärfe zu erzielen.) Sie möchten die größte Blende, damit Sie mehr Spielraum haben, um mit Verschluss und ISO zu spielen; siehe unten.

  3. Shutter: Offensichtlich möchten Sie dies so schnell wie möglich, um Verwacklungen zu reduzieren und gleichzeitig genügend Licht zu erhalten. Ich habe gehört, dass verschiedene Quellen "Verschlusszeit gleich Brennweite" behaupten, um Verwacklungen zu vermeiden. manche behaupten doppelt. Wenn Sie also ein 50-mm-Objektiv verwenden, versuchen Sie, die Verschlusszeit zwischen 1/50 und 1/100 zu halten. Sobald Sie das haben, versuchen Sie es mit der langsamsten Geschwindigkeit, um das Licht zu maximieren.

  4. ISO: Sie sollten in der Lage sein, dies ziemlich hoch zu steigern. Das Rauschen kann das Aussehen des Bildes beeinträchtigen, wird aber wahrscheinlich die Lesbarkeit nicht allzu sehr beeinträchtigen. Was „hoher ISO“ und „zu laut“ ist, hängt von Ihrer Kamera ab. Experiment. Dies ist wahrscheinlich der beste Weg, um bei schlechten Lichtverhältnissen die richtige Belichtung im Vergleich zu Blende und Verschluss zu erhalten.

  5. Weißabgleich: Für Sie sollte es nicht allzu wichtig sein. Wenn Ihr fotografiertes Papier cremefarben aussieht, spielt es eine Rolle? (Anders, wenn Sie natürlich Bücher mit Vollfarbbildern fotografieren). Wenn Sie es in der Post korrigieren möchten, haben Sie eine relativ einfache Zeit, da Sie viel neutral gefärbtes Papier haben, mit dem Sie arbeiten können. Ich würde Ihre Kamera wahrscheinlich auf dem automatischen Weißabgleich lassen und es vergessen.