Automatisierter Fotoscanner im industriellen Maßstab?

Ich suche nach einer Methode, um über 6 Millionen Bilder für ein riesiges digitales Archiv zu scannen (Konvertierung von allen möglichen Größen in ein dpi/Auflösung). Offensichtlich machen die damit verbundenen Arbeitsstunden dies zu einem großen Unterfangen, und ich frage mich, ob es so etwas wie einen automatisierten Scanner im industriellen Maßstab gibt, dh Sie stapeln einen Stapel Fotos auf einer Maschine und scannen sie auf die Festplatte, bis sie fertig sind , muss nur ab und zu neu geladen werden.

Ist jemandem so etwas schon mal begegnet?

AKTUALISIEREN

Um aufgekommene Fragen zu beantworten: Es wird kein Papier verwendet, dies ist nur ein Foto zur Ablage. Auflösung: max. 600 dpi, Farbscans. Nichts zu Großes, ich vermute, es wären nicht viel mehr als 20-50.000 $ für das System verfügbar.

Vielleicht war ich etwas voreilig, dies aus Pat Farrells Antwort abzuleiten, da Ihre Frage dies nicht so offensichtlich macht, also - Sind die Bilder bereits digital, müssen aber nur konvertiert werden, oder existieren sie nur als Ausdruck? Im ersten Fall sollten Sie einen Blick auf thedailywtf.com/Articles/Web_0_0x2e_1.aspx werfen ...
Ich verstehe nicht, wo man bei dieser Frage auf die Idee kommt, dass die Bilder bereits in digitaler Form vorliegen.
Wenn kein Papier vorhanden ist, was werden Sie "scannen"? Ich denke, Sie verwenden hier eine nicht standardisierte Terminologie. Wenn Sie für Ihr Budget keine Software (wie ImageMagick) finden können, können Sie es nicht tun. 833 Arbeitsstunden werden Ihr Budget sprengen, ohne die 32K-Maschine.
@Pat — Die Fotos sind auf Fotopapier. Es besteht keine Absicht, auf einem Zwischenpapier zu scannen und erneut zu drucken, wie Sie in Ihrer Antwort vorschlagen. In der ursprünglichen Frage, die ich sehen kann, gibt es jedoch überhaupt keinen Hinweis darauf. Ist es die Zeile "Konvertierung aus allen Größen", die Sie verwirrt? Physische Fotos gibt es in mehreren Größen.
Nein, sein "riesiges digitales Archiv", das anzeigt, dass sie sich auf der Festplatte befinden. Realistisch gesehen ist dies innerhalb seines Budgets unmöglich, wenn @alex wirklich bedeutet, jedes der 6 Millionen Fotos auf einen Scanner zu legen. Die aktuellen Budgetzahlen für das Scannen in großem Maßstab liegen bei etwa zehn Cent pro Blatt Papier. Somit sind 600.000 $ ein Budget, nicht 20.000.
Es ist „ für ein riesiges digitales Archiv“. Nicht von . Es tut mir leid, aber ich kann wirklich nicht verstehen, wie das zweideutig sein soll.
Was bedauerlich ist, weil es von Ihrem berechtigten Standpunkt zu Preis und Umfang ablenkt.
Wow, richtig @matt, ich habe es falsch verstanden. Ich halte das immer noch für unmöglich. Benötigt eine Klärung von Alex, warum er erwartet, dass dies funktioniert.
@Pat Das sieht im Nachhinein alles sehr mürrisch von mir aus. Ich weiß nicht, ich habe hier einen schlechten Tag oder so. Es tut uns leid!
Für alle, die in Zukunft tatsächlich versuchen, bereits digitale Bilder per Drucken in erneutes Scannen umzuwandeln (@Pat und ich haben die Frage versehentlich so verstanden, dass dies impliziert wird), verwenden Sie bitte stattdessen ein digitales Tool
Ich bin sicher, die NSA könnte dir dabei helfen... ;-)
Hmm... auf den zweiten Blick, vielleicht bist du die NSA! ;-)

Antworten (3)

In Ihrer Frage fehlen einige wichtige Details:

  • Welche Auflösung benötigen Sie?

  • Farbe oder schwarz-weiß?

  • Muss der Scanner in der Lage sein, verschiedene Größen gleichzeitig zu verarbeiten, oder können Sie sie im Voraus sortieren, sodass alle Fotos in einem bestimmten Stapel gleich sind? (Einzelblattzuführungen funktionieren in der Regel am besten, wenn die Blätter ungefähr die gleiche Größe haben.)

Es gibt viele leistungsstarke Scanner mit automatischem Einzug, die in Schwarzweiß oder Farbe mit bis zu 600 dpi und 75, 100 oder sogar 120 Seiten/Minute scannen können. Hier ist zum Beispiel einer. Wenn Ihr Projekt in die Parameter dessen passt, was sie tun können, spielt es keine Rolle, ob sie als "Dokumentenscanner" oder "Fotoscanner" bezeichnet werden.

Wenn Sie planen, 6 Millionen Fotos zu scannen, werden Sie sie irgendwie katalogisieren wollen. Wenn die Fotos gerade in irgendeiner Reihenfolge sind, kann es ausreichen, die Reihenfolge beim Scannen beizubehalten und jedem eine Seriennummer zu geben, damit Sie es später wiederfinden. Wenn andererseits andere Metadaten involviert sind, müssen Sie einen Weg finden, diese Daten an das richtige Foto anzuhängen. Es kann schwierig sein, einen effizienten Arbeitsablauf zu finden, der Fehler minimiert und es Ihnen ermöglicht, genügend Fotos zu scannen, damit Sie in angemessener Zeit fertig sind. (Ich habe einmal an einem Projekt gearbeitet, bei dem Zehntausende von Seiten gescannt wurden, und das Workflow-Problem war wahrscheinlich schwieriger als jedes technische Problem.)

Dieser kostet nur 32.000 US-Dollar und ist für bis zu 120 Seiten/Minute ausgelegt. Das bedeutet nicht, dass tatsächlich 120 echte Seiten pro Minute oder 240 in zwei Minuten oder 360 in drei Minuten gescannt werden. Theoretisch könnten es 7200 pro Stunde sein. Wird nie passieren. Aber wenn es könnte, würde es immer noch 833 Stunden dauern. Das ist fast ein halbes Jahr bei 8 Stunden am Tag. @caleb hat Recht, Workflow, Papiermanagement und alle möglichen anderen Dinge sind viel größer als das Scannen.
Es gibt viel billigere (sagen wir 7000 $) Geräte mit etwas niedrigeren Scanraten (60 oder 75 ppm). Und das Scannen mit niedrigeren Auflösungen ermöglicht normalerweise schnellere Geschwindigkeiten. Sie können die Scanrate jederzeit erhöhen, indem Sie weitere Scanner hinzufügen. Andererseits müssen Sie einen Ort haben, an dem Sie all diese Daten speichern können, eine Möglichkeit, sie zu sichern, und eine Möglichkeit, die gewünschte später zu finden.
Ich wäre sehr vorsichtig mit dem Scannen von Fotos in normalen Dokumentenscannern. Ich habe einen Dokumentenscanner und er ist perfekt für Dokumente geeignet - Fujitsu ScanSnap s1500, aber einige Leute haben Markierungen auf Fotos erwähnt, die sie durch den Scanner liefen. Angesichts der Funktionsweise kann ich mir das leicht vorstellen (ich habe keine Fotos ausprobiert, sondern nur dünnes Papier). Sofern ein Scanner nicht zum Scannen von Fotos gedacht ist, würde ich vorsichtig sein, ihn für die Aufgabe zu verwenden (es sei denn, der Druck ist wegwerfbar - oder Sie verwenden eine transparente Trägerfolie).
@DetlevCM Das ist ein sehr wichtiger Punkt! Als ich zu Hause einige Fotos gescannt habe, war das Ergebnis nicht besonders zufriedenstellend - ich denke, es liegt an einer Oberflächenstruktur, die den fotoähnlichen Oberflächeneffekt erzeugen soll. #Alex Ich schlage vor, bevor Sie etwas kaufen, das mehrere Ziffern wert ist, bitten Sie den Verkäufer, Ihnen zu zeigen, wie eine Mustercharge in Bezug auf Zeit und Qualität auf Fotos abschneidet.
Nur damit Sie die Mathematik kennen: Selbst bei einem Scanner mit 120 Seiten/min und unter der Annahme eines fehlerfreien Fortschritts, während er rund um die Uhr läuft, dauert es immer noch mindestens einen ganzen Monat. Und es wird höchstwahrscheinlich Fehler und Staus geben. Also sollte @Alex erwägen, a) mehrere Scanner zu beschaffen oder b) dies an 10-100 andere auszulagern, damit es eine realistische Chance gibt, dass dies wirklich innerhalb von ein oder zwei Monaten erledigt wird
@TobiasKienzler Möglicherweise lesen Sie zu viel in die Frage hinein. Ich glaube nicht, dass der OP etwas über einen Zeitplan gesagt hat. Er oder sie hat möglicherweise einen Monat oder ein Jahr oder länger Zeit, um die Aufgabe zu erledigen, und der Aufwand und die Ausrüstung müssen offensichtlich so skaliert werden, dass sie den jeweiligen Anforderungen entsprechen. Eine größere Frage ist das Budget: Wie viele Hochgeschwindigkeitsscanner mit hoher Kapazität werden Sie beim Scannen von 6 Millionen Dokumenten verschleißen, wie viel kostet es, sie zu betreiben und zu warten, und reichen 20.000 bis 50.000 US-Dollar aus, um das zu decken? Das muss der OP selbst ausrechnen.
@Caleb Stimmt, bevor man einen Zeitplan in Betracht zieht, muss die Machbarkeit aufgrund des Budgets bewertet werden ...

Lassen Sie mich zuerst Ihre direkte Frage beantworten:

Die Document Imaging-Leute machen das schon seit Ewigkeiten. Sie werden normalerweise für große Bildscanprojekte verwendet, wie die Verarbeitung von Formularen zur US-Volkszählung. Ich habe noch nie einen für Fotos gesehen, aber das ist wirklich nur ein Unterschied in der Pixeldichte - alles andere wäre gleich.

Diese sind wahnsinnig teuer in der Anschaffung und ein königlicher Schmerz im Hintern, um am Laufen zu bleiben. Das große Problem ist die Papierhandhabung. Papier neigt dazu, zusammenzukleben, wenn es zu nass, zu trocken oder zu zerknittert ist.

Ihre Idee, einen großen Stapel in einen Trichter zu laden, einen Knopf zu drücken und in einer Stunde wiederzukommen, um sie alle verarbeitet zu sehen, ist ein Traum. Passiert nie. Papierstaus gehören zum Alltag.

Aber Sie scheinen anzudeuten, dass der Ausgangspunkt digital und nicht auf Papier ist. Warum um alles in der Welt wollen Sie Papier in der Mitte haben? Besorgen Sie sich einfach eine Software zum Konvertieren von jedem Format, das Sie haben, in das, was Sie wollen. Die Software ist einfach und unkompliziert. Das Papierhandling ist eine wirklich große Sache.

Außerdem sind die kommerziellen Scanner, wie wir sie für die Volkszählung verwendet haben, sehr teuer, da sie sechs- und siebenstellig sind, um einen zu kaufen. Fügen Sie dann geschulte Bediener, Wartung usw. hinzu.

+1 - Sie sollten jedoch mehr Wert auf den Wahnsinn legen, 6 MILLIONEN (!) Bilder auszudrucken, nur um sie erneut zu scannen
?? Es sind Fotos, die er scannen muss, er muss sie nicht ausdrucken, sie sind bereits gedruckt.
Jetzt, da wir die Frage bearbeitet haben, verstehe ich es besser. Aber ich bezweifle immer noch, dass der Umfang davon angemessen ist. Das Scannen von 6 Millionen Fotos wird Jahre dauern.

Warten Sie, Sie sagen, Ihre Bilder sind bereits digital, aber nur in der falschen Auflösung? In diesem Fall sollten Sie den Druck-zu-Erneut-Scan-Teil wirklich überspringen und direkt zB ImageMagicks Konvertierung verwenden, die alle Bilder ganz einfach stapelweise in die gewünschte Auflösung konvertieren kann.

Angenommen, Sie verwenden Linux und alle Bilder befinden sich in einem Verzeichnis original(einschließlich Unterverzeichnissen), gehen Sie so vor, um alles in 300 dpi zu konvertieren:

cd original
mkdir ../converted
find -type f -exec sh -c '
  convert -units PixelsPerInch $0 -density 300 ../converted/$0
' {} ';'

(Das PixelsPerInchist laut dieser unix.SE-Antwort erforderlich , der find -exec shTrick liegt an dieser Antwort und verwaltet auch Leerzeichen in Dateinamen.) Testen Sie es jedoch zuerst an einer kleinen Teilmenge, um zu sehen, ob es wie beabsichtigt funktioniert.

Wie auch immer, das spart Ihnen ungefähr 99,9999% der Zeit, des Geldes, des Papiers und des Gehirns, die sonst verschwendet werden ;-)

Ich gehe davon aus, dass das OP Bilder in verschiedenen Formaten hat, aber diesen Ansatz habe ich gesagt, selbst wenn Sie eine benutzerdefinierte Konvertierungssoftware schreiben müssen, ist es weitaus besser als jeder Scanplan, dies als Ziffern zu tun. Meine Schätzung ist, dass Ihr 99,999% schneller konservativ ist und es wird sogar noch viel schneller sein.
Das OP sagt nichts über "Bilder in verschiedenen Formaten", sondern nur Fotos in allen möglichen Größen.
@mattdm Ich habe die Frage gelesen, dann Pats Antwort und mein Unterbewusstsein erinnerte sich nur an den Teil "riesiges digitales Archiv" in der Frage anstelle von " für ein riesiges digitales Archiv" - deshalb habe ich die Frage nach dem Posten noch einmal gelesen und danach gefragt Klärung . Ich werde die Antwort hier lassen, nur für den Fall, dass jemand anderes tatsächlich versucht, was Pat und ich zuerst für die Absicht hielten