Vorschau kopiert Aliens. Wie ändere ich die Kodierung/mache es zum Laufen?

Vorschau kopiert Aliens! Buchstäblich. Hier ist ein Screenshot:

Bildschirmfoto

Der im PDF ausgewählte Text wurde aus der Vorschau in TextEdit kopiert (Cmd+C) und eingefügt (Cmd+V). Was habe ich bekommen? Ein Haufen Aliens.

Ich vermute, dass dies ein Codierungsproblem ist. Gibt es eine Möglichkeit, die Codierung in der Vorschau oder so zu ändern? Gibt es eine Möglichkeit, zu überprüfen, welche Kodierung verwendet wird, und dann die entsprechende in TextEdit auszuwählen? Hier ist der Text, nur damit Sie die Quadrate selbst sehen können (Keine Aliens, anscheinend erscheint dieses Fehlerzeichen nur in nativen OSX-Apps und nicht in Browsern).

􏰀􏰒􏰖􏰓􏰎􏰤􏰣􏰠􏰄 􏰔􏰘􏰐􏰗􏰄 􏰡􏰙􏰥􏰛􏰛􏰐􏰑􏰄 􏰒􏰤􏰄 􏰥􏰖􏰑􏰄 􏰛􏰔􏰥􏰤􏰐􏰄 􏰢􏰙􏰎􏰑􏰣􏰐􏰄 􏰎􏰤􏰄 􏰔􏰘􏰐􏰄 􏰛 􏰛 􏰘􏰒􏰜􏰐􏰄 􏰥􏰝􏰄 􏰒 􏰡􏰙􏰐􏰛􏰡􏰐􏰤􏰔􏰄􏰏􏰥􏰥􏰤􏰠􏰄􏰞􏰘􏰎􏰡􏰘􏰄􏰖􏰥􏰥􏰓􏰐􏰑􏰄􏰔􏰥􏰄􏰢􏰐􏰄􏰎􏰤􏰄􏰢􏰒􏰑􏰄 􏰡􏰙􏰐􏰛􏰡􏰐􏰤􏰔􏰄􏰏􏰥􏰥􏰤􏰠􏰄􏰞􏰘􏰎􏰡􏰘􏰄􏰖􏰥􏰥􏰓􏰐􏰑􏰄􏰔􏰥􏰄􏰢􏰐􏰄􏰎􏰤􏰄􏰢􏰒􏰑􏰄 􏰙􏰐􏰜􏰒􏰎􏰙􏰠􏰄􏰒􏰤􏰑􏰄􏰛􏰓􏰎􏰙􏰔􏰐􏰑􏰄􏰒􏰖􏰥􏰤􏰣 􏰔􏰘􏰐􏰄􏰢􏰒􏰤􏰓􏰄􏰞􏰘􏰐􏰙􏰐􏰄􏰞􏰎􏰖􏰖􏰥􏰞􏰄􏰔􏰙􏰐 ˆˆˆˆˆˆˆˆˆˆˆːəɪɪɪɪɪɪɪɪɪɪɪɪ

Außerirdischer

(Ich muss zugeben, dass der Fehlercharakter von OSX ziemlich amüsant ist).

Kannst du das PDF zur Verfügung stellen?
Sicher. Es war ein E-Book, das ich auf der folgenden Website in PDF konvertiert habe: ebook.online-convert.com/convert-to-pdf . Hier ist das pdf: d.pr/f/vlaf .
Vielleicht ist es eine Art Urheberrechtsimplementierung von Apple ...? (Hoffentlich nicht)
Das PDF ist wahrscheinlich geschützt.

Antworten (2)

Die PDF-Datei wurde geschützt. Sie können keinen Text daraus kopieren und einfügen. Ebene 16 wird angezeigt, wenn sich ein Zeichen im „privaten“ Bereich der Unicode-Spezifikation befindet. Dies wurde absichtlich getan, um Sie am Kopieren und Einfügen zu hindern.

Außerdem ist dies nicht das Fehlerzeichen von OS X. Es erscheint nur, wenn es im privaten Bereich der Unicode-Spezifikation auf etwas stößt.

Eine PDF-Datei enthält optional eine Zuordnung zum privaten Unicode-Bereich für jedes Zeichen in der Schriftart. Dieses spezielle PDF enthält eine solche Karte, sodass die richtigen Glyphen nur in einem PDF-Reader angezeigt werden.

Einfaches Englisch: Die PDF-Datei ist voller Zeichen, die verschiedenen Stellen im privaten Bereich von Unicode zugeordnet sind. Normalerweise würde es nur Plane 16 anzeigen, aber da die PDF-Datei eine Karte enthält, die die Zeichen des privaten Bereichs in lesbare lateinische Glyphen (a, b, R, F usw.) übersetzt, sehen Sie Wörter im PDF, aber Aliens an anderen Stellen .

Jetzt macht die "Private Nutzung" des Charakters Sinn ... Danke! Ich schätze, ich muss alle Anführungszeichen von Hand kopieren. Wenn es nicht zu sehr stört, würde ich mich über eine kurze technische Erklärung freuen, um meine Neugier zu stillen, jetzt, wo Sie es erwähnen.
Wo speichert das pdf diese Zuordnung oder wie heißt sie? Es scheint, dass das Extrahieren einer beliebigen Seite aus einem PDF mit Preview.app zu einer Textkonvertierung führt, und viele PDF-Tools suchen nicht nach dieser Karte, um eine Textkonvertierung durchzuführen.

Ich hatte ein halb chinesisches, halb englisches PDF, das auch Aliens kopierte (allerdings ein anderer Alien). Früher hat es gut kopiert, bis ich einige Anmerkungen in Preview.app hinzugefügt habe (einige Hervorhebungen und Text). Ich kehrte zur vorherigen Version zurück und es kopiert jetzt wieder einwandfrei. Etwas zu bedenken.

Du hast absolut recht!! Genau das ist bei meinem auch passiert!! Danke, dass du das herausgefunden hast!!