Welche Wirkung haben Ligaturen im Web in Bezug auf SEO?

Alle Designer lieben Ligaturen, aber Vanilla-Web-Typografie ist einfach scheiße. Ich habe von Smartypants gehört , die viele dieser Probleme lösen und sexy Zitate, wunderschöne kaufmännische Und-Zeichen und alles bringen. Optisch einfach perfekt.

Aber ich mache mir Sorgen um SEO. Nehmen wir an, auf einer Webseite wird das Wort finallyzu finally. Sind Suchmaschinen in der Lage, dieses Wort zu indizieren und die Seite zurückzugeben, wenn nach finally(ohne Ligatur) gesucht wird?

Antworten (2)

Zusammenfassung

Wenn Ihr Server Seiten mit Ligaturen austeilt (wie Smartypants), sind Suchmaschinen inkonsistent. Bing indiziert die Ligaturen derzeit nicht richtig. Ich würde im Allgemeinen sagen, es bittet um Ärger. Da sich Suchmaschinen ändern, gibt es unten eine Methode, mit der Sie testen können, wie Suchmaschinen Sie an Indexligaturen interessieren .

Wenn Ihr Server Seiten mit normalem Text ausgibt, wandelt Javascript sie in Ligaturen um, das ist in Ordnung . Suchmaschinen wenden Javascript-Inhaltsänderungen nicht an, bevor Seiten indexiert werden (obwohl behauptet wird, dass es einige Ausnahmen wie das Laden von Facebook-Kommentaren gibt ). Da es eine branchenübliche Methode gibt, um Suchmaschinen dynamische Inhalte zu geben, und diese Methode von Google unterstützt wird , wäre es eine große Überraschung, wenn sich dies in Zukunft ändern würde. Google empfiehlt, Ihre Website mit einem Nur-Text-Browser zu durchsuchen (z. B. Lynx ), um Ihre Inhalte so zu sehen, wie eine Suchmaschine sie sieht.


Mehr Details zum ersten Fall (Seiten mit Ligaturen im Code aufgetischt) ...


In der Theorie

...das sollte einer gut aufgestellten Suchmaschine keinen Unterschied machen.

Zunächst hilft es, den Unterschied zwischen Glyphen und Zeichen zu verstehen . Eine Ligatur ist eine Glyphe, die für zwei Zeichen steht f i. Wie die Software damit umgeht, hängt von dieser Software ab und hängt vom Kontext und der jeweiligen Aufgabe ab. Sie werden anhand der Beispiele in dieser verknüpften Frage sehen, dass beim Kopieren und Einfügen von Glyphen das Eingefügte variiert: manchmal wird die Glyphe eingefügt, manchmal die Glyphe wird wie die ihr zugeordneten Zeichen behandelt und fund iwerden eingefügt.

Jeder gut gemachte automatische Textprozessor, der an Textsemantik interessiert ist (Suchmaschinen, Rechtschreibprüfung, Bildschirmleseprogramme ...) , sollte eine Glyphe als identisch mit den Zeichen behandeln , für die sie steht, und als identisch mit behandeln , da dies der Text ist Bedeutung der Glyphe.finallyfinally

In der Praxis

Nicht alles ist gut gemacht...

Hier ist eine einfache Möglichkeit, Suchmaschinen zu testen. Hier ist eine Textzeile aus dieser anderen Frage:

Copy the ligature fi from Illustrator to this input box

Wenn wir die Nicht-Ligaturen-Version dieses Satzes nehmen und in doppelten Anführungszeichen danach suchen:

(Suche weiter "Copy the ligature fi from Illustrator to this input box"):

  1. ... wenn eine Suchmaschine Ligatur-Glyphen als Übereinstimmungen für die Zeichen behandelt, die sie darstellen, findet sie diese Seite (und, wenn sie indiziert ist, diese).
  2. ... wenn eine Suchmaschine Ligatur-Glyphen als unterschiedlich zu den Zeichen behandelt, die sie darstellen, findet sie nichts, bis diese Seite indiziert ist, dann findet sie nur diese Seite, und Suchen mit der Ligatur-Version finden diese Seite.
  3. ...wenn eine Suchmaschine beim Anblick von Glyphen wie Ligaturen komplett ausrastet, findet sie nichts, nicht einmal diese Seite, und Suchen mit der Ligatur-Version werden auch nichts finden

Einige schnelle Ergebnisse für die 5 besten Suchmaschinen der Welt (Links führen zu Suchergebnissen):

  • Google: Gut (Typ 1) . (Trotz des Kommentars unten kommt es sowohl mit Unicode- als auch mit HTML-Entity-Formatierung zurecht)
  • Bing: Fehler ( Typ 2 ).
  • Yahoo: Fail ( Typ 2 ) (es stellt sich heraus, dass Yahoo „Powered by Bing“ ist)
  • Yandex (Russisch): Gut (Typ 1)
  • Baidu (Chinesisch): ähm, es scheinen überhaupt keine Seiten von graphicdesign.stackexchange.com in Baidu-Suchen zu erscheinen ... vielleicht sind wir dort verboten ...?!
Nein, ich habe gerade meine Antwort bearbeitet, sehen Sie sich den Quellcode unter diesem Link an. Es ist alles Unicode wie ff die der Algorithmus von Google ignoriert.
Tatsächlich stimmt Google mit diesen überein: Sehen Sie sich an, was hier (Ligaturen) und hier (Klartext) hervorgehoben wird - beide stimmen mit beiden überein. Aber ich stimme Ihrem Rat zu ...
... (diese URLs waren riesig, brauchen 2 Kommentare), es scheint, als würde es Ärger einladen. Wenn Bing keine Ligaturen abgleicht, werden andere wichtige Dienste dies auch nicht tun.
Sehen Sie sich die URL des ersten Links und den zugehörigen Quellcode an: Sie werden sehen, dass Google (derzeit ...) keine Probleme mit der Unicode-Formatierung hat und Unicode-Ligaturen, HTML-Entity-Ligaturen und reguläre separate Zeichenpaare indiziert wie f ials gleichwertig ohne Probleme. Google scheint gut zurechtzukommen - aber die Inkonsistenz zwischen verschiedenen Suchmaschinen ist (zumindest meiner Meinung nach) ein Dealbreaker.

Basierend auf dem einen Live-Beispiel, das ich gesehen habe, wäre ich sehr besorgt über eine umfassende Nutzung, da dies die SEO beeinträchtigen wird. Die Sonderzeichen werden als Unicode geparst, sodass der Algorithmus von Google sie nicht lesen kann. Es sollte für sparsame Verwendungen in Ordnung sein, aber ich würde nicht verrückt damit werden oder es für etwas Wichtiges wie einen Titel verwenden.

Hier ist der Link zu dem Live-Beispiel, das ich mir angesehen habe: http://pages.cs.wisc.edu/~wolfson/ligatures.html

Ich glaube nicht, dass es diese Buchstaben im Quellcode sein werden. Sieht so aus, als wäre Smartypants eine serverseitige Sache, die Eingaben parst und die Glyphen in den in der Datenbank gespeicherten Text und damit auch den Quellcode speichert. Trotzdem denke ich, dass es für SEO sowieso in Ordnung sein wird.
Ah, eigentlich habe ich das Element inspiziert, aber die Quelle nicht wirklich angesehen. Ich werde meine Antwort bearbeiten.
Ich stimme "extrem besorgt" definitiv zu, die Unicode-Unterstützung ist notorisch inkonsistent. Aber für die Aufzeichnung kann Google (derzeit ...) Unicode indizieren und stimmt (derzeit ...) mit diesen Unicode-Ligaturen auf dieser Seite mit Suchen nach l i f iusw. überein (sehen Sie, wie sie in der Vorschau fett gedruckt werden). Aber darauf würde ich mich definitiv nicht verlassen wollen ...
Was wäre, wenn Ligaturen über Javascript platziert würden? Es würde das HTML-Dokument nicht ändern und wäre daher für Suchmaschinen völlig unsichtbar? Wäre das eine Lösung?
Ja, das sollte in Ordnung sein - Suchmaschinen indizieren normalerweise das Originaldokument, ohne Javascript anzuwenden. Sie möchten wahrscheinlich überprüfen, ob dies die Ladezeit der Seite nicht wesentlich verlangsamt und dass es keinen störenden Ruck für den Betrachter gibt, wenn die Vanilla-Zeichen während des Ladens der Seite durch die Ligaturen ersetzt werden.