Schlagwort-Archive: pdf

Umgang mit PDF Dokumenten

Viele Webseiten präsentieren Ihre Inhalte gleich in mehreren Versionen. Neben der eigentlichen HTML Version der Inhalte, gibt es häufig noch eine Druckversion und PDF Version der Inhalte. Dublicate Content in Reinform. Während die Druckversion eigentlich immer auf „nofollow“ oder gar „noindex“ gesetzt werden sollte, gibt es bei den PDFs und „nofollow“ häufig Diskussionen mit den Verantwortlichen.

Obwohl Google mit den verschiedensten Dateiformaten umgehen kann, sollten für die Präsentation von Inhalten im Internet immer HTML Dokumente bevorzugt werden. Zum Einen braucht der Nutzer nicht noch ein zusätzliches Program (z.B. Adobe Reader) zur Betrachtung der Information und zum Anderen ist die Zeitspanne  (Ladezeit) die vergeht, bis den Nutzern die Information zur Verfügung steht, wesentlich geringer.

Zugangsbeschränkung PDF

Inhalte im Web im PDF-Format enthalten eine klassische Zugangsbeschränkung. Damit meine ich, dass der Zugang zu den Inhalten beschränkt ist auf den Kreis der Internetnutzer, die auch einen PDF Reader (egal ob kostenlos oder nicht) installiert haben. Eine Hürde die der User eventuell überwinden muss, bis er an meine Inhalte gelangt.

Mit HTML (vorausgesetzt Browser Version und HTML Standard verstehen sich) passiert mir das in der Regel nicht. Den schließlich bewegt sich der User mit einem Browser durch das Netz und mit HTML präsentiere ich meine Inhalte in einer für den Browser verständlichen Sprache.

Zeitfaktor PDF

Der nächste entscheidende Faktor der gegen das PDF Format im Web spricht, ist die Ladezeit. Wenn man in den Suchergebnissen einen Eintrag im PDF-Format anklickt, dauert es immer länger bis einem die Inhalte zur Verfügung stehen, als bei HTML-Ergebnissen.Vorausgesetzt natürlich, der User besitzt einen PDF Reader. Und jeder weiß: Geduld gehört nicht zu den Tugenden von Webusern!

Google indes bietet für PDF Dokumente mittlerweile eine Schnellansicht innerhalb der SERPs, um das etwaige Fehlen eine Readers zu kompensieren. Das Ergebnis wird dem Nutzer dann in Google Text & Tabellen angezeigt. Das sieht dann in den Ergebnissen so aus:

Google SERPs mit der Schnellansicht von PDFsIch empfehle meinen Kunden Ihre Inhalte grundsätzlich als HTML-Dokument den Nutzern zur Verfügung zu stellen. Stehen dann die Inhalte einer URL den Nutzern zudem als PDF-Datei zur Verfügung, dann sollten die Links zu diesen Inhalten immer mit dem “nofollow”-Attribut ausgestattet werden.

So vermeiden Sie es, dass Google mehrfach denselben Inhalt crawlt und selbst entscheidet welche es dem Nutzer bei einer passenden Suchanfrage präsentiert.

Sollte ein Inhalt im PDF-Format wirklich so bedeutend sein, dann werden User es sicherlich verlinken und so findet dieser Inhalt auch seinen Weg in den Index.