Archiv der Kategorie: PageRank Sculpting

Umgang mit PDF Dokumenten

Viele Webseiten präsentieren Ihre Inhalte gleich in mehreren Versionen. Neben der eigentlichen HTML Version der Inhalte, gibt es häufig noch eine Druckversion und PDF Version der Inhalte. Dublicate Content in Reinform. Während die Druckversion eigentlich immer auf „nofollow“ oder gar „noindex“ gesetzt werden sollte, gibt es bei den PDFs und „nofollow“ häufig Diskussionen mit den Verantwortlichen.

Obwohl Google mit den verschiedensten Dateiformaten umgehen kann, sollten für die Präsentation von Inhalten im Internet immer HTML Dokumente bevorzugt werden. Zum Einen braucht der Nutzer nicht noch ein zusätzliches Program (z.B. Adobe Reader) zur Betrachtung der Information und zum Anderen ist die Zeitspanne  (Ladezeit) die vergeht, bis den Nutzern die Information zur Verfügung steht, wesentlich geringer.

Zugangsbeschränkung PDF

Inhalte im Web im PDF-Format enthalten eine klassische Zugangsbeschränkung. Damit meine ich, dass der Zugang zu den Inhalten beschränkt ist auf den Kreis der Internetnutzer, die auch einen PDF Reader (egal ob kostenlos oder nicht) installiert haben. Eine Hürde die der User eventuell überwinden muss, bis er an meine Inhalte gelangt.

Mit HTML (vorausgesetzt Browser Version und HTML Standard verstehen sich) passiert mir das in der Regel nicht. Den schließlich bewegt sich der User mit einem Browser durch das Netz und mit HTML präsentiere ich meine Inhalte in einer für den Browser verständlichen Sprache.

Zeitfaktor PDF

Der nächste entscheidende Faktor der gegen das PDF Format im Web spricht, ist die Ladezeit. Wenn man in den Suchergebnissen einen Eintrag im PDF-Format anklickt, dauert es immer länger bis einem die Inhalte zur Verfügung stehen, als bei HTML-Ergebnissen.Vorausgesetzt natürlich, der User besitzt einen PDF Reader. Und jeder weiß: Geduld gehört nicht zu den Tugenden von Webusern!

Google indes bietet für PDF Dokumente mittlerweile eine Schnellansicht innerhalb der SERPs, um das etwaige Fehlen eine Readers zu kompensieren. Das Ergebnis wird dem Nutzer dann in Google Text & Tabellen angezeigt. Das sieht dann in den Ergebnissen so aus:

Google SERPs mit der Schnellansicht von PDFsIch empfehle meinen Kunden Ihre Inhalte grundsätzlich als HTML-Dokument den Nutzern zur Verfügung zu stellen. Stehen dann die Inhalte einer URL den Nutzern zudem als PDF-Datei zur Verfügung, dann sollten die Links zu diesen Inhalten immer mit dem “nofollow”-Attribut ausgestattet werden.

So vermeiden Sie es, dass Google mehrfach denselben Inhalt crawlt und selbst entscheidet welche es dem Nutzer bei einer passenden Suchanfrage präsentiert.

Sollte ein Inhalt im PDF-Format wirklich so bedeutend sein, dann werden User es sicherlich verlinken und so findet dieser Inhalt auch seinen Weg in den Index.

Mein Reden

Ich muss ehrlich gestehen, dass ich dem Thema „PageRank sculpting“ (das gezielte Steuern des PageRank-Fließverhaltens auf der eigenen Webseite) immer schon skeptisch gegenüber stand.

An internen Links hatte das nofollow-Attribut meiner Meinung nach nichts zu suchen!

Wieso sind AGB’s oder das Impressum nicht PageRank würdig?

In diesem aktuellen Interview auf dem Google Webmaster Channel auf YouTube äußert sich Matt Cutts wie folgt:

„I would not use nofollow on internal Links“ und am Ende wird er sogar deutlicher und sagt: „(…) but I wouldn’t use nofollow, because I think that does more harm that good.“

Konkret: Vergeßt PageRank Sculpting! Der Aufwand ist das Resultat nicht Wert. Zumal die Wertigkeit des PageRank durch die Gesamtzahl der ausgehenden Links geteilt wird. Unabhängig davon, ob Links das nofollow-Attribut tragen oder nicht.

Matt empfiehlt eher die Seitenarchitektur zu verändern und so auf das Fließverhalten des PageRanks einzuwirken. Da bedeutet: Weniger ausgehende Links und alles was gesetzlich nicht „mit einem Klick von der Startseite erreicht werden muss“ bündeln auf Unterseiten.