Mit Canonical URLs doppelte Inhalte vermeiden
Die Bedeutung rund um das Problem doppelter Inhalte (Duplicate Content) ist nach wie vor aktuell. Für Webmaster gibt es einige gängige Methoden, um selbstverursachten Duplicate Content auf dem eigenen Webauftritt zu vermeiden; doch immer wieder trifft man auf Websites, auf denen wichtigste Grundeinstellungen diesbezüglich fehlen, wie zum Beispiel die .htaccess, die robots.txt oder auch der seit einigen Monaten verwendete Canonical URL Tag.
Duplicate Content, der durch unerlaubtes Kopieren von urheberrechtlich geschützten Inhalten entsteht, dürfte den meisten ein Begriff sein. Die Konsequenzen sind teilweise drastisch und führen von Nichtindizierung entsprechender Seiten in den Suchmaschinen bis zu Abstrafen, über die jedoch auch in der SEO-Szene kaum Klarheit herrscht. Dass doppelte Inhalte jedoch vermieden werden sollten, darüber sind sich alle einig; und das gilt auch für selbst verschuldeten Duplicate Content, auch wenn dieser unabsichtlich erzeugt wurde.
Einer der ersten Schritte, um doppelte Inhalte zu vermeiden, stellt die Erstellung einer .htaccess Datei dar: hier wird zum Beispiel fest gelegt, ob die Website unter der „www-Variante“ firmieren soll oder nicht. Konkret: Bevorzuge ich http://www.meine-website.de oder doch eher nur http:meine-website.de? Erstere Variante ist ratsamer, da tendenziell eher auf diese verlinkt wird. Um für seine Website eine eindeutige URL (man könnte auch sagen: eine normierte URL) zu generieren, bietet sich eine 301-Umleitung in der .htaccess an; 302er sind hier suboptimal und unbedingt zu vermeiden.
Mit einem solchen 301-redirect werden in der Regel auch ganze Domains umgeleitet, um zu verhindern, dass unter zwei oder mehr verschiedenen URLs Webinhalte gleich mehrfach auftreten und indiziert werden. Für einzelne Unterseiten und Unterordner bietet sich entweder der Ausschluss per robots.txt an oder aber die Verwendung des etwas neueren Canonical URL Tags. Dies ist eine elegante Lösung, um für Suchmaschinen klar zu bestimmen, welche URL die „dominante“ ist. Das kann zum Beispiel wichtig werden, wenn verschiedene dynamisch erzeugte Adressen auftreten und deshalb nicht ganz klar ist, welche davon nun die ursprüngliche ist.
Dieser Metatag gestaltet sich etwa folgendermaßen: <link rel=„canonical“ href=„http://www.meine-website.de/unterseite.htm“ />. Damit wird für Google & Co. eindeutig festgelegt, dass Hybride wie http://www.meine-website.de/unterseite.htm?sid=asdf123456789 nicht die Autorität besitzen. Dieser Canonical URL Tag wird einfach im <head> Bereich hinzugefügt; für WordPress Blogs gibt es dafür eigene Plug-Ins wie zum Beispiel dieses hier. Doch auch mit dem All In One Seo Pack lässt sich dieser Meta-Tag erzeugen. Er stellt eine sinnvolle Ergänzung da, um Duplicate Content den Kampf anzusagen und seinen Webauftritt weiter zu optimieren.
Crazy Girl
3. Oktober 2009 (8:54)
Ich persönlich bin nicht so sehr der Fan von automatisiert generierter canonical URL. Die wird ja meist für jede Seite generiert und damit auch für die typischen double content Seiten. Beispiel: die /comment-page‑x/ Seiten, die WordPress bei Aktivierung der Aufteilung von Kommentaren ab Zahl x auf mehreren Seiten, generiert. Mit einigen Updates schaltet sich diese Aktivierung automatisch ein, der Webmaster bekommt davon nicht viel mit.
Es kommt sicherlich darauf an, wie geschickt das entsprechende Plugin programmiert wurde und wie viel SEO Hirn in der Denkweise dessen steckt. Was wirklich Gutes ist mir diesbezüglich noch nicht untergekommen 😉
admin
5. Oktober 2009 (20:53)
@Crazy Girl
Würde es da nach Hans Jonas halten: „Das Prinzip Verantwortung.“
Canonical URLs sind nicht nur für WordPress-Systeme eine gute Lösung, sondern auch für Shopsysteme oder Redaktionssysteme. Dennoch sollte der Webmaster nicht blind Programmierungen von anderen vertrauen! Meist stammen Programmierungen von Programmierern und selten von SEOs.