Double Content auf Typo3 basierten Webseiten verhindern.

Regelmässige Leser mögen sich vielleicht erinnern, das ich im Dezember mit einem Umbauprojekt gestartet bin. Dabei geht es darum, eine relativ schlecht zu wartende – aber in Google einigermassen gut gelistete –  Webseite in ein Typo3-Projekt zu überführen und dann möglichst ohne einen Rankingverlust in Google zu relaunchen.

Das Problem des sogenannten „Double-Contents“ ist hierbei – wie bei vielen CMS Systemen übrigens – nicht zu unterschätzen.

Double Content bedeutet, dass ein Inhalt unter mindestens zwei verschiedenen Abrufadressen im Internet erreichbar ist. Suchmaschinen wie Google kommen in mehr oder weniger regelmässigen Abständen vorbei und indizieren den Inhalt einer Seite. Ist eine Seite unter mehreren Adressen  erreichbar, wäre es unsinnig, alle gefundenen Varianten nebeneinander aufzulisten. Die Suchmaschinen versuchen dann also zu ermitteln, welche dieser Adressen die Original-Adresse ist und löschen alle anderen Adressen aus dem Index.

Ein klassischer Fall ist die „ohne www“-Variante einer Homepage. Die Internetseite ist also mit http://www. und nur mit dem Domainnamen, ohne das www davor, gleichwertig zu erreichen. Normalerweise entscheidet Google dann anhand der Backlinks, die auf eine Homepage verweisen, welche Adresse die Signifikante ist und stellt nur diese dar.

Problematisch kann das Ganze allerdings bei internen Seiten werden, die von „aussen“ nicht angelinkt werden. Google kann in dem Fall die „Original-Adresse“ nur raten. Das kann dazu führen, das interne Seiten schlechter gefunden werden.

In Typo3 – und überhaupt – ist es recht einfach kanonische URLs zu erzeugen. Besonders wenn Erweiterungen wie „RealUrl“ verwendet werden, die es  ermöglichen, sogenannt sprechende URLs zu erzeugen. Also anstelle /index.php?id=16 dann /seitentitel.html verwenden zu können, um eine Seite aufzurufen. Denn die index.php?id=16 Variante funktioniert weiterhin und mehr noch, es lassen sich beliebig Parameter anhängen. Also z.B. index.php?id=16&site=1&titel=findichgut führen ebenfalls dazu, das die Seite identisch ausgeliefert wird.

Was also dagegen unternehmen?
Zunächst mal empfehle ich immer, eine Sitemap anzulegen, die zumindest von der Startseite aus, besser noch aus einem Service-Menü heraus,  einfach zu erreichen ist.
Damit versorgt man den Spider von Google schon mal mit einer Liste aller gültigen Adressen. Kommt es nun zu doppeltem Content, kann Google anhand der URL aus der Sitemap nachsehen, welche Adresse von uns gewollt ist.

Zusätzlich kann man im Quelltext das neue Canonical-Tag integrieren, das Google mitteilt unter welcher Adresse das Originaldokument zu finden ist.
In Typo3 kann man das Canonical-Tag „ganz einfach“ über ein TypoScript Snippet im TypoScript erzeugen, in meinem derzeitigen Relaunch-Projekt sieht der entsprechende Code so aus, vielen Dank dafür übrigens an die Marit AG:
#Canonical-Tag zur Verhinderung von Duplicate Content in Seitenheader einfügen.
lib.canonical = TEXT
lib.canonical {
typolink {
parameter = {page:uid}
parameter.insertData = 1
useCacheHash = 1
addQueryString = 1
addQueryString.method = GET
addQueryString.exclude = id
returnLast = url
}

wrap = <link rel=“canonical“ href=“http://www.kontaktanzeigen-ratgeber.de/|“ />
}

page.headerData.940 < lib.canonical

Wobei Sie natürlich im Wrap Ihre Domain eingeben müssen ;)

Wenn Sie mehrere Domainnamen auf Ihr Projekt lenken, vielleicht weil sie ein Projekt des Mitbewerbs gakauft haben, sollten Sie unbedingt noch dafür sorgen, diese Adresse mittels eines Webserver-Redirects (301 !) auf Ihre aktuelle und einzige gültige Adresse umzuschreiben. Dazu ergänzen Sie die Datei .htaccess im Stammverzeichnis Ihres Webservers um die folgenden Zeilen, falls diese noch nicht eingetragen sein sollten.

RewriteCond %{HTTP_HOST} !^www\.ihr-domainname\.de$
RewriteRule ^(.*)$ http://www.ihr-domainname.de/$1 [L,R=301]

Damit wird dann jeder Aufruf Ihrer Homepage, der nicht mit dem Namen www.ihr-domainname.de erfolgt automatisch auf das richtige Zieldokument umgelenkt.

Wenn Sie diese Schritte durchgeführt haben, sollten Sie vor Problemen, die evtl. durch selbstverursachten Double Content entstanden sind, gewappnet sein.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.