Blogbeitrag
SEO
Nadine
Wolff
veröffentlicht am:
19.07.2018
Die perfekte Sitemap
Inhaltsverzeichnis
Die Verwendung von Sitemaps hat wichtige Aspekte für die Suchmaschinenoptimierung. Die Sichtbarkeit der Webseite kann erhöht werden und die Seiten können indiziert werden.
In diesem Artikel zeigen wir Ihnen, wie der Aufbau einer Sitemap ist und welche Seiten und Medieninhalte mit welchen relevanten Attributen ausgewiesen werden müssen. Dieser Artikel konzentriert sich ausschließlich auf die wichtigste Sitemap, wenn es um SEO geht: um die XML-Sitemap.
Was ist eine Sitemap?
Eine Sitemap ist eine Datei, die Suchmaschinen detaillierte Informationen über alle Seiten und Inhalte Ihrer Webseite liefert. Sitemaps verwenden Organisations-, Navigations- und Kennzeichnungssysteme, um Google und anderen Suchmaschinen zu helfen, Ihre Webseite zu crawlen und richtig einzuordnen.
Im Allgemeinen profitiert Ihre Webseite von einer Sitemap, da Suchmaschinen damit eine Art Fahrplan erhalten zum crawlen und zur Indexierung aller in der Sitemap aufgelisteten Seiten. Es gibt mehrere Arten von Sitemaps, wobei im SEO-Bereich die HTML und XML Sitemap relevant sind. Unter einer HTML-Webseite versteht wird im Wesentlichen die Webseitennavigation verstanden.
Zusätzlich gibt es noch eine Reihe weiterer Sitemaps:
Visuelle Sitemaps
Alphabetische Sitemaps
XML-Sitemaps
HTML-Sitemaps
Mobile Sitemaps
Nachrichten-Sitemaps
Video-Sitemaps
XML-Sitemaps
Die Suchmaschinen erhalten über die Sitemap eine gezielte Übersicht über den strukturellen Aufbau der Webseite. Die Sitemap muss in einem „maschinenlesbaren“ Format erstellt werden. Im Zuge dessen wird von einer XML-Sitemap gesprochen.
XML steht für „Extensible Markup Language“. Die Nutzung einer XML-Sitemap bietet viele Vorteile. Besonders Webseiten Betreiber können im Wesentlichen davon profitieren, eine XML-Sitemap auf Ihrer Webseite zu integrieren.
Ein Vorteil ist, dass die Nutzung einer XML-Sitemap den Suchmaschinen-crawlern helfen kann, neue URLs auf Ihrer Webseite zu lokalisieren und zu indexieren. Für sehr große Seiten und Seiten, die regelmäßig neue oder aktualisierten Inhalte, wie z.B. bei E-Commerce-Webseiten, haben, ist es für den Crawler schwierig, aktuelle Seiten zu finden und diese zu indizieren. Mit einer XML-Sitemap ist so eine genauere Steuerung des Bots möglich.
Wenn die Inhalte auf Ihrer Webseite nicht optimal verlinkt sind, können sich die Seiten nicht gegenseitig referenzieren. Mit einer Sitemap kann sichergestellt werden, dass alle relevanten Seiten von Google oder anderen Suchmaschinen gesehen werden können.
Wenn Sie viele Inhaltsseiten auf Ihrer Webseite haben, die nicht gut verlinkt sind und sich nicht gegenseitig referenzieren, können Sie Google oder andere Suchmaschinen mithilfe einer XML-Sitemap über diese Seiten informieren und sicherstellen, dass sie nicht übersehen werden.
Eine Sitemap kann die Crawler steuern und die Seiten priorisieren. Damit kann den Bots mitgeteilt werden, auf welche Seiten sie sich konzentrieren sollen. Dies geschieht mit Hilfe des Tags „priority“. Beispiel: <priority>0.8</priority>
Es wird empfohlen mit einer Index-Sitemap zu arbeiten und in dieser unterteilt sogenannte „Unter-Sitemaps“ anzulegen. Bei sehr großen Seiten empfiehlt es sich für die Kategorien oder Hauptbereiche der Seite jeweils eine eigene Sitemap zu erstellen. Zusätzlich sollten für die Bilder, Videos und PDF-Dateien auch eine eigene XML Sitemap angelegt werden.
Der Grund für diese Splittung ist zum einen die Größe einer Sitemap, die nicht überschritten werden darf (maximal 50MB) und eine bessere Kontrolle aller indizierten Seiten in der Google Search Console. Daher ist es sehr wichtig, dass die XML-Sitemap an die Google Search Console übermittelt wird.
Beispiel einer Sitemap-Index Datei:
https://www.beispiel-url.de/sitemap-index.xml
https://www.beispiel-url.de/sitemaps-pages.xml
https://www.beispiel-url.de/sitemaps-posts.xml
https://www.beispiel-url.de/sitemaps-images.xml
https://www.beispiel-url.de/sitemaps-videos.xml
https://www.beispiel-url.de/sitemaps-media.xml
URL- XML Sitemap
Es ist wichtig, die Sitemap-Index Datei auf der obersten Ebene der URL Struktur zu hinterlegen.
Eine vollständige Sitemap enthält diese Angaben:
URL
Lastmod: Das Datum der letzten Veränderung der URL
Changefreq: Die Häufigkeit, mit der die Inhalte der Seite verändert werden (optional, da Google dieser Angabe wenig Bedeutung beimisst)
Priority: Die Gewichtung der einzelnen Seite im Verhältnis zu den anderen URLs der Webseite (ist zwar optional aber für die Steuerung des Crawlers relevant)
[caption id="attachment_21502" align="aligncenter" width="508"]
Darstellung einer XML Sitemap mit einer einzelnen URL[/caption]
Die Verwendung der Angaben für letzte Veränderung der Seite, Änderungsfrequenz und Priorität haben keinen direkten Einfluss auf das Ranking der Webseite. Sie dienen dazu, die Arbeit des Googlebots effizienter zu steuern.
Werden allerdings unrealistische Werte verwendet, z. B. dass die Priorität aller vorhandenen Seiten auf 1 sind oder das Änderungsdatum aller Seiten immer derselbe Tag ist, kann dies der Qualität einer Sitemap schaden. Google ignoriert die Angaben dann oder verwendet die Sitemap im schlimmsten Fall ggf. gar nicht.
Die wichtigste Angabe in der Sitemap ist laut Googles Aussage das Attribut „lastmod“, da der Bot so erkennen kann, ob die aktuellste Version einer URL indexiert wurde oder die URL neu gecrawlt werden muss.
Weitere Infos zur Erstellung einer URL-Sitemap gibt es hier.
Bilder- XML Sitemap
Zusätzlich sollte eine spezielle Bilder-Sitemap angelegt werden. In dieser können bilderspezifische Angaben für Suchmaschinen übergeben werden, die dafür sorgen, dass die Bilder in der Bildersuche der Suchmaschinen besser gefunden werden. In einer solchen Bilder-Sitemap sollte die Bild-URL (Pflichtangabe) sowie der Titel und die Bildunterschrift mit aufgelistet sein.
Folgend ein Screenshot einer beispielhaften Bilder-Sitemap:
[caption id="attachment_21501" align="aligncenter" width="532"]
Beispiel einer Bilder-Sitemap[/caption]
Video- XML Sitemap
Für die auf der Webseite eingebunden Videos, sollte auch eine Video-Sitemap erstellt werden, die die spezifischen Informationen zu den Videos an die Suchmaschinen übermittelt. Eine Video-Sitemap sollte mindestens die Informationen zur URL haben, auf der das Video eingebunden ist, sowie den Titel, die Beschreibung des Videos und die URL des Videos selbst bzw. den YouTube-Link haben.
[caption id="attachment_21503" align="aligncenter" width="825"]
Beispiel einer Video-Sitemap[/caption]
Weitere Informationen zu einer Video-Sitemap gibt es hier.
Es ist kein Problem mehrere Sitemaps in der Google Search Console einzutragen. Aus diesem Grund sollten in jedem Fall für alle Hauptkategorien einzelne URL-Sitemaps, Bilder-Sitemaps und Video-Sitemaps erstellt werden. Dies ermöglicht eine deutlich leichtere Fehleranalyse, sollten nicht alle URLs, Bilder oder Videos von Google indexiert werden.
Sitemap Generator – mehrere Wege führen zur Sitemap
Viele Content Management Systeme bieten spezielle Plugins an, die automatisiert Sitemaps erstellen und diese auch regelmäßig updaten. Für Wordpress bietet sich beispielsweise das SEO Plugin Yoast an. Mittlerweile gibt es auch eine Yoast Extension für Typo3, die einem viel Arbeit abnimmt.
Zusätzlich gibt es aber auch online viele Sitemap Generatoren, die verschiedene Sitemaps bereitstellen können. Beispielsweise das Crawling-Tool Screaming Frog hat Sitemap Generator mit integriert.
[caption id="attachment_21504" align="aligncenter" width="584"]
Sitemaps generieren mit dem Screaming Frog[/caption]
Screaming Frog bietet die Möglichkeit spezielle Konfigurationen zu wählen. So kann z.B. das Attribut „Last Modified“ bei der Erstellung nicht mit berücksichtigt werden. Der Nachteil hier ist allerdings, dass ein Update der Sitemap manuell erfolgen muss. Es gibt aber auch Sitemap Generatoren, die ein automatisches Update mit anbieten. Leider sind diese nicht immer kostenlos.
Sitemap in der robots.txt und in der Google Search Conole
Wichtig ist es, dass die Index-Sitemap mit in die robots.txt aufgelistet wird. Die robots.txt Datei gibt dem Crawler der Suchmaschinen Instruktionen. Mit der Auflistung des Pfades für die .xml Datei findet der Crawler die Sitemap schneller und kann diese dann zügig verarbeiten.
Beispiel für eine robots.txt Datei:
User-agent: *Sitemap: https://www.beispiel-url.de/sitemap-index.xml
Die Benutzung einer Index-Sitemap dient vor allem der Kontrolle der indexierten Seiten, Videos oder Bilder. Es sollte also unbedingt die Sitemap in der Google Search Console eingereicht werden. Nach einiger Zeit bekommen Sie so die Informationen, wie viele Seiten eingereicht wurden (also in der Sitemap vorhanden sind) und wie viele davon im Google Index stehen.
In der neuen Google Search Console ist es nun auch ganz einfach möglich, genaustens zu untersuchen, welche URLs eingereicht wurden, aber von Google bei der Indexierung berücksichtigen wurden. So sind detailliertere Kontrollen und die Definition weiterer Maßnahmen möglich.
[caption id="attachment_21505" align="aligncenter" width="750"]
Inhalte der Sitemap in der Google Search Console[/caption]
Es folgen einige Fakten zu der Sitemap:
Die Größe einer Sitemap darf bis zu 50 MB (bzw. 50.000 URLs) – laut offiziellen Angaben von Google - sein. Bis eine solch große Datei runtergeladen werden kann, kann es dauern. Da Google mit der Ladezeit von Webseiten sehr kritisch ist und dies als Rankingfaktor sieht, spielt die Ladezeit der XML-Sitemap keine Rolle – solange es nicht zu einem Timeout kommt.
Bei der Bilder-Sitemap dürfen pro URL nicht mehr als 1000 Bilder angegeben werden.
Es sollte unbedingt darauf geachtet werden, dass Sitemaps sich automatisch aktualisieren. In vielen gängigen CM-Systemen gibt es Erweiterungen, die Sitemaps erzeugen können und diese auch immer tagesaktuell halten.
Google empfiehlt den Sitemap Dateinamen der Index-Sitemap, sowie der Unter-Sitemaps möglichst immer identisch zu halten.
Fazit
Wenn Sie Ihre XML-Sitemap korrekt erstellt, eingebunden und in der Google Search Console eingereicht haben, zeigen Sie Google an, welche Seiten Sie für qualitativ hochwertig und indexierungswürdig erachten. XML-Sitemaps sind keine magischen Methoden, die eine automatische Indexierung gewährleistet, sondern gibt dem Googlebot wichtige Hinweise, die Ihre Chancen auf eine Indexierung erhöhen.
Was können wir für Sie tun?
Möchten Sie auf Ihrer Webseite eine Sitemap anlegen? Haben Sie Fragen zu der korrekten Einbindung oder Erstellung einer Sitemap? Gerne unterstützen wir Sie bei der Erstellung der perfekten Sitemap. Wir freuen uns auf Ihre Anfrage.
Nadine
Wolff
Als langjährige Expertin im Bereich SEO (und Webanalyse) arbeitet Nadine Wolff seit 2015 bei den internetwarriors. Sie ist Teamlead im Bereich SEO & Webanalyse und begeistert sich für alle (teils schrägen) Neuerungen von Google und den anderen großen Suchmaschinen. Im Bereich SEO hat Nadine Fachartikel in der Website Boosting veröffentlicht und freut sich auf fachliche Workshops und einen nachhaltigen organischen Austausch.
noch keine Kommentare