Zurück zur Blogübersicht
SEO

Was ist eine XML-Sitemap?

Eine XML-Sitemap ist eine Übersicht aller indexierbaren Unterseiten einer Webseite. Sie sorgt dafür, dass Suchmaschinen Inhalte und Strukturen einer Website besser verstehen und auffinden können. Eine XML-Sitemap ist insbesondere bei sehr verschachtelten Webseiten hilfreich. Sie kann daher positiv zur Indexierung von Unterseiten beitragen, garantiert diese jedoch nicht. Als Format für die Sitemap hat sich XML als Standard etabliert.
 

Der Unterschied zwischen einer XML- und einer HTML-Sitemap

Nicht verwechselt werden sollte die XML-Sitemap mit der HTML-Sitemap. Eine HTML-Sitemap wird häufig von Content Management Systemen (CMS) erstellt und gibt für den Nutzer und Suchmaschinen ein Inhaltsverzeichnis einer Website wieder. Die XML-Sitemap ist für den Nutzer zunächst nicht sichtbar und wird nur als Datei an die Suchmaschine übergeben. Ist die URL der XML-Sitemap bekannt, kann diese auch von Nutzern aufgerufen werden.
 

Vorteile der XML-Sitemap

Das Erstellen und Nutzen einer XML-Sitemap bringt folgende Vorteile:

  • Schwer zugängliche Unterseiten (da sie z.B. neu oder schlecht intern verlinkt sind) sind besser auffindbar
  • Bei einer neuen Website, die nicht über viele Backlinks verfügt, sind die Unterseiten besser auffindbar
  • Content-Archiv, das intern nur gering verlinkt ist, kann besser gecrawlt und indexiert werden

Eine XML-Sitemap erstellen

Viele gängige CMS Systeme wie TYPO3, Magento oder WordPress können eine XML-Sitemap per Standardfunktion oder per Extension erstellen. Des Weiteren gibt es allerdings auch einige kostenlose Tools, die diese Aufgabe übernehmen können.

Aufbau der XML-Sitemap

Als Auszeichnungssprache hat sich das Google Sitemap Protokoll 0.9 etabliert. Das Protokoll ist auf sitemaps.org zu finden.

Folgende Elemente sollten vorhanden sein:

  • Angaben zum Zeichencode
  • Alle Unterseiten der Webseite
  • Änderungsdatum
  • Änderungsfrequenz
  • Priorität der Unterseiten

Die Angaben zum Änderungsdatum, zur Änderungsfrequenz und zur Priorität sind optional.

Das Attribut lastmod

Das Attribut enthält das letzte Änderungsdatum der Seite und sollte das W3C Datetime-Format (YYYY-MM-DD) aufweisen. Das hilft den Suchmaschinen zu erkennen, welche Seiten neue und/oder geänderte Inhalte besitzen und unterstützt bei einer schnellen Indexierung. Seiten, die sich inhaltlich nicht geändert haben, sollten stattdessen das letzte Änderungsdatum beibehalten und werden korrekterweise dann nicht priorisiert gecrawlt. Die Angabe von Stunden und Sekunden sind optional.

Folgender Screenshot zeigt die Verwendung des Attributs:

Das Attribut changefreq

Das Attribut <changefreq> gibt an, mit welcher Häufigkeit sich die Seite wahrscheinlich ändern wird. Damit wird Suchmaschinen ein Hinweis gegeben, wie oft diese Seite gecrawlt werden sollte. 

Gültige Argumente sind:

  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never

Das Argument „always“ wird hierbei für Seiten verwendet, die sich bei jedem Zugriff ändern, etwa Börsenkurse. Für Archive kann das Argument „never“ verwendet werden. Die Angabe ist hierbei lediglich eine Empfehlung für Suchmaschinen. Die tatsächliche Crawl-Häufigkeit kann unter Umständen abweichen.

Folgender Screenshot zeigt die Verwendung des Attributs:

Das Attribut priority

Das Attribut <priority> gibt die Priorität einer Seite im Vergleich zu den anderen Seiten einer Webseite an. Die Werte können dabei zwischen 0.0 und 1.0 liegen. Die Standardpriorität einer Seite liegt bei 0.5. Es macht keinen Sinn, allen Seiten eine hohe Priorität zuzuweisen, da diese relativ zu den anderen Seiten der Webseite festgelegt wird. Die höchste Priorität sollten die Startseite und Kategorieseiten bzw. die wichtigsten Unterseiten bekommen.

Folgender Screenshot zeigt die Verwendung des Attributs:

Anforderungen an eine XML-Sitemap

Beim Anlegen einer Sitemap sollten folgende Punkte beachtet werden:

  • Nur Seiten mit Statuscode 200; keine Weiterleitungen, keine 404 Statuscodes
  • Keine URLs mit Sitzungs-IDs
  • Nur indexierbare Seiten, keine Seiten mit dem Meta Robots Tag „noindex“
  • Keine Seiten, die durch die robots.txt von der Indexierung ausgeschlossen sind
  • Keine Seiten, die mit einem Canonical Tag auf eine andere Seite verweisen
  • Keine Success-Seiten, die nur bestehen, um Conversions zu messen (z.B. /vielen-dank/)
  • Für jede Seite nur einen Eintrag
  • Für Bilder, Videos oder Google News-Inhalte kann eine separate Sitemap angelegt werden
  • Nicht mehr als 50.000 URLs pro Sitemap, ansonsten mehrere Sitemaps anlegen
  • Nicht größer als 50 MB unkomprimiert

Wichtig ist, dass sich die Sitemap täglich aktualisiert und bei Veränderungen die Seiten entfernt werden, die bspw. gelöscht oder weitergeleitet wurden. Es sollte also gewährleistet sein, dass die Sitemap möglichst immer aktuell ist. Hilfreich ist es, dabei mit einer Extension für Ihr CMS zu arbeiten.

Weitere Informationen zu den Richtlinien von Google finden sich hier.

Die Sitemap-Indexdatei

Würde eine XML-Sitemap mehr als 50.000 URLs enthalten oder über 50 MB groß sein, sollte eine Sitemap-Indexdatei verwendet werden. Diese enthält eine Auflistung aller XML-Sitemaps. In der Google Search Console oder den Bing Webmaster Tools wird dann diese Sitemap-Indexdatei eingereicht und in der robots.txt verlinkt.

Weitere Informationen von Google zum Thema Sitemap-Indexdatei finden sich hier.

Die XML-Sitemap für die Suchmaschine zugänglich machen

Eine XML-Sitemap sollte für die Suchmaschinen über mehrere Wege veröffentlicht werden:

1. Ablegen im Root-Verzeichnis der Domain

2. Angabe von Position und Bezeichnung in der robots.txt

3. Hochladen in der Google Search Console oder den Bing Webmaster Tools

Beim Hochladen der Sitemap in der Search Console wird angegeben, bei welchen Seiten Fehler bei der Verarbeitung auftraten. Diese sollten korrigiert werden.

Fazit

XML-Sitemaps sind ein praktisches Tool, um das vollständige Crawling einer Website weitestgehend zu gewährleisten. Besonders für große Websites, neue Websites oder Websites mit neuen Unterseiten empfiehlt sich die Verwendung einer XML-Sitemap. Haben Sie Fragen oder benötigen Sie Hilfe bei der Erstellung einer XML-Sitemap? Sprechen Sie uns gerne an. Als professionelle SEO Agentur haben wir das Know How, von dem Ihr Webprojekt profitieren kann.