Wenn sitemap.xml.gz in der Google-Suche auftaucht

Wenn sitemap.xml.gz in der Google-Suche auftaucht

und es nicht sollte.. und dann die sitemap.xml.gz-Datei auch noch relativ weit bei relevanten Suchanfragen oben ist, dann ist das ein wenig ärgerlich. Wie Google überhaupt auf die Idee kommt, eine derartig eindeutige Datei zu indizieren (Bing etc. sind da wohl schlauer) weiß ich auch nicht.

Das sieht dann ungefähr so aus.

Erzeugt wird diese Datei bei mir von dem WordPress-Plugin XML Sitemap Generator für WordPress. Wenn man sich hier die Einstellungen anschaut, zeichnet sich auch direkt eine Lösung ab, zumindest für eine (relativ) kleine Seite wie meine: die Datei nicht mehr erzeugen.

Da die sitemap.xml immer noch erzeugt wird, ausreichend klein ist mit knapp 40kB, benötige ich die gezippte Version nicht wirklich. Zumal sich zu dem Thema leider auch keine eindeutigen Aussagen im Internet finden lassen. Die von mir gefundenen Seiten, in denen der Fehler beschrieben wird, empfehlen, die robots.txt entsprechend anzupassen. Entsprechende Beiträge finden sich bei Google sowie Webmasterworld. Wobei nur eine begrenzte Anzahl von Seiten von dem Problem betroffen zu sein scheint, welche Kriterien genau hierzu führen weiß ich allerdings nicht.

Da ich keine aufwendige Lösung benötige, das Problem nur mit der gezippten Version habe, und die „große” Version der Seite immer noch recht klein ist, entferne ich die Option, die Datei zu erzeugen, einfach mal aus den Plugineinstellungen.

Anschließend lösche ich noch die sitemap.xml.gz Datei. Da wird Google wohl eine Weile drüber stolpern, es eventuell aber auch mitbekommen, und die Datei aus dem Index nehmen. (Ähnlich war es mit den .pdf Dateien, die Google indiziert hatte und diese anstelle der .html Seiten als Suchergebnisse angezeigt hatte. Diese habe ich dann auch (diese waren ohnehin nicht verlinkt und sollten nicht indiziert werden) durch Löschen aus der Suche entfernt.)

Schließlich habe ich noch in den Webmaster Tools meine ungezippte Sitemap eingetragen, um dort in Zukunft noch ein paar Daten abgreifen zu können.

Mal schaun, wann die Datei aus der Suche bei Google fliegt, ich werde das dann und wann nachhalten.

One thought on “Wenn sitemap.xml.gz in der Google-Suche auftaucht

  1. Jetzt ist die gezippte Sitemap Datei aus den Suchergebnissen verschwunden. Das hat also sehr gut 2 Wochen gedauert.
    Als ich – seinerzeit – ungewollte .pdf Dateien gelöscht hatte, die Google – ich weiß nicht wie – gefunden hatte, hatte es ähnlich lange gedauert.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.