Google Webmaster-Zentrale Blog [DE]

Sicherheits-Checkliste für Webmaster

Donnerstag, 20. September 2007

In den vergangenen Monaten hat es einen deutlichen Anstieg an kompromittierten Websites gegeben. Wir erklären es uns damit, dass nun verstärkt Websites gehackt werden, um Malware in Umlauf zu bringen oder Suchergebnisse zu spammen. Wie dem auch sei, jetzt ist jedenfalls ein guter Zeitpunkt für uns, um ein paar hilfreiche Sicherheitstipps für Webmaster anzusprechen. Obligatorischer Disclaimer: Auch wenn wir hier viele Tipps und Links zusammengestellt haben und wir Webmaster ermuntern wollen, diese "bitte zu Hause nachzumachen", so stellt diese Liste in keiner Hinsicht eine erschöpfende Aufzählung dar. Wir hoffen, dass sie nützlich ist, aber wir empfehlen auch, weitergehende Nachforschungen anzustellen.

Prüft die Server-Konfiguration

Auf der Website von Apache werden einige Sicherheitstipps zur Konfiguration zur Verfügung gestellt, und Microsoft bietet für IIS einige Ressourcen im Tech Center. In diesen Tipps geht es unter anderem um Zugriffsrechte für Verzeichnisse, Server Side Includes, Authentifizierung und Verschlüsselung.

Haltet Software-Updates und Patches auf dem neuesten Stand

Viele Webmaster tappen in die Falle, ein Forum oder einen Blog zu installieren und sich dann nicht mehr darum zu kümmern. So wie ihr ein Auto zur Inspektion bringt, ist es ebenso wichtig sicherzustellen, dass ihr euch die neusten Updates für alle installierten Programme besorgt. Braucht ihr dazu weitere Tipps? Der Blogger Mark Blair hat ein paar hilfreiche Ideen, so könnt ihr z. B. eine Liste der auf eurer Website verwendeten Software und Plug-Ins erstellen, um den Überblick über die Versionen und Updates zu behalten. Er empfiehlt auch, auf den Websites der Anbieter erhältliche Feeds zu abonnieren.

Schaut regelmäßig in die Log Files

Diese Angewohnheit bringt viele Vorteile, und einer davon ist die zusätzliche Sicherheit. Es könnte euch manchmal euch überraschen, was ihr dort findet.

Testet eure Website auf verbreitete Schwachstellen

Vermeidet Verzeichnisse mit offenen Zugriffsrechten. Das ist etwa so, als ob ihr die Haustür weit offen lasst und eine Fußmatte auslegt mit der Aufschrift: "Kommt rein und bedient euch!". Prüft auch die Anfälligkeit für XSS (cross-site scripting) und SQL Injections. Zudem solltet ihr gute Passwörter wählen. Das Googlemail Hilfecenter bietet ein paar gute Richtlinien, die grundsätzlich hilfreich bei der Passwortwahl sind.

Seid achtsam bei Anwendungen von Drittanbietern

Wenn ihr in Erwägung zieht, eine Applikation von einem Drittanbieter zu installieren, wie etwa Widgets, Counter, Werbenetzwerke oder Webstat-Services, schaut sie euch vorher genau an. Auch wenn es viele hervorragende Content Provider im Web gibt, lassen sich solche Applikationen auch ausnutzen, etwa durch gefährliche Scripte, die auf eure Besucher abzielen. Stellt sicher, dass die Applikation aus einer seriösen Quelle stammt. Hat der Anbieter eine überzeugende Website mit Support und Kontaktinformationen? Haben andere Webmaster Erfahrung damit gemacht?

Verwendet Google site: search, um zu sehen, was indexiert wird

Dies ist vielleicht sehr nahe liegend, wird aber auch oft übersehen. Es ist immer eine gute Idee, einen Test durchzuführen, um zu überprüfen, ob alles noch normal aussieht. Wenn ihr euch noch nicht so gut mit dem site: search-Operator auskennt: Damit könnt ihr die Suche auf eine bestimmte Site beschränken. Zum Beispiel erhaltet ihr durch die Suche "site:googleblog.blogspot.com" nur die Resultate vom offiziellen Google Blog.

Nutzt die Google Webmaster-Tools

Sie sind kostenlos und umfassen alle möglichen nützlichen Tools wie den Assistent für den Website-Status und die Möglichkeit zur Einstellung, wie der Googlebot eure Site crawlen soll. Ein weiteres nettes Feature ist, dass euch die Webmaster Konsole detaillierte Informationen anzeigt, wenn Google glaubt, dass eure Website gehacked wurde oder Malware enthält; beispielsweise werden konkret betroffene URLs angezeigt. Sobald ihr glaubt, dass die Malware entfernt wurde, könnt ihr dann über die Webmaster-Tools eine Neubewertung beantragen.

Nutzt sichere Protokolle

Für den Datentransfer solltet ihr SSH und SFTP benutzen anstatt Plaintext-Protokolle wie Telnet oder FTP. SSH und SFTP verwenden Verschlüsselungen und sind daher viel sicherer. Seht euch für diesen und andere nützliche Tipps zum Säubern und Sichern eurer Website doch einmal StopBadware.org an.

Lest den Google Online Security Blog

Hier gibt es großartigen Content zum Thema Online-Sicherheit mit Links zu vielen nützlichen Ressourcen. Es ist sicher eine gute Idee, den Blog zu euren Google Reader Feeds hinzuzufügen! :)

Support von eurem Webhost

Viele Webhosts haben einen nützlichen und ansprechbaren Support. Wenn ihr den Verdacht habt, dass etwas nicht stimmt, oder wenn ihr einfach sicher sein wollt, Bescheid zu wissen, besucht deren Website oder ruft sie an. Wir hoffen, dass ihr diese Tipps hilfreich findet. Wenn jemand von euch selbst ein paar gute Tipps hat, nutzt doch die Kommentarfunktion unten oder beginnt eine Diskussion im Google Diskussionsforum für Webmaster.
Gebt Hackern keine Chance! Original Post von Nathan Johns (Übersetzung von Manuel, Search Quality)

Abonnentenstatistiken und mehr

Dienstag, 18. September 2007

Wir freuen uns, euch einige neue Features in den Webmaster-Tools vorzustellen.Ab sofort sind auch Abonnetenstatistiken online einsehbar. Feed-Publisher können sich mittels der Webmaster-Tools über die Abonnenten von Google-Diensten wie Google Reader, iGoogle und Orkut informieren. Wir hoffen, dass dies das Erfassen von Abonnentenstatistiken für unterschiedliche Feed-Formate vereinfacht und eine Verbesserung gegenüber dem Parsen von Server-Logs darstellt.

Wir haben außerdem einige Änderungen am Interface vorgenommen, um den Look and Feel zu verbessern:

Es gibt keine Tabs mehr! Ihr könnt mittels der neuen Sidebar navigieren

Eine Breadcrumb-Navigation im Kopf der Seite

Die Sidebar lässt sich auf- und zuklappen und je nach Wunsch können einzelne Optionen ausgeblendet werden

Neue Sidebar-Themen: Übersicht, Diagnose, Statistiken, Links, Sitemaps und Tools

Nicht zuletzt möchten wir darauf hinweisen, dass die Webmaster-Tools ab sofort in 20 Sprachen bereitstehen. Zusätzlich zu US-Englisch, UK-Englisch, Französisch, Italienisch, Spanisch, Deutsch, Niederländisch, brasilianischem Portugiesisch, traditionellem Chinesisch, vereinheitlichtem Chinesisch, Koreanisch, Russisch, Japanisch, Dänisch, Finnisch, Norwegisch, Schwedisch und Polnisch gibt es die Webmaster-Tools nun auch auf Türkisch und Rumänisch.Loggt euch ein, um euch selbst von den Änderungen zu überzeugen. Bei Fragen oder Feedback könnt ihr gerne in der Rubrik Google Webmaster-Tools unseres Diskussionsforums für Webmaster posten.OriginalPost von Liza Maz, Webmaster Tools Team (Übersetzung von Florian)

Duplicate Content aufgrund von URL-Parametern

Montag, 17. September 2007

Wann sind URL-Parameter, wie z. B. Session- oder Tracking-IDs, die Ursache für Duplicate Content? Nutzer-„Duplicate Content – Best Practice bei dupliziertem Inhalt“Produkt-Seite

Weshalb ist dies von Bedeutung? Wenn Suchmaschinen identischen Content über verschiedene URLs crawlen, kann dies verschiedene Konsequenzen haben:

Zahlreiche URLs für ein- und dieselbe Seite können die Link-Popularität verschlechtern. Im obigen Beispiel könnten sich z. B. 50 Links auf 3 verschiedene URLs verteilen, anstatt ausschließlich auf eine einzige URL gerichtet zu sein.

In Suchergebnissen können unter Umständen wenig benutzerfreundliche URLs angezeigt werden (sehr lange URLs mit Tracking- oder Session-IDs):
- Die Wahrscheinlichkeit, dass User auf ein derartiges Suchergebnis klicken, ist geringer
- Die Markenbildung kann dadurch erschwert werden

Wie wir Usern und Webmastern bei Duplicate Content helfen Wir haben Algorithmen entworfen, die dazu beitragen, dass Duplicate Content keine Beeinträchtigung für User und Webmaster darstellt.
Wenn wir feststellen, dass Duplicate Content vorliegt, der beispielsweise durch Variationen von URL-Parametern hervorgerufen wird, dann fassen wir diese duplizierten URLs zu einer Gruppe zusammen.

Wir wählen dann jene URL aus, die als am besten geeignet erscheint, die jeweilige Gruppe in den Suchergebnissen zu vertreten.

Schließlich werden bestimmte Eigenschaften der URLs aus der Gruppe, wie z. B. die Link-Popularität, vereinigt und auf die im vorigen Schritt ermittelte URL übertragen.

Das Übertragen bestimmter Eigenschafen der Duplikate auf eine „repräsentative“ URL führt in der Regel dazu, dass wir unseren Usern genauere Suchergebnisse liefern können. Wie könnt ihr in solchen Fällen von Duplicate Content dazu beitragen, dass Suchmaschinen eure Site richtig interpretieren? Zunächst gibt es keinen Grund zur Sorge, da die Verwendung von URL-Parametern eine gängige und sinnvolle Praxis ist.
Jedoch gibt es folgende Punkte, die dabei helfen, mögliche Probleme für Suchmaschinen zu minimieren:

Entfernt alle unnötigen URL-Parameter – haltet die URL so einfach wie möglich.

Übermittelt eine Sitemap mit der von euch gewünschten Version jeder URL. Wir können zwar nicht garantieren, dass unsere Algorithmen immer exakt die URL aus der Sitemap in den Suchergebnissen anzeigen, jedoch ist die Sitemap ein guter Hinweis darauf, welche URL von euch bevorzugt wird.

Wie könnt ihr eure Website gestalten, um Duplicate Content zu vermeiden? Aufgrund der Art und Weise, mit der Google mit Duplicate Content umgeht, müsst ihr euch keine besonderen Sorgen um einen Verlust der Link-Popularität oder des PageRanks machen. Dennoch schlagen wir folgende Schritte vor, um Duplicate Content im Allgemeinen zu reduzieren:

Beim Tracking von Nutzer-Informationen solltet ihr 301-Weiterleitungen verwenden, um von URLs mit Parametern auf die gewünschte Ziel-URL weiterzuleiten.

Nutzt Cookies, um Werte für Affiliate-IDs oder Tracking-IDs zu setzen.

Wenn ihr diese Methode anwendet, könnte ein Auszug aus dem Logfile des Webservers folgendermaßen aussehen: 127.0.0.1 - - [19/Jun/2007:14:40:45 -0700] "GET /product.php?category=gummy-candy&item=swedish-fish&affiliateid=ABCD HTTP/1.1" 301 -

127.0.0.1 - - [19/Jun/2007:14:40:45 -0700] "GET /product.php?item=swedish-fish HTTP/1.1" 200 74 Und das Session-Cookie mit der Nutzer- bzw. Affiliate-ID könnte so aussehen: category|s:11:"gummy-candy";affiliateid|s:4:"ABCD"; Falls ihr Cookies verwendet, solltet ihr stets darauf achten, dass der eigentliche Content (z.B. die Produkt-Seiten) problemlos angezeigt wird, auch wenn im Browser die Cookies deaktiviert sind.

Wie können wir euch zukünftig noch besser unterstützen? Vor kurzem haben wir einige Ideen von der „SMX Advanced“-Konferenz veröffentlicht, wo wir das Thema behandeln, wie Suchmaschinen den Webmastern in Bezug auf Duplicate Content helfen können. Falls ihr bei diesem Thema mitreden möchtet, könnt ihr das gerne in unserem Diskussionsforum tun.Original Post von Maile Ohye (Übersetzung von Sven, Search Quality)

Update zu den Penalty E-Mails

Freitag, 31. August 2007

Zunächst mal ein zusammenfassender Rückblick: Ende 2005 begannen wir damit, Webmaster über E-Mail zu kontaktieren , um ihnen mitzuteilen, dass ihre Website unsere Richtlinien für Webmaster verletzt und wir vorübergehend einige ihrer Seiten aus dem Index entfernt haben. Vor einigen Monaten haben wir diese E-Mails eingestellt, da einige falsche Nachrichten in Umlauf waren, die nicht von Google kamen und vornehmlich an deutsche Webmaster geschickt wurden. Mitte Juli veröffentlichten wir dann das Nachrichten-Center in unserer Webmaster-Konsole, welches uns ermöglicht, Nachrichten an dort verifizierte Webmaster zu schicken.Das Nachrichten-Center ist zwar sehr praktisch für Webmaster, die ihre Website dort verifiziert haben, jedoch erlaubt es uns nicht, mit all den anderen Webmastern in Kontakt zu treten, die nicht in Googles Webmaster-Tools registriert sind. Aus diesem Grund haben wir vor, die Benachrichtigungen über E-Mail zusätzlich zu denen im Nachrichten-Center wieder aufzunehmen. Beachtet bitte, dass unsere E-Mails nach wie vor keine Attachments enthalten. Im Moment werden im Nachrichten-Center keine Benachrichtigungen gespeichert, falls ihr dort nicht schon angmeldet seid. Wir hoffen jedoch, dieses Feature in den nächsten Monaten einzubauen. Wir werden euch über alle Neuerungen auf dem Laufenden halten. Original

Internationale Domain-Namen in den Webmaster-Tools registrieren

Mittwoch, 29. August 2007

Es freut mich, euch mitteilen zu können, dass die Webmaster-Tools nun eine verbesserte Funktionalität für Webmaster aus nicht-englischsprachigen Ländern bieten, da jetzt der sogenannte IDNA-Standard (Internationalizing Domain Names in Applications) unterstützt wird. Dies wird im deutschsprachigen Raum häufig als "Umlautdomain" bezeichnet. IDNA ermöglicht Seitenbetreibern die Verwendung von Domains, die Buchstaben und Zeichen enthalten, welche nicht im Englischen vorhanden sind. Vor der Einführung von IDNA konnten Internet-Host-Namen ausschließlich aus den 26 Buchstaben des englischen Alphabets, den Ziffern 0-9 und einem Bindestrich bestehen. Mit Hilfe von IDNA seid ihr nun in der Lage, auch Sites anzumelden, die andere Zeichensätze verwenden. Diese könnt ihr in den Webmaster-Tools wie gewohnt verwalten.
Angenommen, ihr wolltet vor der Unterstützung von IDNA die Site der Universität Peking, http://北京大学.cn/, in eurem Webmaster-Tools Konto hinzufügen. Bei einer derartigen Eingabe im Textfeld vor dem "Website hinzufügen"-Button hättet ihr folgende Fehlermeldung erhalten:

Einige Webmaster hatten bereits eine Möglichkeit entdeckt, das Problem zu umgehen, da IDNA eine Domain wie z.B. http://北京大学.cn/ intern in ein anderes Format umwandelt, was als Punycode bezeichnet wird. Der umgewandelte Domain-Name würde für unser Beispiel dann so aussehen: http://xn--1lq90ic7fzpc.cn/. Der Einsatz von Punycode ermöglichte es also, die Domain in den Webmaster-Tools zu verwenden, was aufgrund der kryptischen Zeichenfolge aber nicht besonders benutzerfreundlich war, vor allem wenn mehrere Domains auf diese Weise verwaltet wurden.

Da wir jetzt auch in den gesamten Webmaster-Tools den IDNA-Standard unterstützen, könnt ihr einfach den Domain-Namen inklusive der landestypischen Sonderzeichen eingeben, und wir fügen diesen dann korrekt in euer Konto ein. Hier seht ihr, wie der Bildschirm aussieht, wenn wir wieder die URL aus dem obigen Beispiel verwenden (http://北京大学.cn/):

Falls ihr bereits den erwähnten Workaround mittels Punycode verwendet habt (d. h. ihr seht in eurem Konto eine URL ähnlich wie diese: http://xn--1lq90ic7fzpc.cn/), werden diese Domain-Namen jetzt automatisch korrekt angezeigt.Wir freuen uns über eure Fragen und euer Feedback zu diesem neuen Feature. Ihr könnt hier eure Kommentare hinterlassen oder das Thema in der Rubrik "Google Webmaster-Tools" unseres Diskussionsforums besprechen. Für weitere Vorschläge und Hinweise, wie wir unseren internationalen Support verbessern können, sind wir jederzeit dankbar. Original
Post von Trevor Foucher, Webmaster Tools Team (Übersetzung von Sven, Search Quality)

Neues robots.txt-Feature und REP Meta-Tags

Freitag, 17. August 2007

Wir haben unser robots.txt-Analyse-Tool in der Webmaster-Zentrale verbessert mit dessen Hilfe man Sitemapsangaben und relative Urls erkennen kann. Frühere Versionen berücksichtigten Sitemaps in keiner Weise und konnten nur absolute Urls interpretieren. Alles andere erzeugte die Meldung "Syntax nicht verstanden".Diese Fehlermeldungen haben wir auch verbessert. Sofern mehrere Fehler existieren, bekommt ihr diese nun alle in einer Zeile angezeigt, im Gegensatz zu früheren Versionen, die jeweils nur den ersten Fehler ausgaben. Ebenso haben wir andere allgemeine Verbesserungen an der Analyse und der Validierung vorgenommen.Stellt euch vor, ihr seid für die Domain www.example.com verantwortlich, und ihr möchtet, dass die Suchmaschine eure gesamte Website mit Ausnahme des Ordners /images indexiert. Zudem wollt ihr sicherstellen, dass eure Sitemap berücksichtigt wird und gebt dementsprechend Folgendes in eurer robots.txt-Datei an:
disalow images

user-agent: *
Disallow:

sitemap: http://www.example.com/sitemap.xml

Ihr geht zur Webmaster-Zentrale, um eure Website gegen das robots.txt-Analyse-Tool zu testen, wobei ihr diese beiden Urls benutzt:
http://www.example.com
/archivesÄltere Versionen dieses Tools hätten folgende Meldung ausgegeben:

Die verbesserte Version gibt mehr Informationen über die robots.txt-Datei:

Probiert es selbst in den Webmaster-Tools.

Ebenso wollen wir sicherstellen, dass ihr von dem neuen unavailable_after Meta-Tag gehört habt, den Dan Crow vor einigen Wochen im Official Google Blog vorgestellt hat. Dieser Tag erlaubt eine dynamischere Beziehung zwischen eurer Website und dem Googlebot. Das bedeutet, wenn ihr zum Beispiel auf www.example.com eine nur vorübergehend veröffentlichte Nachricht habt oder eine Seite mit nur begrenzt erhältlichen Angeboten oder Promotions, dann könnt ihr jetzt exakt das Datum und die Zeit festlegen, wann der Googlebot bestimmte Seiten von euch crawlen und indexieren soll.

Angenommen, ihr habt eine Promotion laufen, die Ende 2007 zu Ende ist. Im Header der Seite www.example.com/2007promotion.html würdet ihr dann Folgendes festlegen:

<META NAME="GOOGLEBOT"
CONTENT="unavailable_after: 31-Dec-2007 23:59:59 EST">

Die zweite interessante Neuigkeit: Eine neue robots.txt-Richtlinie, die beinhaltet, dass nun das Robots Exclusion Protocol (REP) Meta-Tag auch für Nicht-HTML-Seiten unterstützt wird! Damit könnt ihr nun eure Videos, Spreadsheets und andere indexierte Dateitypen in derselben Weise kontrollieren. Um auf das oben genannte Beispiel zurückzukommen, lasst uns annehmen, eure Promotionsseite ist im PDF-Format. Für www.example.com/2007promotion.pdf würdet ihr Folgendes verwenden:

X-Robots-Tag: unavailable_after: 31 Dec
2007 23:59:59 EST

Denkt daran, dass REP META-Tags hilfreich beim Implementieren von noarchive, nosnippet and jetzt auch unavailable_after Tags sein können, um Anweisungen auf Seitenebene geben. Im Gegensatz dazu setzt das robots.txt an der Domainebene an. Diese Features haben wir auf Anfragen von Bloggern und Webmastern eingebaut - habt also Spaß damit. Sofern ihr andere Vorschläge habt: lasst es uns wissen! Noch Fragen? Bitte stellt diese in der Google Diskussiongruppe für Webmaster.

Original

Post von John Blackburn, Webmaster Tools and Matt Dougherty, Search Quality
(Übersetzung von Claudia, Search Quality)

Supplemental wird Mainstream

Mittwoch, 1. August 2007

Als Google im Jahr 2003 die Supplemental Results (Zusätzliche Ergebnisse) einführte, waren in unserem Hauptindex Milliarden von Webseiten. Durch den Supplemental Index (Zusätzlichen Index) konnten wir noch mehr Webseiten indexieren und diesen Content, genauso wie in unserem Hautpindex, bei der Bereitstellung relevanter Suchergebnisse für unsere User zugänglich machen. Dies war besonders hilfreich für solche Suchanfragen, die im Hauptindex weniger Ergebnisse lieferten und bei denen wir durch den Supplemental Index in der Lage waren, noch mehr Webseiten bereitzustellen.Je weniger Einschränkungen es für Seiten im Supplemental Index gibt, desto höher ist die Chance, dass Webseiten, die nicht im Hauptindex enthalten sind, im Supplemental Index erfasst werden. Dies sind oft Seiten mit einem niedrigeren PageRank oder einer komplizierteren URL. So gesehen dient der Supplemental Index einem wichtigen Zweck: nämlich so viel relevanten Content wie möglich zu crawlen. Mehr darüber könnt ihr hier lesen und hier einen Vortrag von Matt Cutts sehen.Jegliche Veränderungen, die wir durchführen, müssen auf eine verbesserte Sucherfahrung abzielen. Seit 2006 haben wir unser System, welches die Supplemental Results crawlt und indexiert, vollständig überholt. Das momentane System gewährleistet eine umfassendere und kontinuierlichere Indexierung. Zudem indexieren wir URLs mit mehreren Parametern und legen weniger Beschränkungen an Sites an, die wir crawlen. Als Resultat ist unser Supplemental Index nun aktueller und transparenter als jemals zuvor. Ebenso arbeiten wir darauf hin zunehmend mehr Supplemental Results anzuzeigen, indem wir sicherstellen, dass jede Anfrage im Supplemental Index durchgeführt werden kann. Wir haben vor, diese Neuerungen im Laufe des Sommers zu implementieren.Der Unterschied zwischen dem Hauptindex und dem Supplemental Index wird daher zunehmend geringer. In Anbetracht der bisherigen Fortschritte und im Hinblick auf zukünftige Verbesserungen haben wir uns entschieden, diese URLs zukünftig nicht mehr als „Supplemental Results“ zu kennzeichnen. Trotzdem werdet ihr natürlich weiterhin in den Genuss von Googles umfassenden und aktuellen Supplemental Results kommen.Original
Post von Prashanth Koppula, Product Manager und Matt Cutts, Software Engineer (Übersetzung von Claudia, Search Quality)

Webmaster-Zentrale Blog