Webmaster-Zentrale Blog
Offizielle Informationen zum Crawling und zur Indexierung von Webseiten und News für Webmaster
Unser neuer Suchindex: Caffeine
Donnerstag, 10. Juni 2010
Wir möchten euch über die Fertigstellung von Caffeine, unserem neuen System zur Indexierung des Webs, informieren. Caffeine bietet um 50 Prozent aktuellere Suchergebnisse als unser vorheriger Index und ist die größte Sammlung von Webinhalten, die wir jemals anbieten konnten. Egal, ob es sich um Nachrichten, ein Blog oder ein Posting in einem Forum handelt, ihr werdet jetzt Links zu relevantem Content viel schneller nach der Veröffentlichung finden, als das früher möglich war.
Wir wollen auch all jenen, die nicht so wie wir, den Großteil ihres Lebens damit verbringen, an Suchmaschinen zu feilen, ein wenig Hintergrundinformation liefern: Wenn ihr in Google sucht, durchsucht ihr nicht das Web selbst. Stattdessen, durchsucht ihr einen Index des Webs - eben wie euch der Index am Ende eines Buches dabei hilft, genau jene Stelle mit der richtigen Information zu finden. (Hier findet ihr
englischsprachige Informationen
darüber, wie es funktioniert.)
Also, warum haben wir ein neues System zur Indexierung geschaffen? Der Content im Web blüht auf. Er wird nicht nur immer mehr und umfangreicher: Mit der Verbreitung von Video, Bildern, News und Echtzeitupdates, wird die durchschnittliche Website reichhaltiger und komplexer. Zusätzlich steigt die Erwartungshaltung der Benutzer in Bezug auf die Suche. Jemand, der sucht, möchte den neuesten relevanten Content finden und Websitebetreiber erwarten, dass ihre Inhalte sofort nach der Veröffentlichung gefunden werden.
Um mit der Evolution des Webs Schritt zu halten und die steigenden Benutzererwartungen zu erfüllen, haben wir Caffeine verwirklicht. Das folgende Bild stellt dar, wie unsere altes Indexierungssystem im Vergleich zu Caffeine funktionierte:
Unser alter Index hatte mehrere “Schichten”. Manche wurden schneller aktualisiert als andere. Die Hauptschicht wurde alle paar Wochen erneuert. Um eine Schicht des alten Index zu erneuern, wurde das ganze Web analysiert. Das bedeutete, dass es eine deutliche Verzögerung zwischen dem Zeitpunkt, zu dem wir eine Seite entdeckten, und ihrer Auffindbarkeit für euch gab.
Mit Caffeine analysieren wir das Web in kleinen Dosen und aktualisieren unseren Index kontinuierlich und weltweit. Wenn wir neue Seiten finden - oder neue Informationen auf bereits existierenden Seiten - können wir sie direkt dem Index hinzufügen. Das bedeutet, ihr könnt aktuellere Informationen als jemals zuvor finden - egal wann oder wo sie veröffentlicht wurden.
Caffeine ermöglicht die Indexierung von Seiten in enormem Maßstab. In jeder Sekunde verarbeitet Caffeine parallel Hunderttausende von Seiten. Wenn es sich um einen Papierstoß handelte, würde er jede Sekunde um beinahe 5 km wachsen. Caffeine beansprucht fast 100 Millionen Gigabyte Speicher in einer unserer Datenbanken und fügt jeden Tag neue Informationen in der Größenordnung von Hunderttausenden Gigabytes hinzu. Ihr würdet 625,000 der speicherstärksten iPods benötigen, um so viele Informationen zu speichern und kämt ihr auf eine Höhe von fast 65km, würdet ihr die aufeinanderstapeln.
Wir haben Caffeine mit Blick auf die Zukunft geplant. Es ist nicht nur aktueller, es ist auch ein robustes Fundament, dass es uns ermöglicht eine neue, noch schnellere und umfassendere Suchmaschine zu bauen, die mit dem Anstieg an Informationen im Netz mitwächst und euch noch relevantere Suchergebnisse liefert. Ihr könnt also noch mehr Verbesserungen in den kommenden Monaten erwarten.
Our new search index: Caffeine (English version)
Post von Carrie Grimes, Software Engineer (Übersetzung von Jörg Pacher, Search Quality)
Labels
#NoHacked
2
2017
1
Accessibility
13
AJAX
1
AMP
7
Android
2
api
1
App-Indexierung
3
Best Practices
99
Bildersuche
2
captcha
1
Chrome
4
Code
12
Crawling
1
Crawling und Indexierung
126
Diskussionsforum
15
Duplicate Content
17
Dynamic Rendering
1
Einsteiger
8
Event
1
events
1
Feedback
1
Geo-Targeting
11
Google Analytics
6
Google Dance
1
Google News
1
Google Places
4
Google-Assistant
1
Google-Suche
59
Google+
9
Hacking
16
Hangouts
1
https
3
JavaScript
3
Kanonische URL
1
Kommentare
1
Konferenz
19
Lighthouse
3
Links
18
Malware
17
Mobile
38
Mobile-first indexing
1
Nachrichten-Center
16
Optimisation
3
PageSpeed Insights
2
Penalties
1
Performance
3
Ranking
1
reCaptcha v3
1
Rendering
2
Rich Snippets
18
Richtlinien für Webmaster
36
robots.txt
7
Safe Browsing
5
Search Console
19
Search Results
1
Security
4
Seitenzugriff
1
SEO
4
Sicherheit
38
Site Clinic
5
Sitemaps
30
Spam Report
9
SSL
1
Structured Data
8
Tools und Gadgets
17
Verschlüsselung
1
Video
132
Webmaster blog
1
Webmaster Community
1
Webmaster-Academy
1
Webmaster-Tools
154
webspam
3
Archiv
2020
Nov.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Feb.
2019
Dez.
Nov.
Okt.
Sept.
Juni
Mai
Feb.
Jan.
2018
Dez.
Nov.
Okt.
Sept.
Juli
Juni
Mai
Apr.
Feb.
Jan.
2017
Dez.
Nov.
Juni
Apr.
März
Jan.
2016
Nov.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Jan.
2015
Dez.
Nov.
Okt.
Sept.
Aug.
Juli
Mai
Apr.
März
Feb.
Jan.
2014
Nov.
Okt.
Sept.
Aug.
Juni
Mai
Apr.
März
Feb.
Jan.
2013
Dez.
Nov.
Okt.
Aug.
Juli
Juni
Mai
Apr.
März
Feb.
Jan.
2012
Dez.
Nov.
Okt.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Feb.
Jan.
2011
Dez.
Nov.
Okt.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Feb.
Jan.
2010
Dez.
Nov.
Okt.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Feb.
Jan.
2009
Dez.
Nov.
Okt.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Feb.
Jan.
2008
Dez.
Nov.
Okt.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Feb.
Jan.
2007
Dez.
Nov.
Okt.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Feed
Forum für Webmaster
Webmaster-Sprechstunden
Webmaster-Tools-Hilfe
Developers-Site für Webmaster