Webmaster-Zentrale Blog
Offizielle Informationen zum Crawling und zur Indexierung von Webseiten und News für Webmaster
Wie funktioniert SafeSearch?
Freitag, 17. Februar 2012
In diesem Video gibt Matt Cutts Einblicke, wie der SafeSearch-Filter Inhalte als sexuell explizit erkennt.
Die heutige Frage kommt aus Zürich. Gary möchte wissen: "Wie funktioniert SafeSearch für Text und Bilder?"
Ich habe die erste Version von SafeSearch für Text mitentwickelt. Betrachten wir daher diesen Teil. Ich möchte Spammern keine Hilfestellungen geben, aber ich kann·aus dem Jahr 2000 berichten, um euch einen Eindruck zu geben. Mit SafeSearch möchten wir Gewichtungen für Suchbegriffe festlegen.
Viele Wörter mit einer großen Gewichtung weisen dann auf pornografische Inhalte oder Ähnliches hin. Wir können auch Schwellenwerte festlegen, die nach ersten Ergebnissen zu diesem Wort weitere Ergebnisse unterdrücken.
Es gibt auch Unterschiede: Ein unangemessenes Wort in einem ganzen Buch wird nicht so schwer gewichtet wie das gleiche Wort in einem sehr kurzen Text. Andere Wörter weisen deutlicher auf pornografischen Inhalt hin. Bestimmte Tippfehler wie A-M-A-T-U-R-E statt "Amateur" verweisen eher auf pornografische Websites als beispielsweise auf Amateurradio.
Doch Vorsicht: Manche Wörter sind nicht so eindeutig. Denn Brust kann auch für Brustkrebs stehen und Sex für Sexualkunde. Wir müssen daher lernen, welche Gewichtung wir einem Wort geben sollten. Das ist ziemlich anspruchsvoll. Bloß Inhalte analysieren oder einzelne Wörter festlegen reicht nicht aus. Aber es ist ein guter erster Schritt, um Inhalte als pornografisch einzustufen.
Wenn eure Website fälschlicherweise als pornografisch eingestuft wurde oder ihr einen Fehler bei SafeSearch gefunden habt, könnt ihr das
über diesen Link melden
. Dann können die Algorithmen angepasst oder andere Funktionen verbessert werden, damit interessante Websites nicht als pornografisch bewertet werden.
Doch es ist überraschend, wie bereits mit relativ einfachen Gewichtungen viele pornografische Inhalte im Web aussortiert werden können. Ein kurzer Rückblick: Die ersten Suchmaschinen wie AltaVista haben im Jugendschutzmodus für das Wort "Sex" höchstens zwanzig Treffer angegeben. Sie haben entweder die Anzahl der Suchergebnisse eingeschränkt oder nur diese Ergebnisse als sicher eingestuft.
Google hat einen anderen Ansatz. Wir haben überlegt, ob eine Mutter mit ihrem kleinen Sohn von solchen Suchergebnissen überrascht oder darüber verärgert wäre. Man möchte natürlich vom großen Angebot des Webs profitieren: Einerseits möchte man das gesamte Web durchsuchen und pornografische Inhalte ausschließen. Andererseits sollen Ergebnisse für Sexualkunde und Ähnliches angezeigt werden. Das ist ein guter Ansatz, der auch gut funktioniert hat. Zum Glück gibt es nun viel bessere Programmierer, die noch detailliertere Analysen durchführen, und mein Programm aus dem Jahr 2000 sicher gründlich überarbeitet haben.
Veröffentlicht von
Uli Lutz
, Search Quality
Labels
#NoHacked
2
2017
1
Accessibility
13
AJAX
1
AMP
7
Android
2
api
1
App-Indexierung
3
Best Practices
99
Bildersuche
2
captcha
1
Chrome
4
Code
12
Crawling
1
Crawling und Indexierung
126
Diskussionsforum
15
Duplicate Content
17
Dynamic Rendering
1
Einsteiger
8
Event
1
events
1
Feedback
1
Geo-Targeting
11
Google Analytics
6
Google Dance
1
Google News
1
Google Places
4
Google-Assistant
1
Google-Suche
59
Google+
9
Hacking
16
Hangouts
1
https
3
JavaScript
3
Kanonische URL
1
Kommentare
1
Konferenz
19
Lighthouse
3
Links
18
Malware
17
Mobile
38
Mobile-first indexing
1
Nachrichten-Center
16
Optimisation
3
PageSpeed Insights
2
Penalties
1
Performance
3
Ranking
1
reCaptcha v3
1
Rendering
2
Rich Snippets
18
Richtlinien für Webmaster
36
robots.txt
7
Safe Browsing
5
Search Console
19
Search Results
1
Security
4
Seitenzugriff
1
SEO
4
Sicherheit
38
Site Clinic
5
Sitemaps
30
Spam Report
9
SSL
1
Structured Data
8
Tools und Gadgets
17
Verschlüsselung
1
Video
132
Webmaster blog
1
Webmaster Community
1
Webmaster-Academy
1
Webmaster-Tools
154
webspam
3
Archiv
2020
Nov.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Feb.
2019
Dez.
Nov.
Okt.
Sept.
Juni
Mai
Feb.
Jan.
2018
Dez.
Nov.
Okt.
Sept.
Juli
Juni
Mai
Apr.
Feb.
Jan.
2017
Dez.
Nov.
Juni
Apr.
März
Jan.
2016
Nov.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Jan.
2015
Dez.
Nov.
Okt.
Sept.
Aug.
Juli
Mai
Apr.
März
Feb.
Jan.
2014
Nov.
Okt.
Sept.
Aug.
Juni
Mai
Apr.
März
Feb.
Jan.
2013
Dez.
Nov.
Okt.
Aug.
Juli
Juni
Mai
Apr.
März
Feb.
Jan.
2012
Dez.
Nov.
Okt.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Feb.
Jan.
2011
Dez.
Nov.
Okt.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Feb.
Jan.
2010
Dez.
Nov.
Okt.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Feb.
Jan.
2009
Dez.
Nov.
Okt.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Feb.
Jan.
2008
Dez.
Nov.
Okt.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Feb.
Jan.
2007
Dez.
Nov.
Okt.
Sept.
Aug.
Juli
Juni
Mai
Apr.
März
Feed
Forum für Webmaster
Webmaster-Sprechstunden
Webmaster-Tools-Hilfe
Developers-Site für Webmaster