Question 1

Was ist ein Crawler?

Accepted Answer

Ein Crawler, auch Robot, Bot, Spider, Searchbot oder Webcrawler genannt, ist ein Programm was selbständig das World Wide Web durchsucht und Inhalte, Informationen ausliest und indexiert. Abgeleitet von der Suchmaschine „WebCrawler“ welche 1994 als erste öffentlichte Suchmaschine mit Volltextindex-Suche arbeitete.

Question 2

Wie funktioniert ein Crawler?

Accepted Answer

Durch einen Hyperlink einer Website, durchforstet der Crawler das Internet und gelangt so von Website zu Website, die daraus gesammelten Daten werden wiederum in einer Datenbank abgelegt. Die Algorithmen bestimmen hierzu wie oft eine Website gecrawlt wird, je bekannter die Seite desto häufiger wird diese besucht. Welche Informationen ein Crawler aufnimmt, hängt von dessen Aufgabenstellung ab.

Question 3

Wie lassen sich Crawler aussperren oder steuern?

Accepted Answer

Mittels der robots.txt können Sie das Crawling verhindern. Beispiel: User-agent: Googlebot Disallow:
Mit Hilfe der Meta-Tags „nofollow“ oder „noindex“ ist es ebenfalls möglich dem Crawler mitzuteilen welcher Seite er nicht folgen oder indexieren soll.
Durch das Canonical Tag können Sie dem Crawler die Original-Seite mitteilen bzw. durch eine Sitemap.xml die Struktur aufzeigen.

Question 4

Welche Bedeutung haben Crawler im Bezug auf die SEO?

Accepted Answer

In der SEO sollte es von Interesse sein, Crawler gezielt auf der eigenen Website zu steuern. Jede Website besitzt ein Crawl Budget, so dass dieses bestmöglich für diese eingesetzt werden sollte. Durch gezielte Steuerung oder dem Aussperren, lässt sich dieses so effektiv wie möglich einsetzen. Achten Sie hierzu auf schnelle Ladezeiten, geringe Dateigrößen und schlanke Websiten-Architektur.

Crawler

Was ist ein Crawler?

Crawler in einem Video erklärt

Infografik zum Begriff Crawler

Wie funktioniert ein Crawler?

Wie lassen sich Crawler aussperren oder steuern?

Crawler und die Suchmaschinenoptimierung

Weiterführende Links