Websites auf der Festplatte sichern

"Nichts ist beständiger als der Wandel," sagte wohl Heraklit. Und das stimmt, - auch und besonders wenn es um den Inhalt von Websites geht. Wenn Sie eine Website lokal auf Ihrem PC speichern wollen, um Daten beim Umstieg auf ein neues System zu sichern, die Seite offline zu präsentieren oder um Design und Inhalt zu archivieren, dann brauchen Sie einen so genannten Webcrawler.

Zwar bieten auch die Browser die Möglichkeit, Seiten zu speichern. Dies ist aber eher umständlich, da Sie so jede Unterseite Ihres Webauftritts einzeln speichern müssten und auch die Links nicht mehr richtig funktionieren. Teilweise schaffen Browser-Addons hier Abhilfe. Es gibt aber auch Spezialisten für diese Anforderung: Mit einem Webcrawler können Sie mit einer Aktion Ihre gesamte Seite so abspeichern, dass Sie sie danach im Browser öffnen und benutzen können. Lediglich die Dinge, die extern aus dem Netz geladen werden, sind offline natürlich nicht verfügbar.

Ein Webcrawler (oder Bot oder Spider) kann ganz verschiedene Aufgaben in der Netzwelt erfüllen. Bots versorgen Suchmaschinen mit den aktuellen Informationen. Crawler können nach Stichworten suchen, Mailadressen heraus filtern oder sich auf der Suche nach einem anderen Objekt der Begierde spinnengleich an den Fäden des www entlang hangeln.

Für unsere Aufgabe braucht es einen Crawler, der sich durch die Verzweigungen eines Webauftrittes bewegt, diese Daten speichert und dabei die Struktur der Seite offline so ablegt, dass die Seite aus den abgespeicherten Daten heraus möglichst gut funktioniert.

Für diese Aufgabe gibt es viele Möglichkeiten. Viel genutzt und gemeinhin für gut befunden wären z.B.:

Die Links führen Sie auf die Herstellerseiten. Wir haben die Software teils nicht in der aktuellsten Version eingesetzt, aber gute Erfahrungen gemacht. Sinnvoll ist es, nach dem Speichern die Seite offline aufzurufen, um zu überprüfen, dass auch alles (und nicht viel mehr) gespeichert wurde, als Sie benötigen. Andernfalls müssten Sie die Optionen nochmal anpassen.

 

Dieser Blogbeitrag wurde am 15. Oktober 2014  auf netzmarginalien.de veröffentlicht. wir-machen-kinderseiten.de publiziert regelmäßig ausgewählte Blogbeiträge von netzmarginalien.de.

Neuen Kommentar schreiben

Mit einem Sternchen (*) versehene Felder sind Pflichtfelder und müssen ausgefüllt werden.

Sollten Sie einen Beitrag löschen oder korrigieren wollen, melden Sie sich bitte unter der im Impressum angegebenen E-Mail-Adresse.
C
z
K
s
h
e
Die Zeichenfolge ohne Leerstellen eingeben.