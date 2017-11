So laden Sie Internetseiten richtig herunter

Um eine einzelne Seite aus dem Internet zu speichern, können Sie einfach Ihren Browser verwenden. Gerade die interessantesten Texte sind aber oft in viele Seiten unterteilt. Wie lädt man die im Ganzen herunter?

Windows+Linux / Englisch / Open Source. Texte in einem Buch sind am Rücken zusammengeheftet, so dass sie nicht auseinanderfallen. Zudem sind Bilder (falls vorhanden) ebenso fest mit dem Papier verbunden wie die Buchstaben.



Das finden Sie selbstverständlich? Im Internet ist es das keineswegs. Längere Texte im Netz hängen bei weitem nicht so eng zusammen wie die Seiten eines Buches. Bilder können ganz woanders gespeichert sein als die Buchstaben. Die vielen Einzelteile sucht sich der Computer in dem Moment zusammen, in dem Sie die Seite aufrufen. Wo die nächste Seite zu finden ist, ermittelt Ihr Computer in einem hochkomplizierten Zwiegespräch mit dem Internetserver.



Zum Glück klappt das meistens. Aber wegen dieser Komplikationen ist es gar nicht so einfach, einen Verbund aus mehreren Internetseiten mit Bildern so herunterzuladen, dass er auch offline noch funktioniert. Mit dem mächtigen Kommandozeilenwerkzeug wget klappt es trotzdem. Wenn man es schafft, die richtigen Optionen auszuklamüsern.



Mit diesen Optionen funktioniert es:

wget -m -p -k -E hodoku.sourceforge.net/de/docs.php



Das Beispiel lädt das Benutzerhandbuch des faszinierenden Sudoku-Spiels "HoDoKu" herunter. Ersetzen Sie die Adresse durch die Startadresse der Seiten, die Sie laden möchten.



Dabei sorgt das -p dafür, dass alle Bestandteile der Seiten im Zusammenhang heruntergeladen werden. Mit dem -k werden alle Links so umgewandelt, dass man die Seiten auch offline durchklicken kann. Das -E hängt an alle Dateien die Endung .html an, damit der Browser sie als Webseiten erkennt. Und das -m bewirkt, dass alle Seiten und Unterseiten eines Ordners geladen werden.



