Viele Leute möchten wissen, wie man eine Website archiviert und warum eine Gruppe den Verlauf einer Website aufbewahren möchte. Beispielsweise kann eine Regierungsbehörde oder ein Unternehmen, das mit Geld handelt, gesetzlich verpflichtet sein, genaue Aufzeichnungen über alle Website-Daten zu führen. Oder die Organisation könnte versuchen, sich vor falschen Behauptungen und Diebstahl von Website-Inhalten zu schützen, die durch geistige Eigentumsrechte geschützt sind.
Mathematik ist wichtig für Karrieren in der Datenwissenschaft, da sie in maschinellen Lernalgorithmen, Datenanalysen und dem Gewinnen von Erkenntnissen aus Daten verwendet wird. Auch wenn Mathematik nicht die einzige Fähigkeit ist, die Sie benötigen, um in Data Science zu studieren und zu arbeiten, ist sie in der Regel eine der wichtigsten.
Sobald das Geld für das Hosting aufgebraucht ist, folgen Personen Links zu Ihre Website aus Büchern, dem Kent Academic Repository (KAR) und sozialen Medien kann nicht darauf zugreifen. Die Website kann nicht beim UKRI Research Excellence Framework (REF) helfen oder als Beweis dafür dienen, mehr Geld zu bekommen. Selbst wenn die University of Kent Ihre Projekt-Website hostet, wird sie nur 5 Jahre lang aktiv sein.
3 Möglichkeiten: Website archivieren
Einzelne Seite auf lokalem Computer speichern
Lassen Sie uns zunächst über die einfachste Lösung des Problems sprechen. Es ist großartig, wenn Sie nur eine Seite speichern müssen, und es ist noch besser, dass die meisten Browser diese Funktion bereits haben. Öffnen Sie zunächst Ihren bevorzugten Webbrowser und gehen Sie zu der Website, die Sie speichern möchten. Sobald die Seite geladen ist, gehen Sie zum Menü Datei Ihres Browsers und suchen Sie nach der Option Seite speichern unter:
Klicken Sie dann auf die Option, um die Seite zu speichern. Dies öffnet ein Dialogfeld in Ihrem Browser. Wählen Sie hier einen Namen für Ihre Seite (obwohl die Standardeinstellung in Ordnung ist). Stellen Sie außerdem sicher, dass Sie die gesamte Seite und nicht nur den HTML-Code speichern. Es wird die Website so gut wie möglich am Laufen halten.
Verwenden Sie ein Online-Archiv (wie die Wayback-Maschine)
Ohne Ihnen zu zeigen, wie die Wayback-Maschine funktioniert, würde kein Tutorial dies tun vollständig sein. Die gute Nachricht ist, dass der Prozess einfach ist. Denken Sie auch daran, dass Sie mit dieser Methode nur einzelne Seiten speichern können (obwohl Sie mit dem Abonnementdienst Archive-It ganze Websites archivieren können).
Gehen Sie für diese Methode zur Startseite der Wayback Machine und sehen Sie sich das Formular Seite jetzt speichern an. Fügen Sie diesem Formular die URL der Seite hinzu, die Sie speichern möchten, und klicken Sie dann auf die Schaltfläche Seite speichern. Je nachdem, wie groß oder kompliziert die Seite ist, müssen Sie möglicherweise einige Minuten warten, während der Crawler und die Engine ihre Arbeit erledigen.
Es ist möglich, dass die Seite so aussieht, als wäre sie kaputt. Während unserer Tests stießen wir auf einen White Screen of Death (WSoD). Sobald die Seite jedoch gespeichert wurde, schickt Wayback Machine Sie zu der neuen Seite.
Installieren Sie die Integrationsschicht für die Webarchivierung
Der erste Schritt bei dieser Methode besteht darin, WAIL herunterzuladen und zu installieren selbst. Es gibt ein spezielles Installationsprogramm für das Tool, was eine gute Nachricht ist (da das Programm jedoch in Python geschrieben ist, verwendet es das PyInstaller-Modul).
Gehen Sie zur WAIL-Site und laden Sie das Installationsprogramm herunter, das mit Ihrem Betriebssystem funktioniert. Entpacken Sie die Datei für Windows und stellen Sie für macOS Ventura das DMG-Image bereit. Ziehen Sie auf dem nächsten macOS-Bildschirm das App-Symbol in Ihren Anwendungsordner. Wenn Sie einen Windows 11-Computer verwenden, ziehen Sie einfach den entpackten Ordner in das Stammverzeichnis Ihres Laufwerks C:. WAIL.app oder WAIL.exe können ausgeführt werden (abhängig von Ihrem Betriebssystem). Sobald Sie WAIL öffnen, können Sie seine einfache Benutzeroberfläche sehen.
Sie haben jetzt drei Möglichkeiten: ein Archiv anzeigen, den Status eines Archivs überprüfen oder eine Website archivieren. Ihre natürliche Tendenz ist möglicherweise, von links nach rechts zu lesen, wodurch die Schaltflächen etwas schwer zu verstehen sind.
Aber wenn Sie zum ersten Mal starten, haben Sie nichts in Ihren Archiven. Geben Sie stattdessen die URL der Website ein, die Sie speichern möchten, und klicken Sie auf Jetzt archivieren! Sie werden sehen, dass WAIL damit beginnt, die Website zu durchsuchen.
Was ist Website-Archivierung?
Das Speichern von Websites in einem Archiv wird als „Webarchivierung“ bezeichnet. Durch das Aufnehmen von Screenshots zu bestimmten Zeiten können die Informationen auf jeder Webseite beibehalten werden. Diese Screenshots behalten den ursprünglichen Kontext bei, einschließlich Inhalt und Aussehen. Durch das Aufbewahren von Screenshots in einem Archiv stehen sie für eine lange Zeit zur Analyse oder Referenz zur Verfügung.
Diese Methode ähnelt der alten Art der Archivierung, bei der die Leute früher Papiere und Dokumente von Hand aufbewahrten. Die Grundidee ist die gleiche: Sie wählen die Informationen aus, speichern sie und stellen sie den Menschen zur Verfügung, damit sie sie in Zukunft verwenden können.
Da das Internet viele Informationen enthält (mehr als 1,5 Milliarden Websites, um genau zu sein), verwenden Webarchivare einen Prozess, der automatisch durchgeführt wird, um diese Webseiten zu speichern. Mithilfe von Crawlern können sich Archivare über mehrere Webseiten bewegen und Informationen aus den Quellen abrufen. Sobald diese Informationen gespeichert sind, werden Momentaufnahmen davon der Webarchivsammlung hinzugefügt.
FAQ
Was ist ein Website-Erfassungsarchiv?
Webarchivierung ist der Prozess Webseiten in einem Archiv zu speichern. Durch das Aufnehmen von Screenshots zu bestimmten Zeiten können die Informationen auf jeder Seite gespeichert werden. Diese Screenshots behalten den ursprünglichen Kontext bei, einschließlich dessen, was auf dem Bildschirm zu sehen war und wie es aussah.
Gibt es ein Archiv von Websites?
Das Internetarchiv, eine gemeinnützige Organisation mit Sitz in San Francisco, Kalifornien, schuf die Wayback Machine, ein digitales Archiv des World Wide Web. Es wurde 1996 erstellt und 2001 der Öffentlichkeit zugänglich gemacht. Es lässt Benutzer „in der Zeit zurückgehen“, um zu sehen, wie Websites in der Vergangenheit aussahen.
Warum ist Webarchivierung wichtig?
Seit 1996 sichern das Internet Archive und andere Archive Teile des Webs. Dies gibt Sozialwissenschaftlern eine riesige Menge an historischen Informationen über das Internet, die jüngste Geschichte und Kultur und darüber, wie das Internet die Art und Weise verändert hat, wie Menschen miteinander sprechen.