De nombreuses personnes veulent savoir comment archiver un site Web et pourquoi un groupe peut souhaiter conserver l’historique d’un site Web. Par exemple, une agence gouvernementale ou une entreprise qui traite de l’argent peut être tenue par la loi de conserver des enregistrements précis de toutes les données du site Web. Ou, l’organisation pourrait essayer de se protéger contre les fausses déclarations et le vol de contenu de site Web protégé par des droits de propriété intellectuelle.
Les mathématiques sont importantes pour les carrières en science des données, car elles sont utilisées dans les algorithmes d’apprentissage automatique, l’analyse des données et l’obtention d’informations à partir des données. Même si les mathématiques ne sont pas la seule compétence dont vous aurez besoin pour étudier et travailler dans le domaine de la science des données, c’est généralement l’une des plus importantes.
Une fois que l’argent pour l’hébergement est épuisé, les personnes qui suivent les liens vers votre site à partir de livres, du Kent Academic Repository (KAR) et des médias sociaux ne pourront pas y accéder. Le site ne pourra pas aider avec le UKRI Research Excellence Framework (REF) ou être utilisé comme preuve pour obtenir plus d’argent. Même si l’Université du Kent héberge le site Web de votre projet, celui-ci ne sera disponible que pendant 5 ans.
3 façons: comment archiver un site Web
Enregistrer une seule page sur un ordinateur local
Tout d’abord, parlons de la manière la plus simple de résoudre le problème. C’est génial si vous n’avez besoin d’enregistrer qu’une seule page, et c’est encore mieux que la plupart des navigateurs disposent déjà de cette fonctionnalité. Commencez par ouvrir votre navigateur Web préféré et accédez au site que vous souhaitez enregistrer. Une fois la page chargée, accédez au menu Fichier de votre navigateur et recherchez l’option Enregistrer la page sous :
Ensuite, cliquez sur l’option pour enregistrer la page. Cela fera apparaître une boîte de dialogue dans votre navigateur. Choisissez un nom pour votre page ici (bien que la valeur par défaut soit correcte). Assurez-vous également d’enregistrer la page entière et pas seulement le code HTML. Cela maintiendra le site opérationnel aussi bien que possible.
Utilisez une archive en ligne (telle que la Wayback Machine)
Sans vous montrer comment fonctionne la Wayback Machine, aucun tutoriel ne serait être complet. La bonne nouvelle est que le processus est simple. Gardez également à l’esprit que cette méthode ne vous permet d’enregistrer que des pages uniques (bien que le service d’abonnement Archive-It vous permette d’archiver des sites complets).
Pour cette méthode, rendez-vous sur la page d’accueil de la Wayback Machine et consultez le formulaire Enregistrer la page maintenant. Ajoutez l’URL de la page que vous souhaitez enregistrer dans ce formulaire, puis cliquez sur le bouton Enregistrer la page. Selon la taille ou la complexité de la page, vous devrez peut-être attendre quelques minutes pendant que le robot d’exploration et le moteur font leur travail.
Il est possible que la page semble cassée. Lors de nos tests, nous avons rencontré un écran blanc de la mort (WSoD). Cependant, une fois la page enregistrée, Wayback Machine vous renverra à la nouvelle page.
Installer la couche d’intégration de l’archivage Web
La première étape de cette méthode consiste à télécharger et à installer WAIL lui-même. Il existe un programme d’installation dédié pour l’outil, ce qui est une bonne nouvelle (cependant, comme le programme est écrit en Python, il utilise le module PyInstaller).
Allez sur le site WAIL et téléchargez le programme d’installation qui fonctionne avec votre système d’exploitation. Pour Windows, décompressez le fichier et pour macOS Ventura, montez l’image DMG. Sur l’écran macOS qui s’affiche ensuite, faites glisser l’icône de l’application vers votre dossier Applications. Si vous utilisez un ordinateur Windows 11, faites simplement glisser le dossier décompressé à la racine de votre lecteur C:. WAIL.app ou WAIL.exe peuvent être exécutés (selon votre système d’exploitation). Une fois que vous aurez ouvert WAIL, vous pourrez voir son interface simple.
Vous avez maintenant trois choix : afficher une archive, vérifier l’état d’une archive ou archiver un site Web. Votre tendance naturelle peut être de lire de gauche à droite, ce qui rend les boutons un peu difficiles à comprendre.
Mais au premier démarrage, vous n’aurez rien dans vos archives. Au lieu de cela, entrez l’URL du site que vous souhaitez enregistrer et cliquez sur Archiver maintenant ! Vous verrez WAIL commencer à parcourir le site Web.
Qu’est-ce que l’archivage de site Web ?
Le processus d’enregistrement de sites Web dans une archive est appelé”archivage Web”. En prenant des captures d’écran à certains moments, les informations sur chaque page Web peuvent être conservées. Ces captures d’écran conservent le contexte d’origine, y compris le contenu et son apparence. En conservant les captures d’écran dans une archive, elles seront disponibles pour analyse ou référence pendant longtemps.
Cette méthode ressemble un peu à l’ancienne méthode d’archivage, où les gens gardaient les papiers et les documents à la main. L’idée de base est la même : vous choisissez l’information, la sauvegardez et la mettez à la disposition des gens pour qu’ils puissent l’utiliser à l’avenir.
Comme Internet contient beaucoup d’informations (plus de 1,5 milliard sites Web, pour être exact), les archivistes Web utilisent un processus qui se fait automatiquement pour enregistrer ces pages Web. À l’aide de robots d’exploration, les archivistes peuvent se déplacer sur plusieurs pages Web et obtenir des informations à partir des sources. Une fois ces informations enregistrées, des instantanés de celles-ci sont ajoutés à la collection d’archives Web.
FAQ
Qu’est-ce qu’une archive de capture de site Web ?
L’archivage Web est le processus d’enregistrer des sites Web dans une archive. En prenant des captures d’écran à certains moments, les informations sur chaque page peuvent être enregistrées. Ces captures d’écran conservent le contexte d’origine, y compris ce qui était à l’écran et à quoi il ressemblait.
Existe-t-il une archive des sites Web ?
The Internet Archive, une organisation à but non lucratif basée à San Francisco, en Californie, a créé la Wayback Machine, qui est une archive numérique du World Wide Web. Il a été créé en 1996 et rendu public en 2001. Il permet aux utilisateurs de”remonter le temps”pour voir à quoi ressemblaient les sites Web dans le passé.
Pourquoi l’archivage Web est-il important ?
Depuis 1996, Internet Archive et d’autres archives sauvegardent des parties du Web. Cela donne aux spécialistes des sciences sociales une énorme quantité d’informations historiques sur le Web, l’histoire et la culture récentes, et sur la façon dont le Web a changé la façon dont les gens se parlent.