Muitas pessoas querem saber como arquivar um site e por que um grupo pode querer manter o histórico de um site. Por exemplo, uma agência governamental ou uma empresa que lida com dinheiro pode ser obrigada por lei a manter registros precisos de todos os dados do site. Ou a organização pode estar tentando se proteger de falsas alegações e roubo de conteúdo do site protegido por direitos de propriedade intelectual.
A matemática é importante para carreiras em ciência de dados porque é usada em algoritmos de aprendizado de máquina, análise de dados e obtenção de insights de dados. Embora a matemática não seja a única habilidade necessária para estudar e trabalhar em ciência de dados, geralmente é uma das mais importantes.
Quando o dinheiro para hospedagem acaba, as pessoas que seguem links para seu site de livros, o Kent Academic Repository (KAR) e a mídia social não poderão acessá-lo. O site não poderá ajudar com o UKRI Research Excellence Framework (REF) ou ser usado como prova para obter mais dinheiro. Mesmo que a Universidade de Kent hospede o site do seu projeto, ele durará apenas 5 anos.
3 maneiras: como arquivar o site
Salvar uma única página no computador local
Primeiro, vamos falar sobre a maneira mais fácil de resolver o problema. É ótimo se você precisar salvar apenas uma página e é ainda melhor que a maioria dos navegadores já tenha esse recurso. Comece abrindo seu navegador da Web favorito e acessando o site que deseja salvar. Após o carregamento da página, vá ao menu Arquivo do seu navegador e procure a opção Salvar página como:
A seguir, clique na opção para salvar a página. Isso abrirá uma caixa de diálogo em seu navegador. Escolha um nome para sua página aqui (embora o padrão esteja correto). Além disso, certifique-se de salvar a página inteira e não apenas o HTML. Isso manterá o site funcionando da melhor maneira possível.
Use um arquivo on-line (como o Wayback Machine)
Sem mostrar a você como o Wayback Machine funciona, nenhum tutorial estar completo. A boa notícia é que o processo é fácil. Além disso, lembre-se de que esse método permite salvar apenas páginas únicas (embora o serviço Archive-It de assinatura permita arquivar sites completos).
Para este método, vá para a página inicial do Wayback Machine e veja o formulário Save Page Now. Adicione a URL da página que deseja salvar a este formulário e clique no botão Salvar página. Dependendo do tamanho ou complexidade da página, você pode ter que esperar alguns minutos enquanto o rastreador e o mecanismo fazem seu trabalho.
É possível que a página pareça quebrada. Durante nossos testes, encontramos uma tela branca da morte (WSoD). Assim que a página for salva, no entanto, o Wayback Machine o enviará para a nova página.
Instalar a Camada de Integração de Arquivamento da Web
O primeiro passo neste método é baixar e instalar o WAIL em si. Existe um instalador dedicado para a ferramenta, o que é uma boa notícia (porém, como o programa é escrito em Python, ele usa o módulo PyInstaller).
Acesse o site WAIL e baixe o instalador que funciona com seu sistema operacional. Para Windows, descompacte o arquivo e, para macOS ventura, monte a imagem DMG. Na tela do macOS que aparece a seguir, arraste o ícone do aplicativo para a pasta Aplicativos. Se você estiver usando um computador com Windows 11, basta arrastar a pasta descompactada para a raiz da unidade C:. WAIL.app ou WAIL.exe podem ser executados (dependendo do seu sistema operacional). Depois de abrir o WAIL, você poderá ver sua interface simples.
Agora você tem três opções: visualizar um arquivo, verificar o status de um arquivo ou arquivar um site. Sua tendência natural pode ser ler da esquerda para a direita, o que torna os botões um pouco difíceis de entender.
Mas quando você inicializar, não terá nada em seus arquivos. Em vez disso, insira a URL do site que deseja salvar e clique em Arquivar agora! Você verá WAIL começar a procurar no site.
O que é arquivamento de sites?
O processo de salvar sites em um arquivo é chamado de “arquivamento da web”. Ao fazer capturas de tela em determinados momentos, as informações em cada página da web podem ser mantidas. Essas capturas de tela mantêm o contexto original, incluindo o conteúdo e a aparência. Ao manter as capturas de tela em um arquivo, elas estarão disponíveis para análise ou referência por um longo tempo.
Esse método é como o antigo modo de arquivamento, onde as pessoas costumavam manter papéis e documentos à mão. A ideia básica é a mesma: você escolhe a informação, salva e disponibiliza para as pessoas usarem no futuro.
Como a internet tem muita informação (mais de 1,5 bilhão sites, para ser exato), os arquivistas da web usam um processo que é feito automaticamente para salvar essas páginas da web. Usando rastreadores, os arquivistas podem percorrer várias páginas da Web e obter informações das fontes. Depois que essas informações são salvas, instantâneos delas são adicionados à coleção de arquivos da web.
Perguntas frequentes
O que é arquivo de captura de sites?
O arquivamento da web é o processo de salvar sites em um arquivo. Tirando capturas de tela em determinados momentos, as informações de cada página podem ser salvas. Essas capturas de tela mantêm o contexto original, incluindo o que estava na tela e sua aparência.
Existe um arquivo de sites?
O Internet Archive, uma organização sem fins lucrativos com sede em San Francisco, Califórnia, criou o Wayback Machine, que é um arquivo digital da World Wide Web. Foi feito em 1996 e lançado ao público em 2001. Ele permite que os usuários “voltem no tempo” para ver como os sites eram no passado.
Por que o arquivamento da web é importante?
Desde 1996, o Internet Archive e outros arquivos salvam partes da web. Isso fornece aos cientistas sociais uma grande quantidade de informações históricas sobre a web, história e cultura recentes e como a web mudou a maneira como as pessoas falam umas com as outras.