archive.today, Sauvegarde le Web

Le web est censé être une mémoire beaucoup plus performante que celle de l’être humain.

Dans les faits, oui c’est plus performant que notre petite mémoire, mais clairement pas infaillible.

Et parfois, le papier est de meilleur compagnie pour garder une trace de l’histoire que le web.

Tout ça est dû à comment et par qui le web est construit aujourd’hui.

Il est centralisé. Et c’est souvent 1 seule entreprise qui détient le contenu.

Et cette entreprise est soit une startup, soit une société côté en bourse qui doit répondre aux exigences des investisseurs.

Les entreprises meurent, et le contenu qu’elles possèdent avec.

Comme quand en 2009 GeoCities (l’ancêtre de Skyblog qui avait était racheté par Yahoo), ferme ses portes et supprime au passage 38 millions de pages.

Ou quand en 2019 Myspace annonce que toutes les données qui ont été uploadé sur le site avant 2016 ont été perdu (ça représente des millions de chansons, photos, vidéos), la faute à une migration de serveur qui c’est mal déroulé.

Tu as peut-être eu toi aussi ce genre d’expérience avec des sites moins connus que les deux précédents.

C’est quelque chose qui arrive régulièrement.

Et pourtant, internet pourrait être une formidable mémoire !

Le peer-to-peer permet d’avoir des sauvegardes sur plein de machines différentes.

La décentralisation permet d’avoir des sauvegardes sur plusieurs voir plein de serveurs différents.

Les données ne se dégradent pas avec le temps (contrairement à l’encre et au papier)

Techniquement, le web à toutes les caractéristiques pour être une super mémoire !

Aujourd’hui je te présente un outil qui va te permettre de profiter de cette super mémoire.

Cet outil c’est archive.today

Le fonctionnement est très simple :

Tu colles l’URL de la page que tu veux archiver et archive.today la sauvegarde, dès maintenant tu pourras y accéder même si la page en question est supprimée ou hors ligne.

La page comme tu la vois est sauvegardé. Avec le texte, les images, les commentaires. Seules les vidéos, les audios, les PDF, les flux RSS et les contenus flash ne sont pas sauvegardés.

Et plus de la copie similaire, il y a une capture d’écran.

Le texte est dupliqué dans 3 datacenters différent et les images dans 2 datacenters différent (sans doute pour économiser du stockage). Tous les datacenters sont en Europe.

Par contre, ta page doit faire moins de 50MO. (Généralement ça pèse beaucoup moins que ça).

Pour retrouver ton archive, tu as juste à taper le nom de domaine (ou l’URL exacte) de la page en question sur archive.today, et il va t’afficher toutes les archive qu’il a en stock pour ce nom de domaine ou cette URL.

(petite chose à savoir, les pages archivées sont publique) (et ton adresse IP est utilisée pour faire la capture)

Rien ne dit qu’archive.today ne va pas fermer.

Ce n’est pas une grosse entreprise qui est derrière.

Il y a juste le créateur qui finance le service de sa poche, en partie avec les dons qu’il reçoit (actuellement 217€/mois)

C’est pour ça que tu peux avoir en plus de la copie en ligne, une archive .zip avec à l’intérieur ta page, accessible en hors-ligne.

Un Bookmarklet et aussi disponible pour archiver une page en 1 clic.

Dans le même style qu’archive.today, l’excellent Internet Archive propose aussi de sauvegarder une page sur demande, ça se sait peu, mais c’est possible ! (je viens de le découvrir en faisant les recherches pour cet article).

On a l’habitude de regarder si une page a déjà été archivée sur internet archive, mais tu peux aussi toi-même demandé qu’une page soit archivée, et c’est instantané !

Pour ça il faut te rendre sur cette adresse : archive.org/web/

Et coller le lien de la page à archiver en dessous de « Save Page Now »

Tu clic sur le bouton « SAVE PAGE » et voilà. Ta page est sauvegardée sur Internet Archive. Par contre tu n’as pas de .zip que tu peux télécharger contrairement à archive.today

(tu as aussi d’autres options possible)

Avec archive.today + Internet Archive, tu devrais avoir une sauvegarde plutôt éternelle de ta page !

Que ça soit pour sauvegarder une page de ton blog que tu vas supprimer publiquement, mais dont tu as envie de garder une copie en privée, ou bien un article d’un journal que tu n’as pas envie de voir disparaître, ça sera de très bonnes solutions.

Et si jamais tu as envie de retrouver une sauvegarde, mais tu n’es plus vraiment sûr d’où elle se trouve, tu peux utiliser time travel qui va se charger de scanner archive.today, internet archive et d’autres site du même genre pour la trouver.

Avec ça tu réduis déjà pas mal les troues de mémoire d’internet.

ACCÉDER À archive.today

Récapitulatif :

Archive les pages.
Sauvegarde les textes et les images.
Ne sauvegarde pas les vidéos, les audios, PDF, flux RSS et contenu flash.
Taille max de page archivé : 50MO.
Le texte sauvegardé est dupliqué dans 3 datacenters, les images dans 2.
Tous les datacenters sont en Europe.
Tu peux télécharger le .zip de ton archive.
Tu peux archiver une page en 1 clic grâce au Bookmarklet.
Ton IP est utilisé pour faire la capture de la page.
Financé de la poche du créateur et avec des dons.

📧🦜Un perroquet t’attend…
..avec un mail dans son bec !

Pas facile de suivre un blog que tu apprécies, pas vrai ?

Je sais aussi que c’est chiant de recevoir des newsletters sans intérêts qui encombrent ta boite mail.

Alors je te propose un truc très simple :

  • Tu laisses ton adresse e-mail.
  • Et tous les vendredi, tu reçois 1 seul mail, avec à l’intérieur les articles complets de la semaine (tu pourras les lires sans quitter ta boite de réception !).

Cool, non ? (Oui, le mail est apporté par un perroquet)

Si tu as un commentaire sur l’orthographe : je te remercie, mais l’orthographe ne m’intéresse pas.

4
Un Commentaire ? :)

3 Auteurs du commentaire
  S’abonner  
Notifier de
xx jjh

Quelle différence avec archive.org que vous évoquez ?
Pourquoi ne pas rejoindre/financer/supporter archive.org plutôt que refaire la même ?

Marc

Si c’est pour sauvegarder à usage personnel, des outils comme httrack font très bien le boulot ! Tu auras ton zip, et à toi de le gérer ensuite 🙂

Fermer le menu