Aller au contenu

Archive.today

Un article de Wikipédia, l'encyclopédie libre.
(Redirigé depuis Archive.is)

Logo de Archive.today

Image illustrative de l’article Archive.today

Adresse Site officiel
Publicité non
Type de site Archivage web
Langue français
Inscription non
Lancement 2012
État actuel actif

Archive.today, anciennement archive.is, est un site web d'archivage des pages du web. Il fonctionne en utilisant Apache Hadoop et Apache Accumulo.

Parce que le site ne donne aucune indication sur son créateur ou sur son modèle économique[1], certaines personnes dont le blogueur Jani Patokallio se sont mises à la recherche de son créateur qui pourrait être un certain Denis Petrov[2] basé à New-York.

En novembre 2025, le site fait l'objet d'une enquête du Federal Bureau of Investigation pour identifier ses exploitants[3].

Particularité

[modifier | modifier le code]

La particularité du site est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier robots.txt[4]. Il est par conséquent impossible d'interdire l'archivage de tout site, ce qui explique les critiques fréquentes à son encontre.

Retrait des liens de Wikipédia

[modifier | modifier le code]

Début 2026, une consultation menée sur la version anglophone de Wikipédia[5] a abouti à un consensus appelant à l'inscription d'archive.today sur liste noire. Les contributeurs wikipedia procèdent à la suppression d'environ 695 000 liens vers le site pour les substituer par les sources originales ou par des archives fiables, comme Wayback Machine d'Internet Archive[6].

Cette décision est la conséquence de plusieurs comportements problématiques du gestionnaire du site ; ce dernier avait inséré du code dans son captcha pour que le visiteur d'archive.today participe à une attaque par déni de service contre le blog de Jani Patokallio, un journaliste qui tentait de l'identifier[7],[8],[9].

Références

[modifier | modifier le code]
  1. (en) Archive.Today, « FAQ » Accès libre, sur Archive.Today (consulté le )
  2. (en) TrueDetective, « On which country are the creators and servers of archive.today / archive.is based? » Accès libre, sur Stack Exchange (consulté le )
  3. Raphaël Raffray, « Qui se cache derrière le mystérieux site Archive.today? Le FBI mène une enquête pour lever le voile sur ce site qui permet d'accéder gratuitement aux médias payants » Accès libre, sur BFM TV, (consulté le )
  4. (en) « Comparison of web archiving services », sur dandascalescu.com, (consulté le ).
  5. (en) « Wikipedia:Requests for comment/Archive.is RFC 5 », dans Wikipedia, (lire en ligne)
  6. (en) Jon Brodkin, « Wikipedia blacklists Archive.today, starts removing 695,000 archive links », sur Ars Technica, (consulté le )
  7. (en) jpatokal, « archive.today: On the trail of the mysterious guerrilla archivist of the Internet », sur Gyrovague, (consulté le )
  8. (en-US) Anthony Ha, « Wikipedia blacklists Archive.today after alleged DDoS attack », sur TechCrunch, (consulté le )
  9. Korben, « Wikipedia vs archive.today - 700 000 liens en sursis - Korben », sur Le site de Korben, (consulté le )

Articles connexes

[modifier | modifier le code]

Liens externes

[modifier | modifier le code]