Archive.today
| Adresse | Site officiel | |
|---|---|---|
| Publicité | non | |
| Type de site | Archivage web | |
| Langue | français | |
| Inscription | non | |
| Lancement | 2012 | |
| État actuel | actif | |
| modifier |
||
Archive.today, anciennement archive.is, est un site web d'archivage des pages du web. Il fonctionne en utilisant Apache Hadoop et Apache Accumulo.
Créateur
[modifier | modifier le code]Parce que le site ne donne aucune indication sur son créateur ou sur son modèle économique[1], certaines personnes dont le blogueur Jani Patokallio se sont mises à la recherche de son créateur qui pourrait être un certain Denis Petrov[2] basé à New-York.
En novembre 2025, le site fait l'objet d'une enquête du Federal Bureau of Investigation pour identifier ses exploitants[3].
Particularité
[modifier | modifier le code]La particularité du site est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier robots.txt[4]. Il est par conséquent impossible d'interdire l'archivage de tout site, ce qui explique les critiques fréquentes à son encontre.
Retrait des liens de Wikipédia
[modifier | modifier le code]Début 2026, une consultation menée sur la version anglophone de Wikipédia[5] a abouti à un consensus appelant à l'inscription d'archive.today sur liste noire. Les contributeurs wikipedia procèdent à la suppression d'environ 695 000 liens vers le site pour les substituer par les sources originales ou par des archives fiables, comme Wayback Machine d'Internet Archive[6].
Cette décision est la conséquence de plusieurs comportements problématiques du gestionnaire du site ; ce dernier avait inséré du code dans son captcha pour que le visiteur d'archive.today participe à une attaque par déni de service contre le blog de Jani Patokallio, un journaliste qui tentait de l'identifier[7],[8],[9].
Références
[modifier | modifier le code]- ↑ (en) Archive.Today, « FAQ »
, sur Archive.Today (consulté le )
- ↑ (en) TrueDetective, « On which country are the creators and servers of archive.today / archive.is based? »
, sur Stack Exchange (consulté le )
- ↑ Raphaël Raffray, « Qui se cache derrière le mystérieux site Archive.today? Le FBI mène une enquête pour lever le voile sur ce site qui permet d'accéder gratuitement aux médias payants »
, sur BFM TV, (consulté le )
- ↑ (en) « Comparison of web archiving services », sur dandascalescu.com, (consulté le ).
- ↑ (en) « Wikipedia:Requests for comment/Archive.is RFC 5 », dans Wikipedia, (lire en ligne)
- ↑ (en) Jon Brodkin, « Wikipedia blacklists Archive.today, starts removing 695,000 archive links », sur Ars Technica, (consulté le )
- ↑ (en) jpatokal, « archive.today: On the trail of the mysterious guerrilla archivist of the Internet », sur Gyrovague, (consulté le )
- ↑ (en-US) Anthony Ha, « Wikipedia blacklists Archive.today after alleged DDoS attack », sur TechCrunch, (consulté le )
- ↑ Korben, « Wikipedia vs archive.today - 700 000 liens en sursis - Korben », sur Le site de Korben, (consulté le )
Voir aussi
[modifier | modifier le code]Articles connexes
[modifier | modifier le code]Liens externes
[modifier | modifier le code]- (en) « Create publicly available web page archives with Archive.is », sur ghacks.net.