Archive.org n’indexe plus rien depuis le 22 août 2008 ?
Comme me l'a fait remarquer un membre de WebRankInfo, le site archive.org semble avoir cessé d'indexer des contenus depuis la fin du mois d'août 2008. A moins que ce soit seulement un problème temporaire de mise à disposition des archives ? Si quelqu'un a des informations sur le sujet, qu'il ou elle n'hésite pas en les fournir dans les commentaires.

Archive.org Wayback Machine, la mémoire du web
Le site archive.org s'est donné comme mission d'indexer de nombreuses copies d'un nombre incalculable de pages de sites web du monde entier. Il permet en quelque sorte de remonter dans le temps pour consulter l'historique du web.
Matt Cutts vient justement d'indiquer au cours de la conférence PubCon 2009 que si un site jugé potentiellement spammeur interdit archive.org de l'indexer, alors l'équipe anti-spam de Google pourrait considérer cela comme un signal d'alerte rouge…
Si aucune archive n'est enregistrée depuis fin août 2008 (cela reste à confirmer je pense), à quoi bon s'intéresser à ceux qui bloquent ce service ?
Peut-être n'est-ce qu'un problème momentané et que le service sera de nouveau disponible à l'avenir ?
Olivier Duffez, Jeudi 19 novembre 2009
Formation référencement et webmarketing
Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).
Lectures recommandées sur ce thème :
- Outil de test d'indexation Google + analyse de l'âge d'un site
- Un (RSS) pour tous (les blogs officiels de Google)
- Microsoft rachète Powerset, moteur de recherche sémantique
- Mise à jour des services Postini
- Affichage de la description DMOZ dans MSN Search
- Les robots MSNbot de Live Search
- Dell propose une page d'accueil Google personnalisée
- Opérateurs de recherche avancée sur MSN
- Google Suggest API
- Microsoft désactive les opérateurs link: et linkdomain:
- [Google] Numérisation et archive des Magazines imprimés
- Site archive
- Web archive
- La BNF archive...
- WEB ARCHIVE DEAD .?
- No Archive (balise meta NOARCHIVE)
- En surfant sur Archive.org, j'ai découvert que...
- [réglé] archive.org dé-indexer mes pages ?
- Dézipper une archive après l'avoir uploadée ??
- cherche site équivalent de archive.org pour les images
- [archivage] Un site qui archive toutes les pages du monde???
- [Gmail] Nouvelle fonction Gmail "Send & Archive"
- Wayback Machine
Consultez la description détaillée des produits ou services de Google suivants : Google News Archive Search
- Tester l'indexation récente d'un site dans Google
Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org).
16 commentaires sur “Archive.org n’indexe plus rien depuis le 22 août 2008 ?”
Laisser une réponse
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
A la une sur WebRankInfo
Formation au référencement
Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.
Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !
Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.
Logiciel de pro
Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.
Derniers sites inscrits
- Guillaume Jan, Wildlife and Nature Photographer
- Blog mariage : informations et idées - Chalama
- Art'mail CONSEIL, Agence Conseil en Communication Digitale, Paris
- Pizza Pam - Pizzas à emporter ou à livrer à Pont-à-Mousson
- ADF Pneus à Jarny, vente de pneumatiques
- Moldes Barcelona fabrication de moules pour l'injection
- Isolation thermique, peinture en bâtiment (92)
- Permis de construire, administratif photovoltaïque, déclaration préalable
- Folie Cosmetic : maquillage et produits de beauté pas cher
- Beauté maquillage manucure à Nangeville
- Application de peinture industrielle, revêtements de murs Rhône-Alpes
- Entreprise d'électricité générale à Clary (59)
- Festival Arts Martiaux Perpignan 15 Mai 2010
- MGL, vente et location de mini grues
- Les caniches de la Garrigue des Eaux Vives



Belle coincidence en effet, que cette constatation après les déclarations de MC :-)
ça dure plus d’un an quand même….
Ça serait bien dommage !
Je ne suis pas du tout certain que archive.org ne soit plus actif. Aucun de nos clients n’y a de contenu visible après le 22/08. En revanche, certain des sites qui n’y étaient pas encore visible en octobre le sont maintenant.
A suivre !
Des exemples ?
A la vue du volume de données qu’ils ont a traiter, il me semble tout à fait normal qu’il existe un (gros) laps de temps entre le moment où la page est récupérée, et le moment où elle est indexée & publiée.
Par ailleurs, le volume de pages sur le web augmentant de manière exponentielle, ça ne doit pas être une tache simple pour eux techniquement…
« Please note that there is a 6 – 14 month lag time between the date a site is crawled and the date it appears in the Wayback Machine. »
c’est dans la FAQ http://www.archive.org/about/faqs.php#18
Je comprends bien qu’il puisse y avoir ce délai, mais a-t-il toujours existé et d’aussi grande durée ?
@olivier
oui, ce délai semble exister depuis un moment (en tout cas en 2005, je suis pas allé loin), il suffisait de consulter les archives… de archive.org..
« Sites are usually crawled within 24 hours and no more then 48. Right now there is a 6-12 month lag between the date a site is crawled and the date it appears in the Wayback Machine. »
cf http://web.archive.org/web/20050101011942/www.archive.org/about/faqs.php
Oui il y a toujours eu ce délai d’un an environ.
Je connaissais pas ce site, vraiment Excellent. En espérant comme vous que l’archivage va recommencer prochainnement…
Merci pour cette découverte…
Je me suis fait un script qui vérifie le nouveau contenu d’archive.org pour certain sites et je te confirme que, quand je reçois des alertes, c toujours pour des mises en cache qui datent d’il y a 1 an. Ma dernière alerte m’indique juillet 2008 par exemple. En revanche pour Zorgloob là plus de nouvelles du robots depuis un bail (il est même pas bloqué dans le robots.txt !) et pas de date postérieure à 2007 :-/ Encore un mystère d’archive.org à éclaircir…
OK merci à tous pour vos commentaires !
Peut être qu’ils sont en train de commander de nouveaux serveurs pour faire face à la quantité de plus en plus importante de pages web publiés sur le net… :d
Bon… et après ca google ose prétendre qu’interdire archive.org peut nuire à notre santé ? …
Comment peuvent-ils le savoir ? en regardant plus d’1 an plus tard ?
Car bon, j’ai personnellement interdit archive.org de mes sites, mais je ne me suis pas amusé à utiliser robots.txt évidemment.
Bonjour
Il y a toujours eu un délai chez archive.org. Par contre un délai de plus de un an, je ne pense pas.
Nos derniers archivages remontent au 29 juillet pour nous