Archive.org n'indexe plus rien depuis le 22 août 2008 ?
Comme me l'a fait remarquer un membre de WebRankInfo, le site archive.org semble avoir cessé d'indexer des contenus depuis la fin du mois d'août 2008. A moins que ce soit seulement un problème temporaire de mise à disposition des archives ? Si quelqu'un a des informations sur le sujet, qu'il ou elle n'hésite pas en les fournir dans les commentaires.

Archive.org Wayback Machine, la mémoire du web
Le site archive.org s'est donné comme mission d'indexer de nombreuses copies d'un nombre incalculable de pages de sites web du monde entier. Il permet en quelque sorte de remonter dans le temps pour consulter l'historique du web.
Matt Cutts vient justement d'indiquer au cours de la conférence PubCon 2009 que si un site jugé potentiellement spammeur interdit archive.org de l'indexer, alors l'équipe anti-spam de Google pourrait considérer cela comme un signal d'alerte rouge...
Si aucune archive n'est enregistrée depuis fin août 2008 (cela reste à confirmer je pense), à quoi bon s'intéresser à ceux qui bloquent ce service ?
Peut-être n'est-ce qu'un problème momentané et que le service sera de nouveau disponible à l'avenir ?
Par Olivier Duffez
, Jeudi 19 novembre 2009
A propos de l'auteur : Olivier Duffez
![]()
Consultant indépendant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC, RueDuCommerce...). Il édite le site WebRankInfo.com qu'il a créé en 2002, devenu la plus grande communauté francophone sur le référencement (+ 200.000 membres et 1,3 million de posts). Il a également créé la société Ranking Metrics, leader des formations emarketing en France (référencement naturel, AdWords, Analytics, réseaux sociaux).
Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.
21 commentaires
Postez un commentaire !
Les champs marqués du signe * sont obligatoires. L'adresse email ne sera pas affichée.
En postant un commentaire, vous acceptez les CGU du site WebRankInfo.
Formation référencement et webmarketing
Venez chez Ranking Metrics vous former au référencement, à Google Analytics et aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (financement possible par OPCA, DIF...).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation agréé).
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo. Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
Catégories des dossiers
- Actualité
- Android
- Autres produits Google
- Brèves
- Conseils référencement
- Débuter en référencement
- Droit et Internet
- e-marketing
- Ecrire pour le web et le référencement
- Gmail
- Google AdSense
- Google AdWords
- Google Analytics
- Google Chrome
- Google Images
- Google Labs
- Google Maps
- Google Mobile
- Google News
- Google Search
- Google Toolbar
- Google Webmaster Tools
- Google+
- Indexation Google
- L'entreprise Google
- Les API de Google
- Livres sur le référencement et les moteurs de recherche
- Outils
- PageRank
- R&D référencement
- Ranking Metrics
- Référencement Bing
- Référencement des images
- Référencement et PHP
- Référencement local
- Référencement Yahoo
- Référencement Yandex
- Réseaux sociaux
- Sitemaps
- Stratégies de liens
- Stratégies de mots-clés
- Techniques de référencement
- Webmastering
- WebRankInfo
- YouTube
Sites de l'annuaire
- Tabsolutely
- Dance music tracklistings
- CasaReve immobilier Guadeloupe FNAIM Petites annonces
- Annonces immobilieres Guadeloupe FNAIM Antilles Guyane
- Trombiblog, widget gadget webcam pour votre blog ou site web
- Référencement de site
- Rayonnage industriels et solutions de stockage
- Référencement et positionnement de site internet Martinique et Guadeloupe



19 novembre 2009 à 23:11
Belle coincidence en effet, que cette constatation après les déclarations de MC :-)
19 novembre 2009 à 23:17
ça dure plus d'un an quand même....
20 novembre 2009 à 0:04
Ça serait bien dommage !
20 novembre 2009 à 8:00
Je ne suis pas du tout certain que archive.org ne soit plus actif. Aucun de nos clients n'y a de contenu visible après le 22/08. En revanche, certain des sites qui n'y étaient pas encore visible en octobre le sont maintenant.
A suivre !
20 novembre 2009 à 8:09
Des exemples ?
20 novembre 2009 à 10:39
A la vue du volume de données qu'ils ont a traiter, il me semble tout à fait normal qu'il existe un (gros) laps de temps entre le moment où la page est récupérée, et le moment où elle est indexée & publiée.
Par ailleurs, le volume de pages sur le web augmentant de manière exponentielle, ça ne doit pas être une tache simple pour eux techniquement...
20 novembre 2009 à 10:54
"Please note that there is a 6 - 14 month lag time between the date a site is crawled and the date it appears in the Wayback Machine. "
c'est dans la FAQ http://www.archive.org/about/faqs.php#18
20 novembre 2009 à 11:14
Je comprends bien qu'il puisse y avoir ce délai, mais a-t-il toujours existé et d'aussi grande durée ?
20 novembre 2009 à 18:36
@olivier
oui, ce délai semble exister depuis un moment (en tout cas en 2005, je suis pas allé loin), il suffisait de consulter les archives... de archive.org..
"Sites are usually crawled within 24 hours and no more then 48. Right now there is a 6-12 month lag between the date a site is crawled and the date it appears in the Wayback Machine. "
cf http://web.archive.org/web/20050101011942/www.archive.org/about/faqs.php
20 novembre 2009 à 22:22
Oui il y a toujours eu ce délai d'un an environ.
21 novembre 2009 à 13:17
Je connaissais pas ce site, vraiment Excellent. En espérant comme vous que l'archivage va recommencer prochainnement...
Merci pour cette découverte...
21 novembre 2009 à 21:49
Je me suis fait un script qui vérifie le nouveau contenu d'archive.org pour certain sites et je te confirme que, quand je reçois des alertes, c toujours pour des mises en cache qui datent d'il y a 1 an. Ma dernière alerte m'indique juillet 2008 par exemple. En revanche pour Zorgloob là plus de nouvelles du robots depuis un bail (il est même pas bloqué dans le robots.txt !) et pas de date postérieure à 2007 :-/ Encore un mystère d'archive.org à éclaircir...
21 novembre 2009 à 21:53
OK merci à tous pour vos commentaires !
23 novembre 2009 à 22:09
Peut être qu'ils sont en train de commander de nouveaux serveurs pour faire face à la quantité de plus en plus importante de pages web publiés sur le net... :d
24 novembre 2009 à 4:15
Bon... et après ca google ose prétendre qu'interdire archive.org peut nuire à notre santé ? ...
Comment peuvent-ils le savoir ? en regardant plus d'1 an plus tard ?
Car bon, j'ai personnellement interdit archive.org de mes sites, mais je ne me suis pas amusé à utiliser robots.txt évidemment.
12 décembre 2009 à 13:42
Bonjour
Il y a toujours eu un délai chez archive.org. Par contre un délai de plus de un an, je ne pense pas.
Nos derniers archivages remontent au 29 juillet pour nous
2 mars 2010 à 14:50
Bonjour,
Je confirme qu'il persiste toujours un délai chez Archive.org.
Wait & see ;)
15 mars 2010 à 20:23
archives.org est bien stoppé n'en déplaise à certains. Le délai n'a jamais été supérieur à 9 mois hormis certains cas de sites n'ayant plus été mit à jour depuis longtemps ou ayant connu des période de parking, etc... là ça fait quand même environs 20 mois (soit presque 2 ans).
3 avril 2010 à 11:50
Bonjour,
Oui effectivement archives.org est stoppé.
4 avril 2010 à 19:29
Qui peut-on croire ? Quelqu'un aurait-il un communiqué officiel ou une info de la source ?
Patricia
24 juin 2010 à 15:52
Visiblement, Archive.org n'a publié aucune des pages archivées après août 2008.
Ça fait donc près de 8 mois qu'aucun site ou page n'a été ajouté, et les plus récentes datant de 22 mois.
Dommage tout de même, c'était une excellente initiative.