Crawler un site volumineux

Nouveau WRInaute
Bonjour, un client dispose d'un site volumineux en pages (44000) dont 11000 par langue (français, italien, espagnol et anglais), seules les pages en français sont actives (reçoivent des visites régulières), le crawl me pose problème car je n'arrive pas à trouver le tool pour le faire et surtout je pense à désindexer les pages en d'autres langues, j'ai besoin de vos conseils chers amis. Merci
 
Olivier Duffez (admin)
Membre du personnel
Je te propose de faire au moins un test avec mon crawler RM Tech (en gratuit tu auras des infos sur 10.000 URL). Le rapport gratuit est très réduit, pour te faire une idée du complet tu peux consulter cet exemple de rapport PDF (anonymisé).

D'ailleurs tu parles de pages actives/inactives, fais attention de ne pas désindexer une page juste parce qu'elle est inactive. Il vaut mieux rassembler plein d'infos sur chaque page afin de comprendre la cause du pb et de le corriger quand c'est possible. Lis les explications de ma méthode ici.

Lis aussi mon avis sur Screaming Frog, car un point important est le temps que tu passes à analyser les résultats (en plus des difficultés parfois à crawler des dizaines de milliers d'URL avec un logiciel desktop).
 
Nouveau WRInaute
Merci pour vos réponses, en fait mon objectif n'est pas d'aspirer des sites web mais plutôt d'alléger le site car le travail SEO en français que je fais est pénalisé par le volume de pages en les autres langues.
 
Discussions similaires
Haut