Bonjour à toutes et à tous,
J'ai une petite question concernant des difficultés de crawl.
- Je n'arrive pas à crawler un site avec screaming frog et la quantité de mémoire n'est pas en cause : j'ai alloué 1.5 giga à SF et l'onglet "Debug" indique qu'il reste de la RAM dispo.
- Le problème semble venir du processeur, qui est à 100 % au bout de quelques milliers d'urls et le crawl s'arrête. Un petit processeur arrive à crawler 6000 pages et un I5 arrive péniblement à crawler 12 000 urls avant de bloquer. Le site comporte 50 000 pages.
- J'ai remarqué que les pages de ce site ont un très grand nombre de liens sortants : minimum 800 liens externes par page et çà monte à 2000, 4000 voire 11 000 liens sortants sur certaines pages. La plupart de ces liens "sortants" sont internes : ils envoient vers d'autres pages du site.
Pensez-vous qu'un aussi grand nombre de liens sortants par page puisse faire planter un crawl en consommant toutes les ressources processeur?
J'ai plutôt l'habitude des problèmes de crawl liés au manque de RAM et aux pages générées automatiquement... Votre avis m’intéresse!
Merci par avance.
Fred
J'ai une petite question concernant des difficultés de crawl.
- Je n'arrive pas à crawler un site avec screaming frog et la quantité de mémoire n'est pas en cause : j'ai alloué 1.5 giga à SF et l'onglet "Debug" indique qu'il reste de la RAM dispo.
- Le problème semble venir du processeur, qui est à 100 % au bout de quelques milliers d'urls et le crawl s'arrête. Un petit processeur arrive à crawler 6000 pages et un I5 arrive péniblement à crawler 12 000 urls avant de bloquer. Le site comporte 50 000 pages.
- J'ai remarqué que les pages de ce site ont un très grand nombre de liens sortants : minimum 800 liens externes par page et çà monte à 2000, 4000 voire 11 000 liens sortants sur certaines pages. La plupart de ces liens "sortants" sont internes : ils envoient vers d'autres pages du site.
Pensez-vous qu'un aussi grand nombre de liens sortants par page puisse faire planter un crawl en consommant toutes les ressources processeur?
J'ai plutôt l'habitude des problèmes de crawl liés au manque de RAM et aux pages générées automatiquement... Votre avis m’intéresse!
Merci par avance.
Fred