Search Console Indexation de milliers de pages d'un site de dizaines de pages

Nouveau WRInaute
Bonjour tout le monde,

Je travaille sur un site d'hôtel au Maroc. Dernièrement, j'ai remarqué une hausse très importante de nombre des pages explorées sur le Search Console (près de 90 000 pages) mais le site n'a qu'une dizaines de pages.
Ces pages sont en .pdf et il redirige vers d'autres sites.
quand je fait un vérification du sitemap.xml, il ne contient aucune de ces pages.

Est-ce que quelqu'un a eu ce problème avant? je vous prie de me donner votre avis sur ce problème.

En vous remerciant.
 
WRInaute impliqué
Les sitemaps ne sont qu'une indication donnée à Google de ce que tu veux être exploré, mais Google ne se restreint pas à ces URL.
As-tu ouvert l'un de ces PDF pour voir ce qu'il contient ? Car Google suit aussi les liens vers les PDF, et si ces PDF sont générés automatiquement, Google peut boucler à l'infini.
Par exemple, il trouve un lien vers 1.pdf.
Ce fichier 1.pdf contient un lien vers un site externe, et un lien vers 2.pdf.
Google consultera 2.pdf, qui contient un lien vers un site externe, et un site vers 3.pdf
etc.

Si ce sont des liens vers des sites externes, je pencherais pour un script malicieux qu'il faudra que tu trouves et élimine.
Pour commencer, si les extensions des fichiers sont en .pdf et qu'il n'y a pas de fichier .pdf correspondant sur ton serveur, cherche dans un fichier .htaccess ou dans la configuration de ton serveur : tu devrais y trouver l'emplacement du script qui génère les fichiers pdf.
 
WRInaute occasionnel
Tu peux aussi regarder tes logs apaches pour voir ce que le bots a fait. (disponible sur ton herbergement normalement)
 
Discussions similaires
Haut