1. ✅ Apprenez une METHODE qui marche pour votre SEO ! Formation à distance avec Olivier Duffez et Fabien Facériès + aide pour prise en charge du financement
    Rejeter la notice

Search Console Indexation de milliers de pages d'un site de dizaines de pages

Discussion dans 'Crawl et indexation Google, sitemaps' créé par elg.digital, 26 Juillet 2019.

  1. elg.digital
    elg.digital Nouveau WRInaute
    Inscrit:
    19 Février 2013
    Messages:
    2
    J'aime reçus:
    0
    Bonjour tout le monde,

    Je travaille sur un site d'hôtel au Maroc. Dernièrement, j'ai remarqué une hausse très importante de nombre des pages explorées sur le Search Console (près de 90 000 pages) mais le site n'a qu'une dizaines de pages.
    Ces pages sont en .pdf et il redirige vers d'autres sites.
    quand je fait un vérification du sitemap.xml, il ne contient aucune de ces pages.

    Est-ce que quelqu'un a eu ce problème avant? je vous prie de me donner votre avis sur ce problème.

    En vous remerciant.
     
  2. colonies
    colonies WRInaute impliqué
    Inscrit:
    10 Septembre 2006
    Messages:
    556
    J'aime reçus:
    67
    Les sitemaps ne sont qu'une indication donnée à Google de ce que tu veux être exploré, mais Google ne se restreint pas à ces URL.
    As-tu ouvert l'un de ces PDF pour voir ce qu'il contient ? Car Google suit aussi les liens vers les PDF, et si ces PDF sont générés automatiquement, Google peut boucler à l'infini.
    Par exemple, il trouve un lien vers 1.pdf.
    Ce fichier 1.pdf contient un lien vers un site externe, et un lien vers 2.pdf.
    Google consultera 2.pdf, qui contient un lien vers un site externe, et un site vers 3.pdf
    etc.

    Si ce sont des liens vers des sites externes, je pencherais pour un script malicieux qu'il faudra que tu trouves et élimine.
    Pour commencer, si les extensions des fichiers sont en .pdf et qu'il n'y a pas de fichier .pdf correspondant sur ton serveur, cherche dans un fichier .htaccess ou dans la configuration de ton serveur : tu devrais y trouver l'emplacement du script qui génère les fichiers pdf.
     
  3. freestyle83
    freestyle83 WRInaute occasionnel
    Inscrit:
    19 Novembre 2011
    Messages:
    399
    J'aime reçus:
    16
    Tu peux aussi regarder tes logs apaches pour voir ce que le bots a fait. (disponible sur ton herbergement normalement)
     
  4. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 789
    J'aime reçus:
    452
  5. elg.digital
    elg.digital Nouveau WRInaute
    Inscrit:
    19 Février 2013
    Messages:
    2
    J'aime reçus:
    0
    Merci beaucoup pour ces informations,
    J'essaie de suivre vos conseils pour voir ce que ça donne par la suite.
     
Chargement...
Similar Threads - Indexation milliers dizaines Forum Date
Indexation puis desindexation de milliers de pages Référencement Google 16 Avril 2013
Erreur d'indexation Google pour mes fichiers PDF Crawl et indexation Google, sitemaps 17 Septembre 2020
Search Console Probleme redirection nom de domaine et indexation google Crawl et indexation Google, sitemaps 16 Septembre 2020
Problème indexation Google desktop/mobile Problèmes de référencement spécifiques à vos sites 3 Septembre 2020
Désindexation - Besoin de vos retours ! Demandes d'avis et de conseils sur vos sites 17 Août 2020
Search Console Google n'explore pas les liens du sitemap (de desindexation) Crawl et indexation Google, sitemaps 6 Juillet 2020
WordPress Désindexation en masse de mes pages Problèmes de référencement spécifiques à vos sites 1 Juillet 2020
Empêcher l'indexation d'images dont le nom contient une chaîne donnée Crawl et indexation Google, sitemaps 27 Juin 2020
Search Console Problème indexation très faible Crawl et indexation Google, sitemaps 19 Mai 2020
Problème indexation page d'accueil incompatible mobile Crawl et indexation Google, sitemaps 19 Avril 2020