Indexation des fichiers PDF volumineux

Discussion dans 'Crawl et indexation Google, sitemaps' créé par fmerceur, 18 Novembre 2004.

  1. fmerceur
    fmerceur Nouveau WRInaute
    Inscrit:
    18 Novembre 2004
    Messages:
    1
    J'aime reçus:
    0
    Bonjour,

    Nous venons de publier un site de diffusion de thèses et de rapports. Pour chacun de ces documents nous diffusons une notice au format HTML et le texte intégral au format PDF.

    Certains des fichiers PDF sont parfaitement visibles sous Google.

    Par contre, certains de ces documents PDF ne sont visibles que dans les « pages ignorées ». Dans ces pages ignorées. Parfois ces fichiers n’apparaissent même pas dans les pages ignorées, alors que des liens en dur pointent vers ces fichiers.

    En fait il semble que les fichiers qui ne sont pas pris en compte, sont les plus volumineux (>4Mo). Est-ce que la taille du document peut expliquer la non-indexation par google ? Ou faut-il chercher la raison ailleurs ?

    Merci pour votre aide,
    Fred
    :?
     
  2. niceunef
    niceunef WRInaute passionné
    Inscrit:
    19 Janvier 2004
    Messages:
    1 380
    J'aime reçus:
    0
    Pour les gros documents, il n'indexera pas jusqu'au bout (pour des pages HTML ce serait 101 ko, en PDF un peu plus peut-etre). Mais meme avec des pages "normales" l'indexation de 100% des pages est difficile.
     
Chargement...
Similar Threads - Indexation fichiers volumineux Forum Date
Erreur d'indexation Google pour mes fichiers PDF Crawl et indexation Google, sitemaps 17 Septembre 2020
WordPress Désindexation des fichiers "attachements" dans Google ? Référencement Google 2 Novembre 2018
Désindexation massive de fichiers PDF Crawl et indexation Google, sitemaps 12 Avril 2018
Désindexation fichiers .pdf Référencement Google 24 Octobre 2013
Problèmes indexation => fichiers robots.txt pourtant ok Crawl et indexation Google, sitemaps 17 Décembre 2012
Problèmes d'indexations de Google Crawl et indexation Google, sitemaps Hier à 12:10
Problème d'indexation pour de nombreuses pages Débuter en référencement 10 Octobre 2020
WordPress Duplicate indexation article + page 1 commentaire Crawl et indexation Google, sitemaps 10 Octobre 2020
Chargement composants par JS (fetch) - indexation dans Google Crawl et indexation Google, sitemaps 9 Octobre 2020
Search Console Problème d'indexations de pages produits Crawl et indexation Google, sitemaps 30 Septembre 2020