Indexation des fichiers PDF volumineux

Nouveau WRInaute
Bonjour,

Nous venons de publier un site de diffusion de thèses et de rapports. Pour chacun de ces documents nous diffusons une notice au format HTML et le texte intégral au format PDF.

Certains des fichiers PDF sont parfaitement visibles sous Google.

Par contre, certains de ces documents PDF ne sont visibles que dans les « pages ignorées ». Dans ces pages ignorées. Parfois ces fichiers n’apparaissent même pas dans les pages ignorées, alors que des liens en dur pointent vers ces fichiers.

En fait il semble que les fichiers qui ne sont pas pris en compte, sont les plus volumineux (>4Mo). Est-ce que la taille du document peut expliquer la non-indexation par google ? Ou faut-il chercher la raison ailleurs ?

Merci pour votre aide,
Fred
:?
 
WRInaute passionné
Pour les gros documents, il n'indexera pas jusqu'au bout (pour des pages HTML ce serait 101 ko, en PDF un peu plus peut-etre). Mais meme avec des pages "normales" l'indexation de 100% des pages est difficile.
 
Discussions similaires
Haut