WRInaute passionné
Bonjour,

Savez-vous s'il existe actuellement une limite de taille pour le cache Google ? Il y a trèèèès longtemps (je parle d'un temps que les moins de 20 ans ne doivent pas connaître) Google allait jusqu'à 101 ko, mais cette limite avait sauté. Or j'ai un site actuellement dont les pages en cache sont tronquées. J'aimerais savoir si cela est en lien avec une quelconque limite.

Ou avez-vous des exemples de pages de plusieurs centaines de ko dont le contenu est intégralement caché ?
 
WRInaute accro
J'ai pris une page web au hasard (q=huge web links list):
Code:
cache:https://darkwebnews.com/deep-web-links/
Plus de 200 Ko, elle y est au complet.
 
WRInaute accro
juste le .html
BcfuBP5.png


De ton côté, je pense à un problème de temps de chargement ?
 
WRInaute passionné
En fait je constate des signaux contradictoires :

- Ma page est tronquée dans le cache Google.
- Ma page est tronquée dans Search Console / Explorer comme Google pour la vue "récupération".
- Ma page est OK dans Search Console / Explorer comme Google pour la vue "affichage".
- Quand je fais une recherche "mot-clé site:www.monsite.fr/urlexactedemapage" Google trouve bien le mot-clé dans la page alors même que ce mot-clé est absent du cache du fait de la tronquature.

Il semblerait donc qu'il y ait une limite à la taille du cache visible, mais que le vrai cache utilisé par l'algo soit moins limité. Cependant j'aimerais en être sûr, en particulier en ce qui concerne les liens placés après la tronquature.
 
Olivier Duffez (admin)
Membre du personnel
Google indexe au moins 10Mo, voire plus (mais la consultation de la version en cache n'est pas forcément la meilleure méthode)
Bing s'arrête vers 700Ko par contre, ce qui arrive plus souvent qu'on ne le pense (avec des pages lourdes et du code qui tâche)
 
WRInaute accro
French Dread a dit:
En fait je constate des signaux contradictoires

Tu as essayé de creuser le problème côté serveur ? des fois qu'un bug technique soit responsable de ce ce code tronqué. Quand tu affiche la page en cache tronquée, il n'y a pas de message d'erreur affiché ?
 
WRInaute passionné
Alors entre temps j'ai lancé un test avec une grosse page pour me faire une idée des limites de Google : http://www.sebastien-billard.fr/tacticool/public/divers/100ko.html Cette page est constituée de blocs de texte lorem ipsum de 100 ko, séparés par des titres <h1> explicites servant de jalons : "zeroko", "centko", "deuxcentko" etc.

- Il apparait que la vue "récupération" dans l'outil "explorer comme Google" n'indexe pas plus de 250 ko de code
- Il apparait que le cache Google (commande cache:) n'indexe pas plus de 1 Mo

Par contre il apparait sur des pages réelles et très lourdes que Google trouve bien des mots-clés au delà de la troncature de la page cache. Cela suggère qu'il y a en fait deux caches : celui de la commande cache et celui utilisé réellement par l'algo.

Je n'ai pas de messages d'erreur dans la version cachée de mes pages, elles sont juste coupées nettes (code HTML de 1.34 Mo. Je sais, c'est moche).

Olivier quelle est ta méthode pour se faire une idée du cache réel de la page ?
 
Olivier Duffez (admin)
Membre du personnel
je n'ai pas d'autre méthode que de voir la page "ranker" sur des requêtes trouvées loin dans le code de la page
il y a aussi les déclarations de John Mueller (Google). Jusqu'en 2015 il parlait de 10Mo et désormais il évoque "des centaines de Mo" (ce qui est totalement ridicule pour une page HTML, moins pour d'autres formats comme PDF éventuellement)
cf. https://www.seroundtable.com/google-hundreds-megabytes-per-page-24245.html
 
Olivier Duffez (admin)
Membre du personnel
c'est quoi le but du jeu au final ? si un code HTML de 2Mo est indexé à 100% par Google, ça devrait suffire non ? tout en sachant bien entendu qu'il ne faut jamais aussi gros
 
WRInaute passionné
La raison de ce questionnement est de déterminer si un contenu tronqué dans le cache "visible" est néanmoins bien indexé en intégralité dans le "vrai cache" utilisé par l'algo, et si les liens présents dans la partie tronquée sont bien pris en compte. John évoque des seuils, malheureusement ses chiffres sont contredits par la Search Console. Aussi je ne peux me fier à sa seule parole.
 
Olivier Duffez (admin)
Membre du personnel
une bonne solution est de se limiter à environ 500Ko, comme ça c'est OK avec le cache "visible" ainsi qu'avec Bing
 
Discussions similaires
Haut