Budget de crawl et images "Indexée, mais non envoyée via un sitemap"

Nouveau WRInaute
Bonjour,

Mon site n'est pas énorme mais en regardant un peu plus en détail la nouvelle Search Console, je vois que dans le rapport Valides "Indexée, mais non envoyée via un sitemap", j'ai un grand nombre d'URL qui pointent vers des images WordPress, qui bizarrement ne s'ouvrent pas dans une lightbox et qui ne sont pas les URLs de téléchargement ds WP (upload/2019/02...)...
Exemple : https://yesyouweb.com/migrer-site-wordpress-etapes/we-did-it/, c'est l'image d'Homer qui se trouve dans l'article https://yesyouweb.com/migrer-site-wordpress-etapes/... Comment Google a t-il généré cette URL qui pour moi n'existe nulle part dans mon site ?

Je pose la question car j'en ai près de 300 comme ça (certaines mènent vers des 404) et lors du dernier SEO camp, plusieurs conférences concernaient le budget de Crawl et d'éviter que Google ne perde son temps à crawler ce type d'URL et se concentre plutôt sur les pages intéressantes.

Merci pour vos lumières et bonne soirée !
 
Olivier Duffez (admin)
Membre du personnel
le budget de crawl concerne les sites avec des tonnes d'URL, ce n'est pas le cas ici

à une époque il devait y avoir un lien vers cette URL (qui n'est pas l'image mais une page HTML affichant l'image, ce que Wordpress nomme attachment)
au minimum, ajoute une meta robots noindex sur ces URL

PS : tu as quelques liens qui pointent vers des 301, faudrait corriger
 
Nouveau WRInaute
Merci pour ta réponse :)
Concernant les liens qui pointent vers des 301, tu parles de liens vers des pages qui elles-mêmes ont été redirigées en 301 ? Comment as-tu vu ça que j'obtienne la liste afin de pouvoir corriger.
 
Olivier Duffez (admin)
Membre du personnel
Je crois bien qu'entre temps tu as trouvé comment faire ;-) Je te contacte en privé
 
Discussions similaires
Haut