PROBLEME INDEXATION DE MON SITE

WRInaute discret
Bonjour a tous

Ce matin j’ai recu un message de google me disant que j’avais des pages non indexees

Problèmes Indexation des pages détectés dans https://pecheperle.be/
Au propriétaire de https://pecheperle.be/ :

La Search Console a constaté que votre site est concerné par 7 problème(s) Indexation des pages. Les problèmes suivants ont été détectés sur votre site. Nous vous conseillons de résoudre ces problèmes dès que possible pour optimiser l’expérience et votre couverture dans la recherche Google.

Principaux problèmes

  • Page avec redirection
  • Bloquée par le fichier robots.txt
  • Exclue par la balise « noindex »
  • Autre page avec balise canonique correcte
  • Introuvable (404)
je suis donc alle voir sur mon compte google , mais il est vrai que j’ai un peu de mal a m’y retrouver

j’ai par exemple ces pages
Bloquée par le fichier robots.txt
Ces pages ne sont pas indexées ni diffusées sur Google
je vous joins une copie d’ecranecran3.jpg
 
WRInaute discret
Bonjour,
À ce que je vois, c'est plutôt tant mieux que ces pages ne soient pas indexés, car soit c'est des pages de connexion à l'espace d'administration du site, soit c'est des flux RSS (ou Atom) qui sont pointées sur la capture d'écran, et d'ailleurs en cherchant le fichier robots.txt c'est plutôt logique que ces pages ne soient pas indexées, ci-dessous le sitemap avec mes explications pour chaque ligne (marqués par un double slash après chaque ligne) :

clipimage.jpg

D'ailleurs le fichiers robots.txt semble correct et plutôt logique, donc pour le moment pas besoin de paniquer si des URLs non indexées matchent avec les critères d'interdiction citées par le fichiers robots !
En revanche si des pages que vous trouvez éligibles (ex : une page de présentation du site) à une indexation de Google se retrouvent non indexables, là faudrait peut-être commencer à creuser un peu plus !
 
WRInaute discret
Bonjour
Un grand merci pour cette explication Mais je souhaiterais bien comprendre ce mecanisme avec google
comment expliquer la construction d'un tel lien
https://pecheperle.be/wp-login.php?...peche-a-la-perle-avec-did-du-7-decembre-2022/
je souhaiterais aussi demander si possible quelques explications complementaires stp
je vois sur cet ecran "autre pasge avec balise canonique correct" en clair cela veux dire quoi ?

ecran4.jpg


ou encore sur cette page , il indque qu'il ne trouve pas ces pages et moi non plus d'ailleurs
ecran5.jpg
 
WRInaute discret
Un grand merci pour cette explication Mais je souhaiterais bien comprendre ce mecanisme avec google
comment expliquer la construction d'un tel lien
https://pecheperle.be/wp-login.php?...peche-a-la-perle-avec-did-du-7-decembre-2022/
je souhaiterais aussi demander si possible quelques explications complementaires stp

En fait, grossièrement, voyez un robot d'indexation un peu comme un scrapper, il va essayer de cliquer sur tout les liens qui sont contenus dans la page web avec pour guide le fichier robots.txt, si il y a beaucoup d'url WP Login c'est parce qua manifestement un lien qui redirige vers le login de l'espace admin avec un param qui diffère en fonction de chaque page, donc le robot le répertorie et vérifie si ca matche avec les critères d'interdictions dans le fichiers robots.txt

je vois sur cet ecran "autre pasge avec balise canonique correct" en clair cela veux dire quoi ?

ecran4-jpg.1737

L'URL Canonique c'est un peu comme l'URL "de base", "officiel", celui qui doit être indexé par les robots d'indexation (cela est pratique lorsque par exemple il existe une version mobile du site séparé type m.monsite.web), apparemment le robot Google a trouvé que l'URL Cannonique est différent de l'URL, exemple avec l'une des URL pointés :

clipimage.jpg

Donc il faut que l'URL canonique matche avec l'URL qui le contient, bien sûr Google peut tolérer cette différence par exemple lorsqu'il a "compris" que c'est un site spécialement adaptés aux mobiles (ou un site allégé).

ou encore sur cette page , il indque qu'il ne trouve pas ces pages et moi non plus d'ailleurs
ecran5-jpg.1738

La c'est simple c'était des URLs qui étaient indexées et mise en cache, les robots Google vérifiant plûtot fréquemment les sites, il a trouvé que ces pages n'existaient plus, donc à mon sens mieux vaut ignorer les liens morts signalés (par contre demandez une désindexation si ces liens morts sont encore présents !)
 
WRInaute discret
ah ok super merci pour les explications
Mais du coup concenant ces urls Canonique je les laisse comme ca ?
de toute facon il me dit ceci "Autre page avec balise canonique correcte"
Alors j'ai aussi un lien avec une erreur Erreur serveur (5xx)
je dois faire quoi avec ?
Merci
 
WRInaute discret
Mais du coup concenant ces urls Canonique je les laisse comme ca ?

Je vois que la partie SEO du est géré avec Yoast SEO, essayez de modifiez les URLs canoniques via cet extension WordPress

Alors j'ai aussi un lien avec une erreur Erreur serveur (5xx)
je dois faire quoi avec ?

Là, les erreurs servers (5xx) faudrait ducoup se pencher vers l'infra du site (surtout si ce sont des pages essentielles, ca risque de potentiellement nuire au SEO du site) !
 
WRInaute discret
Merci pour l'aide
ne serais pas ici que cela se passe pour effectuer ce changements des urls canoniques
ecran8.jpg
pour l'erreur 5xx il sagit juste d'un de mes articles mais sans grande importance
Se pencher sur l'intra du site ?
Peux tu m'en dire plus stp merci
 
Dernière édition:
WRInaute discret
je viens de chercher apres un tuto pour regler les urls canoniques avec seo yoast mais sans succes
Peut etre que quelqu'un a un tuto svp

J'ai trouvé cette article de Yoast SEO sur les URLs canoniques : https://yoast.com/help/canonical-urls-in-yoast-seo/

Se pencher sur l'intra du site ?
Peux tu m'en dire plus stp merci

Se pencher sur l'infra du site : CÀD regarder du coté de l'hébergement si tout va bien ou encore s'il n'y a pas des problèmes sur le serveur (normalement cela se vérifie via la console de l'hébergeur), les erreurs 5xx étant des erreurs serveurs. Alors quelque fois c'est passager soit cela peut persister et il faudra intervenir coté serveur !
Dans le cas ou les pages concernées sont des articles que vous considérez comme secondaires, il n'y a pas urgence à intervenir pour le moment (cependant prenez note que ci ca persiste, il faudrait envisager de regarder coté serveur) !
 
Discussions similaires
Haut