Search Console - Contenu dupliqué : problème de pages explorées

Nouveau WRInaute
Bonjour,

J'ai récemment demandé un audit SEO RM Tech sur My Ranking Metrics (je remercie Fabien pour son suivi !)

En approfondissant ma démarche d'optimisation, je me suis rendu compte d'un problème trouvé sur ma Search Console :
> sur 51 pages figurant dans l'index, google en a exploré au total 170 non indexées.

Il apparait que la plupart des pages de mon site sortent en double et risque donc de me pénaliser en "contenu dupliqué" je pense.
En gros, les pages de mon site ont pour url canonique une terminaison en .html.
Exemple : www.sylvainsantoro.fr/photographe-corporate-nice.html
qui est dupliquée en : /photographe-corporate-nice (sans le .html à la fin)

Google me les signale donc en :
Autre page avec balise canonique correcte
Ces pages ne sont pas indexées ni diffusées sur Google
État de la validation : échec
Début : 18/04/2023
Échec : 25/04/2023

Comment puis-je résoudre ce problème ? J'ai essayé de les supprimer de l'indexation mais en fait elles ne le sont pas, pourtant explorées par google régulièrement...

Merci par avance.

Sylvain
 
Olivier Duffez (admin)
Membre du personnel
L'URL sans .html ne devrait pas fonctionner. Je ne sais pas quelle règle de réécriture est en place, mais tu pourrais essayer de faire une 301 de ces URL sans .html avec la version avec .html (puisque c'est ça que tu utilises sur le site)

Tant qu'aucun lien interne ne va vers des pages sans .html, ce n'est pas un pb important
 
Nouveau WRInaute
L'URL sans .html ne devrait pas fonctionner. Je ne sais pas quelle règle de réécriture est en place, mais tu pourrais essayer de faire une 301 de ces URL sans .html avec la version avec .html (puisque c'est ça que tu utilises sur le site)

Tant qu'aucun lien interne ne va vers des pages sans .html, ce n'est pas un pb important
Merci Olivier,

Malheureusement ça fonctionne bien sans .html : j'ai en effet créé des redirections 301 sur mon htaccess pour essayer d'y remédier.

Mais google arrive encore à les visiter et je ne sais pas pourquoi. J'ai certainement dû me planter avec des liens internes il y a longtemps, mais tout est corrigé depuis un moment.
 
Discussions similaires
Haut