Page d'accueil dupliquée

Azzurro23

Nouveau WRInaute
Bonjour,
Je viens de me rendre compte que ma page d'accueil est présente dans google avec deux URL différentes.
Code:
http://www.nomdedomaine.com/#!/page/2/
http://www.nomdedomaine.com/

Je voudrais savoir si il existe un moyen de bloquer ce problème dans Wordpress.
 

Azzurro23

Nouveau WRInaute
Pardon, je me suis trompé concernant la deuxième URL. Il manquait un slash.
Code:
https://www.nomdedomaine.com/#!//page/2/
Quoi qu'il en soit cette URL est bien indexée dans Google. Je la vois, lorsque je tape le nom de mon site. Et lorsque je clique dessus, c'est la page d'accueil qui se charge.
Très curieux.
 

UsagiYojimbo

WRInaute accro
#!, ce n'était pas lié à la gestion de l'escaped fragment, à l'époque où Google mettait en avant cette manière de contourner ses limites en terme d'indexation des sites full JS ?
 

rick38

WRInaute passionné
Ah effectivement jusqu'en 2015 Google faisait ça pour indexer les pages ajax, en remplaçant #!/ par ?_escaped_fragment_=
Je n'ai jamais vu d'url indexée comme ça mais apparemement ça existe.
 

rick38

WRInaute passionné
Pour faire désindexer, une solution serait une redirection, ou de la faire passer en erreur 404, ou meta noindex, comme pour n'importe quelle url.
En utilisant le fichier .htaccess il faut utiliser l'url que Google indexe réellement (pas #!), ce qui donne pour une redirection par exemple :
Redirect 301 /?_escaped_fragment_=page/2/ /

Et accessoirement trouver le plugin dans WordPress qui met le #! pour que ces urls n'existent plus (LocatorURL ?).
 

Azzurro23

Nouveau WRInaute
Bonjour,
Je ne vois pas où trouver l'URL que Google indexe réellement.
Lorsque je place ma souris au dessus du lien, je vois bien apparaître cette url
Code:
https://www.nomdedomaine.com/#!//page/2/
C'est également celle-ci qui apparaît dans le champ URL de mon navigateur lorsque je clique dessus.
Dernière petite précision importante, mon site n'est pas basé sur Ajax.

Je pensais mettre ça dans le fichier .htaccess
Code:
Redirect 301 /#!//page/2/ https://www.nomdedomaine.com/

Je viens de lancer un crawl de mon site avec Xenu et je ne trouve pas cette URL. Je ne pense pas que ça viennent de mon site mais plutôt d'un lien externe.
 
Dernière édition:

rick38

WRInaute passionné
Je pensais mettre ça dans le fichier .htaccess
Code:
Redirect 301 /#!//page/2/ https://www.nomdedomaine.com/

Non ça ne peut pas marcher comme ça. Une URL ne peut pas avoir de # dans le .htaccess.
Il faut passer par _escaped_fragment_ comme j'ai indiqué, Google essaie de lire l'url https://www.nomdedomaine.com/?_escaped_fragment_=/page/2/
Quand le googlebot verra que cette url fait une redirection, ou envoie une 404, il finira par enlever la page (sauf s'ils ont laissé tomber, ça je ne sais pas, c'est deprecated depuis 2015 ce truc, une idée à la con car même aucun autre moteur ne l'a adopté à l'époque).
Le visiteur aura toujours la page comme avant, mais Google lui ne la verra plus.

L'autre solution est une redirection en javascript côté client :
https://www.searchenginejournal.com...quired-when-redirecting-hashbang-urls/326327/
A ce moment-là à la fois le visiteur et le googlebot seront redirigés.

Cherchez redirection d'url hashbang dans Google, hashbang c'est le nom pour #!
 
Dernière édition:

Azzurro23

Nouveau WRInaute
Bonjour
Je reviens vers vous car depuis ce matin, je vois que ma page d'accueil est maintenant référencée dans Google avec cette adresse.
Code:
https://www.nomdedomaine.com/#!vestes+et+gilets
Quelqu'un aurait une idée pour virer ça définitivement.
 
Haut