Vieux AMP et pages avec balise canonique correcte

  • Auteur de la discussion Auteur de la discussion Weec
  • Date de début Date de début
Nouveau WRInaute
Bonjour,

En novembre 2022 (ça commence à dater) j'avais désinstallé AMP de mon site internet (après avoir compris que c'était plutôt de la m*rde). J'avais donc désactiver le module et mis une règle de redirection comme ceci :

/(.*)/amp >>> https://lettyou.com/$1

Sauf qu'aujourd'hui après prés de 2 ans j'ai toujours dans la search console 316 pages non indexés et le plus bizarre c'est que la redirection ne semble pas fonctionner, par exemple cet article de blog est accessible aux deux adresses sans redirection :

https://lettyou.com/les-insectes-vegetaux-de-raku-inoue/?amp=1

https://lettyou.com/les-insectes-vegetaux-de-raku-inoue/

Et c'est pareil pour toutes les URLS. Alors est-ce que j'ai fait une erreur de redirection ? Est-ce qu'il y a moyen d'épurer cette search console en virant définitivement amp ?

Je ne voudrait pas perdre du "jus" de référencement en faisant crawler Google pour rien... Merci pour vos lumières !

Pierre
 

Fichiers joints

  • Capture d’écran 2024-04-18 à 09.57.17.png
    Capture d’écran 2024-04-18 à 09.57.17.png
    486.9 KB · Affichages: 0
WRInaute occasionnel
Bonjour,
En effet la redirection ne fonctionne pas.
N'est-ce pas le "/" devant "amp" dans le critère qui pose problème ?
 
WRInaute impliqué
Quelles serait une URL d'origine avec AMP, et vers quoi devrait-elle rediriger ? Et potentiellement sous quel serveur ? Parce que là, je vais un peu avancer à tâtons.

En supposant que l'objectif soit que https://lettyou.com/les-insectes-vegetaux-de-raku-inoue/?amp=1 soit redirigée en https://lettyou.com/les-insectes-vegetaux-de-raku-inoue/, et qu'on soit sous Apache, la règle sera :

Apache config:
RewriteCond %{QUERY_STRING} amp=1
RewriteRule ^(.*)$ https://lettyou.com/$1 [L,QSD]

En effet, la partie dans la query string n'est pas examinée dans la RewriteRule, d'où l'usage de la RewriteCond. En outre, il faut ôter la query string lors de la redirection, d'où le drapeau QSD.
 
Nouveau WRInaute
Quelles serait une URL d'origine avec AMP, et vers quoi devrait-elle rediriger ? Et potentiellement sous quel serveur ? Parce que là, je vais un peu avancer à tâtons.

En supposant que l'objectif soit que https://lettyou.com/les-insectes-vegetaux-de-raku-inoue/?amp=1 soit redirigée en https://lettyou.com/les-insectes-vegetaux-de-raku-inoue/, et qu'on soit sous Apache, la règle sera :

Apache config:
RewriteCond %{QUERY_STRING} amp=1
RewriteRule ^(.*)$ https://lettyou.com/$1 [L,QSD]

En effet, la partie dans la query string n'est pas examinée dans la RewriteRule, d'où l'usage de la RewriteCond. En outre, il faut ôter la query string lors de la redirection, d'où le drapeau QSD.
Merci pour le retour, oui l'exemple que vous donner est le bon (bonne redirection souhaité et serveur Apache). Pour mes redirections j'utilise le module de redirection de John Godley, voici une capture d'écran avant que je valide, est-ce la bonne méthode ? Je ne tient pas compte du message d'alerte ?
 

Fichiers joints

  • Capture d’écran 2024-04-19 à 15.24.16.png
    Capture d’écran 2024-04-19 à 15.24.16.png
    221.9 KB · Affichages: 4
WRInaute accro
Si tu tiens comptes du message d'alerte qui te dit de rajouter une barre oblique au début de ta redirection et de rajouter une ^ au début de ta règle :)
 
Nouveau WRInaute
Je viens d'essayer mais ça ne fonctionne pas non plus... o_O

J'ai remis l'ancienne redirection en attendant... J'ai trouvé une méthode apparemment, je voudrais savoir si ça à l'air d'être une bonne chose avant que je le fasse ? Voir PJ
 

Fichiers joints

  • Capture d’écran 2024-04-19 à 16.11.17.png
    Capture d’écran 2024-04-19 à 16.11.17.png
    238.8 KB · Affichages: 1
WRInaute impliqué
Pour mes redirections j'utilise le module de redirection de John Godley, voici une capture d'écran avant que je valide, est-ce la bonne méthode ?
Nope, mon extrait correspond à ce qu'il faudrait mettre dans le .htaccess directement.

Je ne sais pas exactement comment fonctionne ce module, mais à vue de nez, la façon dont il est rempli sur le screen n'est pas cohérente.
 
WRInaute impliqué
Ce que je propose est à prendre avec des réserves, car je ne connais pas le module, et je ne peux pas tester ma proposition. Toutefois, je comprends pourquoi ta configuration ne passe pas si, comme dans ton premier message, tu as mis comme URL source /(.*)/amp dans la mesure où il manque le? avant amp.

En suggestion, teste avec dans le champ URL source : ^(.+/)\?amp=1$ et dans URL cible : /$1.

Quelques explications.
Le point d'interrogation a une signification particulière en regex, et pour indiquer que l'on cherche ce caractère (et non l'utiliser dans le sens qu'il a en regex), il faut l'échapper.
Il y aura peut-être un problème avec la regex, dans la mesure où je ne sais pas quel est le délimiteur utilisé par le module ; on utilise assez volontiers / comme délimiteur, auquel cas tout caractère / dans la regex doit être échappé. Mais il est possible que le plugin gère ça très bien en interne.
Je préfère le quantificateur + (une fois au moins) à *(zéro, une, ou plusieurs fois).
J'englobe le slash dans le groupe, parce que ta canonique finit avec un trailing slash.

Pour l'URL cible, je préfère une URL déconnectée du domaine, parce que ça me paraît plus dans l'esprit du plugin.
 
Nouveau WRInaute
Ce que je propose est à prendre avec des réserves, car je ne connais pas le module, et je ne peux pas tester ma proposition. Toutefois, je comprends pourquoi ta configuration ne passe pas si, comme dans ton premier message, tu as mis comme URL source /(.*)/amp dans la mesure où il manque le? avant amp.

En suggestion, teste avec dans le champ URL source : ^(.+/)\?amp=1$ et dans URL cible : /$1.

Quelques explications.
Le point d'interrogation a une signification particulière en regex, et pour indiquer que l'on cherche ce caractère (et non l'utiliser dans le sens qu'il a en regex), il faut l'échapper.
Il y aura peut-être un problème avec la regex, dans la mesure où je ne sais pas quel est le délimiteur utilisé par le module ; on utilise assez volontiers / comme délimiteur, auquel cas tout caractère / dans la regex doit être échappé. Mais il est possible que le plugin gère ça très bien en interne.
Je préfère le quantificateur + (une fois au moins) à *(zéro, une, ou plusieurs fois).
J'englobe le slash dans le groupe, parce que ta canonique finit avec un trailing slash.

Pour l'URL cible, je préfère une URL déconnectée du domaine, parce que ça me paraît plus dans l'esprit du plugin.
Merci emualliug pour la manipulation (et les explications !), en mettant ^(.+/)\?amp=1$ dans le champ source et https://lettyou.com/$1 dans la cible, cela fonctionne. Quand j'ai mis simplement /$1 ça me rediriger vers une URL comme ça : /les-insectes-vegetaux-de-raku-inoue/

Du coup maintenant que la redirection est bien effective, est-ce que je devrais à terme voir disparaître ces fameuses URL en AMP de la Search console ??
 
WRInaute impliqué
est-ce que je devrais à terme voir disparaître ces fameuses URL en AMP de la Search console
Je ne vais pas avoir une bonne nouvelle là-dessus. Google se souvient des années durant des anciennes URL, et il continue à les consulter régulièrement. Même lorsqu'elles débouchent sur une redirection 301 (c'est-à-dire permanente), même lorsqu'elles débouchent sur une 404, et ce, alors même qu'aucun lien ne pointe plus vers ces URL depuis des années.

Attends toi à voir grossir la catégorie "Page avec redirection" parmi les pages non indexées.

C'est un peu rageant, surtout qu'à l'heure du crawl prédictif et à l'économie d'exploration, les robots pourraient ne pas perdre de temps et d'énergie à explorer des URL que le webmestre a clairement indiquer comme surannées. C'est rageant, mais sans incidence sur le référencement.
 
Nouveau WRInaute
Merci pour la réponse, effectivement c'est vraiment dommage, mais tant que ça n'a pas d'incidences sur le référencement c'est l'essentiel, je ferais en sorte de ne pas regarder ce petit grain de sable dans ma search console :)
 
Discussions similaires
Haut