Envoyer un gone, avec un match sur un nom de parametre "variant"

Nouveau WRInaute
Bonjour,

J'ai le Google Bot qui me tape (plusieurs fois par heure) toujours la même racine d'url avec un nom de paramètre "amp" qui change par exemple

https://ndd.com/sousrep/25_nomfabri...25252525252525252525252525253Bp=xsyjhjhnujylm
https://ndd.com/sousrep/25_nomfabri...25252525252525252525252525253Bp=xsyjhjhnujylm

le nombre de "25" dans le nom du paramètre est aléatoire
parfois j'ai aussi le "&p=2" (pour les pages) qui vient multiplier encore les possibilités.

j'ai bien tenter avec un "rewritematch condition" mais ca passe pas car je veux vérifier
que je suis bien sur "https://ndd.com/sousrep/25_nomfabricant"
et à la fois le paramètre "amp(25xX)"

une idée ?

nb : dans la search console pas de "amp" activé.
 
WRInaute impliqué
J'ai du mal à voir ce que tu veux faire, ni pourquoi tu veux le faire. Mais dans l'idée :
Code:
RewriteCond %{QUERY_STRING} ^amp%(25){10,}3Bp=xsyjhjhnujylm
RewriteRule ^sousrep/25_nomfabricant /sousrep/25_nomfabricant [L,QSD]
Va rediriger toutes requêtes faites sur /sousrep/25_nomfabricant?amp%252525252525252525252525252525253Bp=xsyjhjhnujylm
vers /sousrep/25_nomfabricant ; et ce quel que soit le nombre de "25" du moment qu'il y en ait au moins 10, et qu'il y ait ou nom d'autres paramètres après.
 
Nouveau WRInaute
Merci, je vais tester cela
mais du coup cela ne renvoi pas un 410 ? est-ce que le bot va comprendre de ne plus prendre en compte l'adresse avec "amp" car le but est bien cela
 
WRInaute impliqué
mais du coup cela ne renvoi pas un 410 ?
Non, ça fait une redirection ; c'est pour ça que je comprenais pas trop le but… Pour un code 410, il suffit de changer les drapeaux :
Code:
RewriteCond %{QUERY_STRING} ^amp%(25){10,}3Bp=xsyjhjhnujylm
RewriteRule ^sousrep/25_nomfabricant - [G]

est-ce que le bot va comprendre de ne plus prendre en compte l'adresse avec "amp" car le but est bien cela
Perso, je ne ferais rien pour une URL que tu n'as pas créée. Si jamais le bot s'imagine, par exemple que "?amp…" est indifférent, il pourrait croire que c'est la page de base qui est partie. C'est une pure hypothèse de ma part, mais c'est pour dire que les gains potentiels (je ne vois pas bien lesquels) sont inférieurs aux pertes éventuelles.
 
Nouveau WRInaute
Merci.

La page de base est bien consultée aussi.
Le gain est surtout en perf. Car cette page n'étant pas en cache elle mets entre 5/6 seconde à se génerer.
Vu le nombre de consultation par jour, je pense quel doit plomber mes perfs globales et mon crawl budget ?
 
WRInaute impliqué
Si la page met réellement entre 5 et 6 secondes (!!) à se générer, il y a un problème de performance bien plus prégnant que tout le reste.

Le budget de crawl ne doit être un soucis que si tu "sens" que le site est en limite de crawl (nouveaux articles non indexés, fréquence d'actualisation insuffisante). Sinon c'est un soucis purement théorique, donc pas un vrai problème.

Si la page déclare une canonique je m'abstiendrai de toute action complémentaire.
 
Nouveau WRInaute
Alors j'ai bien une canonical pour cette page. C'est d'ailleurs pourquoi je me demande pourquoi le bot revient régulièrement alors que j'ai toujours eu cette canonical ?
C'est surement parce qu'il pense que c'est du AMP. Mais en fait ce n'en est pas.

Pour le temps de rendu, cela ne me pose problème que lorsque la page n'est pas en cache, ce qui est le cas souvent dans ce contexte car le nom du paramètre varie. Mais un travail est en cours en effet suite à ce temps énorme d'execution. les autres pages sont entre 200-400ms.
 
Discussions similaires
Haut