Envoyer un gone, avec un match sur un nom de parametre "variant"

Discussion dans 'URL Rewriting et .htaccess' créé par Bronks, 14 Octobre 2020.

  1. Bronks
    Bronks Nouveau WRInaute
    Inscrit:
    22 Février 2011
    Messages:
    19
    J'aime reçus:
    0
    Bonjour,

    J'ai le Google Bot qui me tape (plusieurs fois par heure) toujours la même racine d'url avec un nom de paramètre "amp" qui change par exemple

    https://ndd.com/sousrep/25_nomfabri...25252525252525252525252525253Bp=xsyjhjhnujylm
    https://ndd.com/sousrep/25_nomfabri...25252525252525252525252525253Bp=xsyjhjhnujylm

    le nombre de "25" dans le nom du paramètre est aléatoire
    parfois j'ai aussi le "&p=2" (pour les pages) qui vient multiplier encore les possibilités.

    j'ai bien tenter avec un "rewritematch condition" mais ca passe pas car je veux vérifier
    que je suis bien sur "https://ndd.com/sousrep/25_nomfabricant"
    et à la fois le paramètre "amp(25xX)"

    une idée ?

    nb : dans la search console pas de "amp" activé.
     
  2. emualliug
    emualliug WRInaute discret
    Inscrit:
    1 Février 2020
    Messages:
    209
    J'aime reçus:
    41
    J'ai du mal à voir ce que tu veux faire, ni pourquoi tu veux le faire. Mais dans l'idée :
    Code:
    RewriteCond %{QUERY_STRING} ^amp%(25){10,}3Bp=xsyjhjhnujylm
    RewriteRule ^sousrep/25_nomfabricant /sousrep/25_nomfabricant [L,QSD]
    
    Va rediriger toutes requêtes faites sur /sousrep/25_nomfabricant?amp%252525252525252525252525252525253Bp=xsyjhjhnujylm
    vers /sousrep/25_nomfabricant ; et ce quel que soit le nombre de "25" du moment qu'il y en ait au moins 10, et qu'il y ait ou nom d'autres paramètres après.
     
    Bronks apprécie ceci.
  3. Bronks
    Bronks Nouveau WRInaute
    Inscrit:
    22 Février 2011
    Messages:
    19
    J'aime reçus:
    0
    Merci, je vais tester cela
    mais du coup cela ne renvoi pas un 410 ? est-ce que le bot va comprendre de ne plus prendre en compte l'adresse avec "amp" car le but est bien cela
     
  4. emualliug
    emualliug WRInaute discret
    Inscrit:
    1 Février 2020
    Messages:
    209
    J'aime reçus:
    41
    Non, ça fait une redirection ; c'est pour ça que je comprenais pas trop le but… Pour un code 410, il suffit de changer les drapeaux :
    Code:
    RewriteCond %{QUERY_STRING} ^amp%(25){10,}3Bp=xsyjhjhnujylm
    RewriteRule ^sousrep/25_nomfabricant - [G]
    
    Perso, je ne ferais rien pour une URL que tu n'as pas créée. Si jamais le bot s'imagine, par exemple que "?amp…" est indifférent, il pourrait croire que c'est la page de base qui est partie. C'est une pure hypothèse de ma part, mais c'est pour dire que les gains potentiels (je ne vois pas bien lesquels) sont inférieurs aux pertes éventuelles.
     
    Bronks apprécie ceci.
  5. Bronks
    Bronks Nouveau WRInaute
    Inscrit:
    22 Février 2011
    Messages:
    19
    J'aime reçus:
    0
    Merci.

    La page de base est bien consultée aussi.
    Le gain est surtout en perf. Car cette page n'étant pas en cache elle mets entre 5/6 seconde à se génerer.
    Vu le nombre de consultation par jour, je pense quel doit plomber mes perfs globales et mon crawl budget ?
     
  6. emualliug
    emualliug WRInaute discret
    Inscrit:
    1 Février 2020
    Messages:
    209
    J'aime reçus:
    41
    Si la page met réellement entre 5 et 6 secondes (!!) à se générer, il y a un problème de performance bien plus prégnant que tout le reste.

    Le budget de crawl ne doit être un soucis que si tu "sens" que le site est en limite de crawl (nouveaux articles non indexés, fréquence d'actualisation insuffisante). Sinon c'est un soucis purement théorique, donc pas un vrai problème.

    Si la page déclare une canonique je m'abstiendrai de toute action complémentaire.
     
    Bronks apprécie ceci.
  7. Bronks
    Bronks Nouveau WRInaute
    Inscrit:
    22 Février 2011
    Messages:
    19
    J'aime reçus:
    0
    Alors j'ai bien une canonical pour cette page. C'est d'ailleurs pourquoi je me demande pourquoi le bot revient régulièrement alors que j'ai toujours eu cette canonical ?
    C'est surement parce qu'il pense que c'est du AMP. Mais en fait ce n'en est pas.

    Pour le temps de rendu, cela ne me pose problème que lorsque la page n'est pas en cache, ce qui est le cas souvent dans ce contexte car le nom du paramètre varie. Mais un travail est en cours en effet suite à ce temps énorme d'execution. les autres pages sont entre 200-400ms.
     
Chargement...
Similar Threads - Envoyer gone match Forum Date
Envoyer un Rapport Analytic sans toutes les données Google Analytics 17 Janvier 2019
Envoyer un lien cliquable par mail à un ami Développement d'un site Web ou d'une appli mobile 29 Juillet 2018
Comment envoyer par email le contenu d'un formulaire ? Développement d'un site Web ou d'une appli mobile 23 Avril 2018
envoyer 10 000 email d'un coup Gmail, Google Talk, Blogger et Orkut 16 Septembre 2017
[Google Shopping] envoyer toutes les déclinaisons ? AdWords 2 Avril 2016
En php : Générer un pdf apartir de données d'un formulaire et l'envoyer par mail Développement d'un site Web ou d'une appli mobile 7 Octobre 2015
Envoyer 2 Sitemaps à Search Console ? Crawl et indexation Google, sitemaps 22 Juillet 2015
Envoyer 5 000 newsletters par mois, quel outil ou service utiliser ? Développement d'un site Web ou d'une appli mobile 3 Avril 2015
renvoyer urls comprenant une expression vers page unique URL Rewriting et .htaccess 30 Octobre 2014
Google crawle des urls qu'il invente : quel code renvoyer ? Crawl et indexation Google, sitemaps 31 Juillet 2014