éviter duplicate content après url rewriting

Discussion dans 'URL Rewriting et .htaccess' créé par mussara, 8 Juin 2007.

  1. mussara
    mussara WRInaute discret
    Inscrit:
    23 Décembre 2004
    Messages:
    102
    J'aime reçus:
    0
    bonjour

    j'ai modifié mon htacess pour mettre en place l'url rewriting
    sous la forme

    Code:
    RewriteRule ^nouvellepage-(.+)-([0-9]+)\.html$ anciennepage.php?top=id&id=$2&nom=$1 [L]
    du coup j'ai essayé de lire pas mal de choses pour éviter le duplicate content avec mes anciennes pages qui sont indexées sur GG mais je ne vois pas trop comment faire pour écrire une syntaxe unique dans le htaccess pour ne plus que ces anciennes pages soient indexées...

    comment dois-je m'y prendre?

    merci de votre aide
     
  2. LeMulotNocturne
    LeMulotNocturne WRInaute impliqué
    Inscrit:
    1 Juin 2005
    Messages:
    551
    J'aime reçus:
    0
    mettre anciennepage.php en disallow dans ton robots.txt
     
  3. mussara
    mussara WRInaute discret
    Inscrit:
    23 Décembre 2004
    Messages:
    102
    J'aime reçus:
    0
    mais si j'ai des centaines de pages qui avaient cette structure, il faut que j'écrive ces centaines de pages dans le robots.txt???
     
  4. fra_arf
    fra_arf WRInaute occasionnel
    Inscrit:
    22 Novembre 2005
    Messages:
    390
    J'aime reçus:
    0
    Non toutes les pages contenant ce terme seront supprimer avec le temps.

    Mais si tu as un page : anciennepage.php qui doit rester accessible alros tu met anciennepage.php? avec le point d'interrogation et toutes ses pages ne seront plus indexer ni crawlé.

    Sinon c'est pas mal de faire des redirections 301 également pour pouvoir garder son indexation...
     
  5. HawkEye
    HawkEye WRInaute accro
    Inscrit:
    23 Février 2004
    Messages:
    13 857
    J'aime reçus:
    5
    pas tant qu'elles sont indexées.

    Dans les fichiers appelés par des URI réécrits, il faut faire une comparaison entre $_SERVER['REQUEST_URI'] et le contenu généré par la fonction de réécriture (puisque les variables sont connues, on peut le faire sans problème).

    De là, si ils sont égaux, on ne fait rien... Sinon, on fait une redirection 301 vers l'URI "de contrôle".

    --> les URLs non réécrits ne sont plus indexables, puisqu'ils renvoient une 301.
     
  6. mussara
    mussara WRInaute discret
    Inscrit:
    23 Décembre 2004
    Messages:
    102
    J'aime reçus:
    0
    merci pour de vos réponses

    pour prolonger, si toutes mes url dans le site pointent désormais vers les url reecrites, au bout de quelques temps GG va supprimer les anciennes de son index , non?

    et pendant ce laps de temps, (est il long?), il y aura du duplicate content, mais est ce si grave?
     
  7. HawkEye
    HawkEye WRInaute accro
    Inscrit:
    23 Février 2004
    Messages:
    13 857
    J'aime reçus:
    5
    Le délai dépendra avant tout de la capacité de ton site à se faire crawler en profondeur.

    Cela implique:

    - un site bien référencé
    - un site au liage interne un tant soit peu étudié

    A priori, quelques semaines tout au plus pour un site "classique".

    Techniquement parlant, on ne peut pas dire qu'il y'aura du duplicate content "pendant ce temps", si on considère que l'analyse de "duplicate content" commence au moment de la détection d'une page pouvant être similaire, détection impliquant une vérification, donc une nouvelle visite et donc la réception d'un code d'état "301: Moved, Permanently".
     
Chargement...
Similar Threads - éviter duplicate content Forum Date
Un contenu serait publié deux endroits/URLs différents, comment éviter le duplicated content ? Référencement Google 2 Octobre 2019
Comment éviter le duplicate content entre 2 sites ? Référencement Google 2 Avril 2019
Éviter le duplicate content pour des pages de spectacles et films Référencement Google 18 Janvier 2016
Comment eviter duplicate content avec des recettes de cuisine? Référencement Google 14 Octobre 2013
Modifier l'indexation des PDF pour éviter duplicate content Crawl et indexation Google, sitemaps 2 Septembre 2013
Comment éviter un duplicate content sans ruiner l'expérience utilisateur? Référencement Google 9 Août 2013
Duplicate content sur les méta, à éviter ou pas? Débuter en référencement 18 Juillet 2013
Comment eviter le duplicate content lorsqu'on met un article dans 2 catégories? Référencement Google 21 Juin 2013
Dire a google de ne pas indexer un div en particulier pour éviter le duplicate content. Débuter en référencement 1 Mars 2013
Changement de nom de domaine : comment éviter Duplicate Content ? Débuter en référencement 20 Février 2013
Comment créer 60 descriptions unique pour eviter le duplicate content? Rédaction web et référencement 13 Septembre 2012
Eviter le duplicate content URL Rewriting et .htaccess 13 Août 2012
Comment éviter le "duplicate content" ? Débuter en référencement 30 Juillet 2012
Eviter le duplicate content sur un blog Rédaction web et référencement 14 Février 2012
Comment éviter le duplicate content avec 2 NDD Référencement Google 30 Mars 2011
Plusieurs URL pour une seule page : comment éviter le duplicate content ? Crawl et indexation Google, sitemaps 7 Février 2011
Redirection pour éviter duplicate content URL Rewriting et .htaccess 24 Janvier 2011
Canonical, pour éviter le duplicate content mais si le contenu est semi unique Débuter en référencement 26 Décembre 2010
éviter un duplicate content Débuter en référencement 7 Octobre 2010
[résolu] Eviter le duplicate content sur la page d'accueil URL Rewriting et .htaccess 2 Juillet 2010