Formation par Olivier Duffez

Formation au référencement par Olivier Duffez, créateur de WebRankInfo !
Une formule efficace alliant théorie et pratique, avec une haute disponibilité des intervenants
Cette formule a déjà convaincu plusieurs centaines d'entreprises, pourquoi pas vous ?
Réservez vite votre place en ligne (convention possible pour imputer sur le budget formation)

Formation référencement Marseille

éviter duplicate content après url rewriting

Poster un nouveau sujet Imprimer cette discussion    Forum -> URL Rewriting et .htaccess   Les dernières discussions de ce forum sont disponibles au format RSS
Voir le sujet précédent :: Voir le sujet suivant  
Auteur Message
 
mussara
WRInaute occasionnel
WRInaute occasionnel

Inscrit le: 23 Déc 2004
Messages: 107

URL permanente de ce messagePosté le : Ven Juin 08, 2007 13:12    Sujet du message: éviter duplicate content après url rewriting

bonjour

j'ai modifié mon htacess pour mettre en place l'url rewriting
sous la forme

Code:
RewriteRule ^nouvellepage-(.+)-([0-9]+)\.html$ anciennepage.php?top=id&id=$2&nom=$1 [L]


du coup j'ai essayé de lire pas mal de choses pour éviter le duplicate content avec mes anciennes pages qui sont indexées sur GG mais je ne vois pas trop comment faire pour écrire une syntaxe unique dans le htaccess pour ne plus que ces anciennes pages soient indexées...

comment dois-je m'y prendre?

merci de votre aide
 
mussara
LeMulotNocturne
WRInaute passionné
WRInaute passionné

Inscrit le: 01 Juin 2005
Messages: 601
Localisation: Lyon

URL permanente de ce messagePosté le : Ven Juin 08, 2007 14:15    Sujet du message: éviter duplicate content après url rewriting

mettre anciennepage.php en disallow dans ton robots.txt
 
LeMulotNocturne Visiter le site web du posteur
mussara
WRInaute occasionnel
WRInaute occasionnel

Inscrit le: 23 Déc 2004
Messages: 107

URL permanente de ce messagePosté le : Ven Juin 08, 2007 14:23    Sujet du message: éviter duplicate content après url rewriting

mais si j'ai des centaines de pages qui avaient cette structure, il faut que j'écrive ces centaines de pages dans le robots.txt???
 
mussara
fra_arf
WRInaute impliqué
WRInaute impliqué

Inscrit le: 22 Nov 2005
Messages: 429

URL permanente de ce messagePosté le : Ven Juin 08, 2007 17:15    Sujet du message: éviter duplicate content après url rewriting

Non toutes les pages contenant ce terme seront supprimer avec le temps.

Mais si tu as un page : anciennepage.php qui doit rester accessible alros tu met anciennepage.php? avec le point d'interrogation et toutes ses pages ne seront plus indexer ni crawlé.

Sinon c'est pas mal de faire des redirections 301 également pour pouvoir garder son indexation...
 
fra_arf Visiter le site web du posteur
HawkEye
Modérateur
Modérateur

Inscrit le: 23 Fév 2004
Messages: 12808
Localisation: Bah: First! C'te question...!?

URL permanente de ce messagePosté le : Ven Juin 08, 2007 17:35    Sujet du message: éviter duplicate content après url rewriting

LeMulotNocturne a écrit:
mettre anciennepage.php en disallow dans ton robots.txt


pas tant qu'elles sont indexées.

Dans les fichiers appelés par des URI réécrits, il faut faire une comparaison entre $_SERVER['REQUEST_URI'] et le contenu généré par la fonction de réécriture (puisque les variables sont connues, on peut le faire sans problème).

De là, si ils sont égaux, on ne fait rien... Sinon, on fait une redirection 301 vers l'URI "de contrôle".

--> les URLs non réécrits ne sont plus indexables, puisqu'ils renvoient une 301.
 
HawkEye Visiter le site web du posteur
mussara
WRInaute occasionnel
WRInaute occasionnel

Inscrit le: 23 Déc 2004
Messages: 107

URL permanente de ce messagePosté le : Ven Juin 08, 2007 19:44    Sujet du message: éviter duplicate content après url rewriting

merci pour de vos réponses

pour prolonger, si toutes mes url dans le site pointent désormais vers les url reecrites, au bout de quelques temps GG va supprimer les anciennes de son index , non?

et pendant ce laps de temps, (est il long?), il y aura du duplicate content, mais est ce si grave?
 
mussara
HawkEye
Modérateur
Modérateur

Inscrit le: 23 Fév 2004
Messages: 12808
Localisation: Bah: First! C'te question...!?

URL permanente de ce messagePosté le : Ven Juin 08, 2007 22:01    Sujet du message: éviter duplicate content après url rewriting

Le délai dépendra avant tout de la capacité de ton site à se faire crawler en profondeur.

Cela implique:

- un site bien référencé
- un site au liage interne un tant soit peu étudié

A priori, quelques semaines tout au plus pour un site "classique".

Techniquement parlant, on ne peut pas dire qu'il y'aura du duplicate content "pendant ce temps", si on considère que l'analyse de "duplicate content" commence au moment de la détection d'une page pouvant être similaire, détection impliquant une vérification, donc une nouvelle visite et donc la réception d'un code d'état "301: Moved, Permanently".
 
HawkEye Visiter le site web du posteur
 
Montrer les messages depuis:   
Revenir en haut    Forum -> URL Rewriting et .htaccess Toutes les heures sont au format GMT + 2 Heures
Page 1 sur 1 - 
Connexion
Nom d'utilisateur:    Mot de passe:      Se connecter automatiquement à chaque visite    

CLIQUEZ ICI pour vous inscrire à WebRankInfo (forum, annuaire, outils...)

Connexion

© 2001-2005 phpBB Group, support français
Personnalisation : WebRankInfo ™


 ODP  Firefox  Alsacreations  annuaire webmaster Yagoort