Formation par Olivier Duffez

Formation au référencement par Olivier Duffez, créateur de WebRankInfo !
Une formule efficace alliant théorie et pratique, avec une haute disponibilité des intervenants
Cette formule a déjà convaincu plusieurs centaines d'entreprises, pourquoi pas vous ?
Réservez vite votre place en ligne (convention possible pour imputer sur le budget formation)

Formation référencement Marseille

Rewriting et éviter le duplicate sans script

Poster un nouveau sujet Imprimer cette discussion    Forum -> URL Rewriting et .htaccess   Les dernières discussions de ce forum sont disponibles au format RSS
Voir le sujet précédent :: Voir le sujet suivant  
Auteur Message
 
Røi
WRInaute impliqué
WRInaute impliqué

Inscrit le: 08 Aoû 2005
Messages: 320

URL permanente de ce messagePosté le : Mer Fév 21, 2007 12:08    Sujet du message: Rewriting et éviter le duplicate sans script

J'ai une question bien précise et la réponse n'a jamais été donnée dans cette section.

J'ai fait un rewrite d'un vieux répertoire pourri en un tout propre.

Désormais j'ai le répertoire pourri et le propre qui répondent aux requêtes. Donc j'ai un duplicate. Je connais la façon de faire avec un script (vérifier l'URI) mais dans mon cas je n'ai pas accès à un language dynamique ? y a t il un autre moyen ? au niveau d'Apache ?
 
Røi
MirageDemonAsh
WRInaute impliqué
WRInaute impliqué

Inscrit le: 12 Fév 2005
Messages: 404
Localisation: Paris

URL permanente de ce messagePosté le : Mer Fév 21, 2007 12:32    Sujet du message: Rewriting et éviter le duplicate sans script

C'est juste un exemple (à adapter) :

Citation:

3. Evitez le "Duplicate content" ou "Pages similaires"

Indispensable pour un URL rewriting avancé : Le fichier robots.txt est à prendre en compte très sérieusement pour faire copain-copain avec les bons moteurs de recherche

Exemple, je souhaite interdire l'accès de ces URL aux moteurs parce que :
http://www.example.com/modules/newbb/viewf-flat-DESC-363-29

et inutile car c'est un doublon de la page :
http://www.example.com/modules/newbb/page-363-29-flat-DESC-0

qui est inutile aussi car c'est un doublon de la page :
http://www.example.com/modules/newbb/contribution-363-5285-0-flat-0-29

Pareil pour cette page :
http://www.example.com/modules/newbb/viewtopic.php?topic_id=363&forum=29

qui est inutile car c'est un doublon de :
http://www.example.com/modules/newbb/viewf-flat-363-29

Etc.... Ça vous fait rire hein ? Ben pas les moteurs. C'est le meilleur moyen de les énerver car trop de pages identiques.

Alors la seule et unique version de page à faire manger aux moteurs c'est : http://www.example.com/modules/newbb/topic-363-forum-29 / Bien sûr, on peut très bien supprimer ces liens doublons, mais il faut penser aux utilisateurs aussi. Certaines de ces URL sont très pratiques, notamment : viewf-flat-ASC-719-58 et viewf-flat-DESC-719-58 qui permettent à l'utilisateur de choisir l'ordre des messages en un clique (Plus récent, moins récent). Il faut alors faire deux types de tri : pour les moteurs et utilisateurs et pour les utilisateurs uniquement. Remarquez que je place des préfixes différents à ces URL pour mieux gérer le tri. Je souhaite interdire les liens de sélection uniquement et non les liens officiels. Le début du nom doit être différent d'où le préfixe viewf pour ne pas exclure topic. Si leur nom commençait de la même façon, le tri serait impossible.

Je vais donc ajouter des interdictions dans mon fichier robots.txt. Les 5 dernières lignes signalent aux moteurs que toutes les pages qui commencent par viewf, contribution, page, viewforum, viewtopic doivent être ignorées !

User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /cache/
Disallow: /class/
Disallow: /images/
Disallow: /include/
Disallow: /install/
Disallow: /kernel/
Disallow: /language/
Disallow: /templates_c/
Disallow: /themes/
Disallow: /uploads/
Disallow: /modules/newbb/viewf
Disallow: /modules/newbb/contribution
Disallow: /modules/newbb/viewforum.php
Disallow: /modules/newbb/page
Disallow: /modules/newbb/viewtopic.php

http://www.frxoops.org



Dernière édition par MirageDemonAsh le Mer Fév 21, 2007 12:38; édité 2 fois
 
MirageDemonAsh Visiter le site web du posteur
Røi
WRInaute impliqué
WRInaute impliqué

Inscrit le: 08 Aoû 2005
Messages: 320

URL permanente de ce messagePosté le : Mer Fév 21, 2007 12:34    Sujet du message: Rewriting et éviter le duplicate sans script

Bonne idée j'avais pensé au robots.txt aussi je vais le mettre en place, mais aucune autre astuce ?
 
Røi
 
Montrer les messages depuis:   
Revenir en haut    Forum -> URL Rewriting et .htaccess Toutes les heures sont au format GMT + 2 Heures
Page 1 sur 1 - 
Connexion
Nom d'utilisateur:    Mot de passe:      Se connecter automatiquement à chaque visite    

A lire dans l'actualité sur WRI :

En savoir plus : , , , .

Définitions :

CLIQUEZ ICI pour vous inscrire à WebRankInfo (forum, annuaire, outils...)

Connexion

© 2001-2005 phpBB Group, support français
Personnalisation : WebRankInfo ™


 ODP  Firefox  Alsacreations  annuaire webmaster Yagoort