Duplicate content : impact du nom de page et de dossier

WRInaute impliqué
Bonjour,
Sur plusieurs sites, j'ai un problème de duplicate content. Je ne trouve comme raison que les points suivants :
- nom de dossier et nom de page identique : nom/nom.php = duplicate content alors que contenu original par raport au site,

- nom de page très proche : nom.php et nom-ze.php = duplicate cntent pour toutes les pages en nom-ze.php alors que contenu très différent que les pages nom.php.

Je ne suis pas certain que cela soit les raisons, mais tous mes test me montrent des contenus yant un taux de similarité = 50 %. Ce qui est très faible.
Est-ce que vous pensez que le nom de page puisse jouer un rôle ???
Mercie pour vos réponses,
 
WRInaute occasionnel
Bonjour,

Parles tu du site de ton profil ?
Cela me parraitrait un peu gros qu'un seul url, soit responsable du duplicate content, mais bon, c'est un avis purement personnel hein ;)
Néanmoins :

. Si je prends cette page : http://www.environnement-annuaire.net/m ... aturel.php , je me rends compte qu'à http://www.environnement-annuaire.net/milieux-naturels/ il n'y a rien, pas un index. Ne serait il pas mieux, au lieu de répéter tes mots clefs, de renommer le fichier milieu-naturel.php en index.php ?

. Si je compare ces deux pages http://www.environnement-annuaire.net/m ... aturel.php et http://www.environnement-annuaire.net/m ... relles.php au niveau des title & meta, il n'y a au fond que très peu de différence.
Je ne dis pas que c'est la cause, mais je dis qu'il y a moyen de creuser à ce niveau je pense.

En espérant que ça puisse un peu t'aider !
 
WRInaute occasionnel
Tu ne vois pas l'intérêt d'avoir un index.php ?
Moi je ne vois pas l'intérêt de ne pas en avoir ;)

Je suis un utilisateur bateau, j'étais perdu sur ton site, j'ai retiré le nom du dernier fichier (milieu-naturel.php) en espérant remonter dans l'arborescence, et là je suis tombé sur un dossier avec une liste de fichiers en libre listing ...
Par définition, lorsque tu crées un répertoire A, tu mets un fichier index à l'intérieur qui par la suite pointe vers d'autres fichiers du même ou d'un autre répertoire.
Je ne sais pas, cela me paraît évident...
C'est comme si à la racine de ton nom de domaine tu ne mettais pas de fichier index, et que si on se connecte sur www.example.net on arrive sur un listing de fichier ...

De plus, là tu ne mets pas d'index, mais tu répètes des mots clefs, donc ça n'a pas d'intérêt. Ce n'est pas comme si tu apportais de nouveaux mots clefs.
Après, si tu veux malgré tout ne pas utiliser d'index, interdit au moins le listing du répertoire, ou affiche une page d'erreur, ce qui sera plus "propre" pour tes visiteurs.

Pour les deux autres url citées, je ne prends même pas la peine de regarder plus loin ... les métas sont purement identiques.
Je te laisse corriger ça, et après on en reparle si tu veux ;)
 
WRInaute impliqué
arg, fichtre diantre que d'erreur :(
Je te rejoins sur l'idée de l'index, tu as certainement raison. Je pensais que c'était un bon moyen de faciliter le référencement sur les mots clés.
Pour les métas, bein on va essayer de faire fonctionner la boite à imagination:) Je ne pensais pas que le poids des méta était aussi important dans le duplicate content.
Merci en tout cas pour tous ces conseils.
 
WRInaute occasionnel
Attention, après tout ce que je te dis repose sur des supositions personnelles et des anciens posts de WRI.
Je ne prétends pas connaître l'algo du Mr de Stanford...
Je préfère préciser ... qu'on ne me reproche pas de t'avoir fait bosser pour rien ;)

Je dis juste que les métas ont leur importance, la répétition de mots de clef de manière inutile ne devrait pas en avoir, et que donc cela ne sert à rien de partir avec un pied dans le plâtre.
Il vaut mieux se poser des questions sur le pourquoi du comment quand on n'a rien à se reprocher.

Vali valou.
 
WRInaute impliqué
pour l'histoire des métas, je ne suis pas certain mais cela pourrait être une des raisons. En tout cas c'est la seule que je vois pour le site h**://www.zones-activit**.net. Il était bien référencé, en raison de l'augmentation du nombre de site j'ai du créé ces nouvelles pages. Bon référencement et puis hop disparition :).
Je ne vois que deux possibilités :
- GG décide que le nom de page est pas suffisament différent, mais cela me semble bizarre,
- soit les métas sont trops proches.
Ou alors c'est les deux.
Je vais essayer de bidouiller les métas, je n'ai rien à perdre et ce n'est qu'un seul fichier à modifier :) Je te tiens informé.

Sinon pour l'histoire de l'index, je sais pas si je vais me taper tout le travail de faire les modifications. Par contre comment limiter l'accès ? Je pense faire une redirection permanente ??? Bonne ou mauvaise idée ???
Merci
 
WRInaute occasionnel
Ok tiens moi au courant, cela pourrait être intéressant.

Pour limiter l'accès, un htaccess avec le code suivant suffit :
Code:
Options -Indexes
Après, tu peux aussi faire un redirect permanent de la racine ( /rubrique/ ) vers la page d'index qui ne s'appelle pas index ( /rubrique/tes-mots-clefs.php ).
Cela peut être une bonne idée également (enfin, une idée moins pire, vu qu'au fond de moi je préfère l'utilisation des index) ;)
 
Discussions similaires
Haut