Duplicate content : impact du nom de page et de dossier

Jeff-44 · 9 Septembre 2005

Bonjour,
Sur plusieurs sites, j'ai un problème de duplicate content. Je ne trouve comme raison que les points suivants :
- nom de dossier et nom de page identique : nom/nom.php = duplicate content alors que contenu original par raport au site,

- nom de page très proche : nom.php et nom-ze.php = duplicate cntent pour toutes les pages en nom-ze.php alors que contenu très différent que les pages nom.php.

Je ne suis pas certain que cela soit les raisons, mais tous mes test me montrent des contenus yant un taux de similarité = 50 %. Ce qui est très faible.
Est-ce que vous pensez que le nom de page puisse jouer un rôle ???
Mercie pour vos réponses,

CaYuS · 12 Septembre 2005

Bonjour,

Parles tu du site de ton profil ?
Cela me parraitrait un peu gros qu'un seul url, soit responsable du duplicate content, mais bon, c'est un avis purement personnel hein

Néanmoins :

. Si je prends cette page : http://www.environnement-annuaire.net/m ... aturel.php , je me rends compte qu'à http://www.environnement-annuaire.net/milieux-naturels/ il n'y a rien, pas un index. Ne serait il pas mieux, au lieu de répéter tes mots clefs, de renommer le fichier milieu-naturel.php en index.php ?

. Si je compare ces deux pages http://www.environnement-annuaire.net/m ... aturel.php et http://www.environnement-annuaire.net/m ... relles.php au niveau des title & meta, il n'y a au fond que très peu de différence.
Je ne dis pas que c'est la cause, mais je dis qu'il y a moyen de creuser à ce niveau je pense.

En espérant que ça puisse un peu t'aider !

Jeff-44 · 12 Septembre 2005

Bonjour Cayus,
Merci pour ta réponse

J'ai le problème pour ce site. Je vois ps l'intéret d'avoir un index.php ???
J'ai aussi le problème sur un site plus ancien mieux référencé : www.zones-activites.net avec par exemple les pages suivantes :
- http://www.zones-activites.net/isere.php et http://www.zones-activites.net/isere-zi.php
Si tu as des idées je suis preneur

CaYuS · 12 Septembre 2005

Tu ne vois pas l'intérêt d'avoir un index.php ?
Moi je ne vois pas l'intérêt de ne pas en avoir

Je suis un utilisateur bateau, j'étais perdu sur ton site, j'ai retiré le nom du dernier fichier (milieu-naturel.php) en espérant remonter dans l'arborescence, et là je suis tombé sur un dossier avec une liste de fichiers en libre listing ...
Par définition, lorsque tu crées un répertoire A, tu mets un fichier index à l'intérieur qui par la suite pointe vers d'autres fichiers du même ou d'un autre répertoire.
Je ne sais pas, cela me paraît évident...
C'est comme si à la racine de ton nom de domaine tu ne mettais pas de fichier index, et que si on se connecte sur www.example.net on arrive sur un listing de fichier ...

De plus, là tu ne mets pas d'index, mais tu répètes des mots clefs, donc ça n'a pas d'intérêt. Ce n'est pas comme si tu apportais de nouveaux mots clefs.
Après, si tu veux malgré tout ne pas utiliser d'index, interdit au moins le listing du répertoire, ou affiche une page d'erreur, ce qui sera plus "propre" pour tes visiteurs.

Pour les deux autres url citées, je ne prends même pas la peine de regarder plus loin ... les métas sont purement identiques.
Je te laisse corriger ça, et après on en reparle si tu veux

Jeff-44 · 12 Septembre 2005

arg, fichtre diantre que d'erreur

Je te rejoins sur l'idée de l'index, tu as certainement raison. Je pensais que c'était un bon moyen de faciliter le référencement sur les mots clés.
Pour les métas, bein on va essayer de faire fonctionner la boite à imagination

Je ne pensais pas que le poids des méta était aussi important dans le duplicate content.
Merci en tout cas pour tous ces conseils.

CaYuS · 12 Septembre 2005

Attention, après tout ce que je te dis repose sur des supositions personnelles et des anciens posts de WRI.
Je ne prétends pas connaître l'algo du Mr de Stanford...
Je préfère préciser ... qu'on ne me reproche pas de t'avoir fait bosser pour rien

Je dis juste que les métas ont leur importance, la répétition de mots de clef de manière inutile ne devrait pas en avoir, et que donc cela ne sert à rien de partir avec un pied dans le plâtre.
Il vaut mieux se poser des questions sur le pourquoi du comment quand on n'a rien à se reprocher.

Vali valou.

Jeff-44 · 12 Septembre 2005

pour l'histoire des métas, je ne suis pas certain mais cela pourrait être une des raisons. En tout cas c'est la seule que je vois pour le site h**://www.zones-activit**.net. Il était bien référencé, en raison de l'augmentation du nombre de site j'ai du créé ces nouvelles pages. Bon référencement et puis hop disparition

.
Je ne vois que deux possibilités :
- GG décide que le nom de page est pas suffisament différent, mais cela me semble bizarre,
- soit les métas sont trops proches.
Ou alors c'est les deux.
Je vais essayer de bidouiller les métas, je n'ai rien à perdre et ce n'est qu'un seul fichier à modifier

Je te tiens informé.

Sinon pour l'histoire de l'index, je sais pas si je vais me taper tout le travail de faire les modifications. Par contre comment limiter l'accès ? Je pense faire une redirection permanente ??? Bonne ou mauvaise idée ???
Merci

CaYuS · 12 Septembre 2005

Ok tiens moi au courant, cela pourrait être intéressant.

Pour limiter l'accès, un htaccess avec le code suivant suffit :

Code:

Options -Indexes

Après, tu peux aussi faire un redirect permanent de la racine ( /rubrique/ ) vers la page d'index qui ne s'appelle pas index ( /rubrique/tes-mots-clefs.php ).
Cela peut être une bonne idée également (enfin, une idée moins pire, vu qu'au fond de moi je préfère l'utilisation des index)