Site duplicate

WRInaute discret
Bonjour j'aimerais savoir a partir de quel niveau un site est considéré comme duplicate.

graphysme identique ?

texte totalement identique ?

texte fortement identique (juste une virgule qui change) ?
 
WRInaute impliqué
texte fortement identique, titre des pages ressemblants, formatage de différentes classe, id ou autre,... enfin, pour résumé, un code html fortement identique...

Pour ce qui est du graphisme, les bots ne voient rien que le code html.. donc le site peut etre en rouge, bleu ou le menu a droite ou autre... etc... ca ne changera rien....
 
WRInaute discret
pourtant on vois souvant des site marchand vendre tous la meme chose (kit graphique ...)

ils sont tous bien referencé et ont tous le meme contenu (fortement)
 
WRInaute discret
yuston ton site principal et ton site en sous domaine sont bien identiques (fortement) ou est la limite entre fortement identique et pas fortement

es tu bien referencé en ayant plusieurs sites identieques
 
WRInaute passionné
eest ce que ca veut dire qu'on a intérét a empécher les bots de prendre les versions imprimable des documents ?
 
WRInaute passionné
N'oubliez pas de rediriger -http://site.com vers -http:://www.site.com car c'est une autre raison de duplicate (involontaire celle là)
 
WRInaute accro
thickparasite a dit:
N'oubliez pas de rediriger -http://site.com vers -http:://www.site.com car c'est une autre raison de duplicate (involontaire celle là)
tu peux détailler car c'est une notion qui est encore un floue pour moi (et pour d'autres je suppose). Et je me demande si sur le site de mon www je suis pas en plein dedans ...
 
WRInaute passionné
Zecat a dit:
thickparasite a dit:
N'oubliez pas de rediriger -http://site.com vers -http:://www.site.com car c'est une autre raison de duplicate (involontaire celle là)
tu peux détailler car c'est une notion qui est encore un floue pour moi (et pour d'autres je suppose). Et je me demande si sur le site de mon www je suis pas en plein dedans ...

regarde si ton site sans www est indexé. C'est pas systèmatique, mais ça peut être un problème, notamment depuis l'update Bourbon de Google qui a mis un bon paquet de sites dans le pétrin à cause de ce problème.

Pour remédier à ça tu as plusieurs solutions, mais la plus simple est de placer un Rewrite Cond dans le .htaccess

Code:
RewriteCond %{HTTP_HOST} !www.tonsite.com$
RewriteRule (.*) http://www.tonsite.com/$1 [QSA,L,R=301]
 
WRInaute accro
thickparasite a dit:
Zecat a dit:
thickparasite a dit:
N'oubliez pas de rediriger -http://site.com vers -http:://www.site.com car c'est une autre raison de duplicate (involontaire celle là)
tu peux détailler car c'est une notion qui est encore un floue pour moi (et pour d'autres je suppose). Et je me demande si sur le site de mon www je suis pas en plein dedans ...

regarde si ton site sans www est indexé. C'est pas systèmatique, mais ça peut être un problème, notamment depuis l'update Bourbon de Google qui a mis un bon paquet de sites dans le pétrin à cause de ce problème.

Pour remédier à ça tu as plusieurs solutions, mais la plus simple est de placer un Rewrite Cond dans le .htaccess

Code:
RewriteCond %{HTTP_HOST} !www.tonsite.com$
RewriteRule (.*) http://www.tonsite.com/$1 [QSA,L,R=301]
oui quand je fais site:....... il me trouve a peu pres le meme nombre de pages (petite variation liée au DC interrogé je suppose). 100.000 pour l'un et 97000 pour l'autre ... mais bon par securité je vais ajouter ca dans le .htaccess
 
WRInaute accro
Code:
RewriteCond %{HTTP_HOST} !www.tonsite.com$
RewriteRule (.*) http://www.tonsite.com/$1 [QSA,L,R=301]
[/quote]

je ne connais rien au rewritting ... j'ai simplement a remplcer mon site par mon nom ou il y a d'autres choses a adpter dans ces deux lignes ?
 
WRInaute accro
gainsdejeux a dit:
C'est effectivement tout ce que tu as à faire :)
merci. mais sinon j'ai pas bien pigé. le fait que je sois indéxé sous les deux nom (avec et sans www : c'est le cas bien ou c'ets le cas qui justement pose probleme ?
 
WRInaute passionné
J'ai oublié de préciser un truc
Au cas où tu ne l'ai pas déjà dans le .htaccess, il faut "allumer" ton rewrite engine.
Donc, le code complet donne


Code:
RewriteEngine on

RewriteCond %{HTTP_HOST} !www.tonsite.com$
RewriteRule (.*) http://www.tonsite.com/$1 [QSA,L,R=301]
 
WRInaute discret
Visiblement, être référencé à la fois avec et sans www. engendre un problème de duplicate content puisque les mêmes pages sont accessibles depuis deux adresses différentes.
 
WRInaute passionné
Zecat a dit:
gainsdejeux a dit:
C'est effectivement tout ce que tu as à faire :)
merci. mais sinon j'ai pas bien pigé. le fait que je sois indéxé sous les deux nom (avec et sans www : c'est le cas bien ou c'ets le cas qui justement pose probleme ?

Tu as peut-être d'autres boulays au cul de ton site, mais celui là donne une forte probabilité de problèmes.
 
WRInaute accro
thickparasite a dit:
Zecat a dit:
gainsdejeux a dit:
C'est effectivement tout ce que tu as à faire :)
merci. mais sinon j'ai pas bien pigé. le fait que je sois indéxé sous les deux nom (avec et sans www : c'est le cas bien ou c'ets le cas qui justement pose probleme ?

Tu as peut-être d'autres boulays au cul de ton site, mais celui là donne une forte probabilité de problèmes.
Bon en tout cas ton code marche bien. je viens de le mettre en palkce et effectivement avant il m'affichait l'url sans www qulque fois alors que maintenant c'ets avec www des la home. Bon on va laisser cuire à feu doux dans la GGmarmitte et on va voir si ca change des choses ... merci pour tes explications simples et claires.
 
WRInaute discret
au depart je posais la question car je souhaite mettre un forum commun a 2 sites.

donc creer mon forum dans un dossier "forum" ou les 2 sous-domaine forum.site1.com et forum.site2.com pouraient pointer.

Ainsi avoir une partie commune (plus facile a gérer pour les utilisateurs, et surtout pour partager les info)

Cela veux dire que mon forum va etre considéré come un duplicate ????

Qu'est ce qu'il existe comme methode pour eviter cela ?
(créer des variables en php qui varient en fonction du sous-domaine qui pointe dessus ?)
 
WRInaute passionné
reg34000 a dit:
au depart je posais la question car je souhaite mettre un forum commun a 2 sites.

Tu peux empêcher l'indexation d'un des 2 forums.
Il suffit de l'interdire dans le robots.txt
Code:
User-agent: *
Disallow:/dossier du forum à interdire/
 
WRInaute accro
jeanluc a dit:
Zecat a dit:
oui quand je fais site:....... il me trouve a peu pres le meme nombre de pages (petite variation liée au DC interrogé je suppose). 100.000 pour l'un et 97000 pour l'autre ... mais bon par securité je vais ajouter ca dans le .htaccess
Commande pour savoir si des pages sont indexées sans le www : -inurl:www site:ruesdemaville.com

Jean-Luc
101.000 pages !!!! pas glop pas glop si j'ai bien compris ...
 
WRInaute accro
La commande que j'ai indiquée donne 777 pages sans le www.

Si tu fais uniquement site:, tu as 100.000 pages. Tu as certainement bien fait d'empêcher l'accès aux pages sans www avec le .htaccess.

Jean-Luc
 
WRInaute discret
de nombreux site de vente en ligne (sonnerie portable, kit graphique, film X lol ...) ont souvent un contenue identique (puisqu'ils vendent la meme chose) et pourtant ils sont bien référencé ?

comment cela est il possible ????
 
WRInaute accro
jeanluc a dit:
La commande que j'ai indiquée donne 777 pages sans le www.

Si tu fais uniquement site:, tu as 100.000 pages. Tu as certainement bien fait d'empêcher l'accès aux pages sans www avec le .htaccess.

Jean-Luc
exact j avais omis le - devant ...bon on va bien voir comment ca evolue.
 
Nouveau WRInaute
Bonjour,

Une simple question à ce sujet (novice):
Quelqu'un sait-il pourquoi Google identifie comme duplicates les sites avec et sans www ? Cela peut pénaliser pas mal de webmasters de bonne foi non informés de ce problème et n'ayant aucune notion de .htaccess
 
WRInaute passionné
eric01 a dit:
Bonjour,

Une simple question à ce sujet (novice):
Quelqu'un sait-il pourquoi Google identifie comme duplicates les sites avec et sans www ? Cela peut pénaliser pas mal de webmasters de bonne foi non informés de ce problème et n'ayant aucune notion de .htaccess

Ils sont au courant chez Google depuis des lustres, mais pas de solution pour l'instant.
 
WRInaute impliqué
eric01 a dit:
Bonjour,

Une simple question à ce sujet (novice):
Quelqu'un sait-il pourquoi Google identifie comme duplicates les sites avec et sans www ? Cela peut pénaliser pas mal de webmasters de bonne foi non informés de ce problème et n'ayant aucune notion de .htaccess

Salut,
lol pour ton appel à l'aide... bon continuons...
Ce problème avec le www. est telleemnt courant que je doute que Google pénalise, donc pas trop d'inquiétude...
Et pour régler ce problème, rien de complique, deux trois lignes sur le htaccess et c'est réglé, plus d'info ici:
https://www.webrankinfo.com/forum/t/interdire-example-com-et-obliger-www-example-com.6195/
 
Nouveau WRInaute
yuston a dit:
Et pour régler ce problème, rien de complique, deux trois lignes sur le htaccess et c'est réglé, plus d'info ici:
https://www.webrankinfo.com/forum/t/interdire-example-com-et-obliger-www-example-com.6195/
Merci pour ton aide Yuston. Après quelques recherches sur le .htacces, j'ai franchi le pas : résultat ok, marche sans pb :) .

J'en profite pour partager le fruit de mes recherches en ajoutant un lien utile (explications) : http://www.webmaster-hub.com/publication/article4.html trouvé sur le site de Kmacleod.

(Edit : En fait, je voulais simplement dire que j'ai trouvé le lien vers le site de Dan sur celui de Kmacleod, mais je me suis peut-être mal exprimé. Désolé Dan.)
 
WRInaute discret
de nombreux site de vente en ligne (sonnerie portable, kit graphique, film X lol ...) ont souvent un contenue identique (puisqu'ils vendent la meme chose) et pourtant ils sont bien référencé et evitent le duplicate ?

comment cela est il possible ????
 
Nouveau WRInaute
C'est que surment qu'il contourne le problème par des techniques. Un simple cloacking permet de contourner le problème mais en créer d'autres... (sur le plan morale et technique)
 
WRInaute discret
et c'est quoi ces techniques ?

parceque la le but c'est pas de tricher pour faire du cloking ou page satelite



Il existe un contenue sur le net (bloc de code -> catalogue de sonnerie, film ...)

et apres c'est a chaque personne souhaitant les vendres de se démerder lol

mais tout le monde a la meme base (catalogue) mais c'est que des sites independants


ils ont tous le meme contenue mais ont tous le meme contenue c'est pas de la triche juste une manière d'etre bien referencé sans etre pénalisé par les autres qui ont le meme contenu de bas (d'ou un risque de duplicate)

Alors comment eviter ce risque de duplicate
 
WRInaute discret
C'est pas tricher c'est pouvoir faire un site avec un contenue commun avec 10 000 personne mais sans tomber dans le duplicate
 
WRInaute discret
Personne ne veux en dire plus, c'est un peu du politiquement correct lol ou de la langue de bois...

On se croirait en politique lol
comme quoi, faut pas se plindre, on a les politiques que l'on mérite...

Aller un peu de polémique pour relancer la discution lol (2eme degres)

Va falloir apprendre a se détente, un forum qui parle du réferencement mais qui ne souhaite pas développer les sujet brulant en répétant tout le temps que c'est TRICHER, alors que les premier a tricher sont se qui font des leçon de morale.

De plus ne triche que celui qui trompe.

Alors certe ceux qui trompe utilise les meilleures methodes (car ils sont bien informés).

Mais du coup ceux qui ne triche pas (les petits gens) mais qui souhaite vraiment travailler leur referencement de manière efficace sont pénalisé car n'ont pas acces a l'info car bien garder sous une chappe de plomb.

Et celui qui veux connaitre tout les mecanisme, ce qui ne veux pas dire les mettre en place, mais plutot comprendre les rouage et fonctionnement se voit traitré de tricheur

Ou alors on lui répette a longeur de forum
pour un bon referencement soigne tes META KEYWORDS ET DESCRIPTION lol la bonne blague...
 
WRInaute accro
... et ton contenu ...

et puis y'a pas que le référencement dans la vie, y'a la fidélisation, le bouche-à-oreille, la publicité, etc...

Mais développer des sujets sur "comment je peux tricher", ou "comment font ces tricheurs" ne serait que permettre justement à ces "petites gens" comme tu les appelles, d'utiliser ces techniques et de venir pourrir le web.

Des gros, gros sites professionnels qui utilisent des pages sattelites (pages de contenu) pour attirer la clientèle potentielle en optimisant chacune de ces pages pour un mot-clé précis, j'en connais, et je peux te dire que la manière d'aborder la question n'est pas "comment puis-je flouer les moteurs et les gens", mais "comment puis-je créer une page attrayante, intéressante, qui incitera le visiteur à pousser plus avant sont investigation et transformer sa visite en un achat".

Le site en question (que je ne citerai pas) dispose probablement de 100x plus de pages de contenu que de pages nécessaires à son fonctionnement.

Pour en revenir à ta question d'utiliser du contenu affilié (sonneries de téléphone et autres): Des sites comme ça, il y'en a plein. Pourquoi? Parceque c'est facile à faire.
Trois clics de souris et deux lignes de code et tu l'as ton site.
Il n'est pas véritablement question de duplicate content, puisque ces sites sont dynamiques (en général les sonneries sont mises à jour en fonction du top du moment), et que l'indexation par GG n'est pas faite sur tous les sites à l'instant "t", donc les pages référencées sont vraisemblablement différentes dans la DB.

De plus, ce contenu tu peux l'agencer comme tu le sens. L'ordre sera donc différent sur les différents sites, etc... Et il y'a souvent aussi un contenu éditorial en plus, ce qui différencie chaque site.

Après tout ça, la question est "comment se différencier?"

On ne parle que d'optimisation du référencement, considérant tous les acheteurs comme impulsifs. Le contenu est important pour le référencement, mais c'est son agencement, l'information complémentaire, la présentation, etc... qui vont d'une part déclencher l'impulsion, mais aussi faire en sorte que le visiteur que tu as obtenu reviendra.

Y'a pas que GoogleBot dans la vie... Y'a des gens aussi.
 
WRInaute discret
waouw ben au moins voila une intervention intéressante lol

et directe et franche, ca fais plaisir a lire

J'espere qu'il y en aura bien d'autres sans langue de bois
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut