Outil de calcule de similarité : dans quel pourcentage peut on parler de duplicate content

WRInaute occasionnel
Bonjour,

Quelqu'un à t il une idée de la proportion de similarité des textes pour que le texte ne soit pas considérer comme duplicate content ? :wink:

Bonne soirée
 
Nouveau WRInaute
Re: Outil de calcule de similarité : dans quel pourcentage peut on parler de duplicate con

Bonjour,

c'est difficile à dire, on est parfois surpris par les résultats de recherche Google dans le cas de duplicate content.

Avec des titres identiques, c'est déjà un premier signe de similarité.
 
WRInaute passionné
Moi j'ai horreur du dup !
c'est la plus mauvaise pratique de webmastering au monde !

Tout est perceptible dans le dup ! et tout est a prévoir !
 
WRInaute occasionnel
Moi aussi j'ai horreur du dup :p

Mais le theme sur lequelle j'ecrit ( dans le cas pour lequel j'ai tester l'outil : la location ) est un theme ou les meme mot reviennent sur plusieurs site. Il faut appelé un contrat de bail un contrat de bail, une agence immobilière : agence immobilière ...
C'est vrai que je suis la structure d'un autre site rédigé sur le même sujet mais mes textes son redigé par moi, aucun copier collé mais une information significativement la même étant donné que c'est que se soit dans mon texte ou dans d'autre les données sont les même.
 
WRInaute accro
Y a des sites qui coule avec un article entier en DC, d'autre avec des parties de texte, d'autre avec les titres.
Y a des sites qui reste positionné avec TOUT en DC.

GG est impénétrable là dessus.
 
WRInaute passionné
J'ai remarqué que ça dépend du secteur, si je prend par exemple le business de l'adulte, où c'est toujours les mêmes termes qui reviennent, Google a plus de mal à discerner DC de description simplement similaire. En revanche, pour d'autre secteur, un vocabulaire un peu trop similaire, et Google n'indexe même pas la page.

Je me demande aussi si "avoir les mêmes liens externes" sur les différentes page ne joue pas énormément aussi. Donc, deux articles quasi similaires mais avec des liens externes vers des sites n'ayant aucun rapport passerait plus facilement que des articles un peu similaires mais avec le ou les même liens.
 
WRInaute passionné
milkiway a dit:
Un site complet peut il "tomber" pour deux pages similaires ?

Non. Enfin, en tout cas, si le site à plus de 2 pages. Je pense que le pourcentage de duplicate toléré est inversement proportionnel à la quantité du contenu du site.
 
Nouveau WRInaute
Bonjour selon le site positeo.com, je pense plus de 50%
mais selon l'algo de gg personne ne sais,
ya aussi siteliner pour le duplicate en interne
 
Nouveau WRInaute
Bonjour selon le site positeo.com, je pense plus de 50%
mais selon l'algo de gg personne ne sais,
ya aussi siteliner pour le duplicate en interne
 
Nouveau WRInaute
Rod la Kox a dit:
Y a des sites qui coule avec un article entier en DC, d'autre avec des parties de texte, d'autre avec les titres.
Y a des sites qui reste positionné avec TOUT en DC.
Dans ce cas, c'est peut-être que le DC n'est pas la cause du déclassement :wink:
 
WRInaute occasionnel
Re: Outil de calcule de similarité :

supergago a dit:
Bonjour,

Quelqu'un à t il une idée de la proportion de similarité des textes pour que le texte ne soit pas considérer comme duplicate content ?
On reprend ... Pour le duplicate content, c'est une cause de sanction depuis 2008 (sur WRI, j'ai beaucoup bossé et publié sur le forum). Maintenant, ce que Google comprend:
. les synonymes (travail et boulot .... ma gamine dans un truc à mémoriser pour l'école avait fait un superbe lapsus pour bouleau ... l'arbre qu'elle ne parvenait pas à se rappeler avait dit travail: un travail blanc :lol: )
. la structure simple des phrases: je travaille pour un patron ... je bosse pour une entreprise
. des mot identiques mais de définition différente: essaye restaurateur + ville et tous des restaurants (et oui, sans le mot sur la page) et restaurateur meuble ... plus que des menuisiers.
. des morceaux de phrases, juste 4 mots suffisent sur de petits contenus sur deux pages (surtout si l'autre est bien vu: fait toi copier par wikipediatre - ce qui est régulier - et tu descend).
. copié par des sites parasites (les pires utilisent les résultats de Bing - juste les résultats de recherche (imparable pour bloquer les copieurs automatique)

Reste qui copie qui: aucune logique, pas la page la plus ancienne, pas celle qui reçoit le plus de liens, pas celle qui reçoit forcément les meilleurs .
Pourtant, dans la pratique, le duplicate est réduit entre sites différents pour une espèce de réputation. Reste en interne, une page passe et l'autre pas: seul problème c'est généralement la petite page qui passe (un peu).

j-mi a dit:
bha chippote pas prends des adwords
Et c'est du référencement? Le but de ce forum est de gagner des visiteurs par ses connaisances et son travail: pas payer ... avoir des visiteurs et plus payer ... plus de visiteurs (en plus que ta réponse est hors propos)
 
Discussions similaires
Haut