Google: flux RSS=duplicate content?

WRInaute passionné
bonjour!

la question est simple... après avoir soumis un de mes sites dans des annuaires utilisant les flux RSS, je me suis rendue compte que ces derniers utilisaient l'intégralité de mes articles sur leur propre site...

cela est-il considéré par Google comme du Duplicate Content? cela peut-il nuire au "vrai" site, ou plutôt à l'annuaire?
 
WRInaute occasionnel
Honnétement modifie tes flux rss pour avoir qu'une partie de tes articles genre 200 caractères + le titre avec le lien vers ton site...

Sinon je pense pas non plus qu'il y ai risque de duplicate mais c'est on jamais ^^
 
WRInaute passionné
carole heinz a dit:
je me suis rendue compte que ces derniers utilisaient l'intégralité de mes articles sur leur propre site...
Si tu leur donne l'article en entier via ton flux, ils en ont le droit.

carole heinz a dit:
cela est-il considéré par Google comme du Duplicate Content ?
Non, sinon, l'intégralité de la presse serait en Duplicate vu qu'ils reprennent les articles des SP et autre AP, FP, etc...

carole heinz a dit:
Cela peut-il nuire au "vrai" site ?
Uniquement si ton article est indéxé après la page de l'annuaire qui affiche ton flux. GG prennant en compte le premier arrivé.
 
WRInaute accro
Si le site en question te fais un lien tu as toutes les chances de passer devant lui...
Google n'est pas (totalement) idiot... ;)
 
WRInaute passionné
Audiofeeline a dit:
Si le site en question te fais un lien tu as toutes les chances de passer devant lui...
Google n'est pas (totalement) idiot... ;)
C'est encore à vérifer.

Et encore faut-il qu'il le fasse lien. ;-)
 
WRInaute accro
J'ai des articles qui sont régulièrement proposés sur des DiggLike et ça n'est pas pour ça que je ne suis pas devant eux...
Ce qui est logique...
Si le site qui "vole" votre contenu passe devant vous c'est qu'il faut continuer votre référencement...
 
WRInaute passionné
Audiofeeline a dit:
Si le site en question te fais un lien tu as toutes les chances de passer devant lui...
Google n'est pas (totalement) idiot... ;)

Ca dépend du site qui reprend ton contenu (contre un site ayant un peu de poids, c'est moins évident) et ca dépend des jours.

Google n'est pas particulièrement cohérent pour traiter ce genre de cas : 1 coup tu es devant, le lendemain tu es derrière...
Même s'il fait en général plutôt mieux que les autres moteurs.
 
WRInaute accro
De toute façon ces sites qui copient sont facilement identifiable je pense, il faut peut être contacter Google dans ce cas?
 
WRInaute passionné
C'est pas non plus du spam, ils reprennent juste un flux (partiellement ou totalement) qui est diffusé, ça peut s'apparenter à de l'aggrégation de contenu, simplement, ils ont pour eux l'ancienneté, des BL solides...

Un site plus jeune qui n'a pas particulièrement poussé son référencement ne fera pas toujours le poids.

Je ne suis pas sûr que Google cherche réellement à y remédier, (même si dans la dernière version de leurs "conseils aux webmasters" il y a un paragraphe sur les 'scrappers' et qu'ils conseillent de produire du contenu original).

Tu peux toujours demander aux webmasters de retirer ton flux, et je pense que la plupart du temps ils le font, mais d'un autre côté, en attendant de grossir et de "faire le poids", ça fait des BL et peut, selon les cas, générer du trafic.
 
WRInaute passionné
Audiofeeline a dit:
De toute façon ces sites qui copient sont facilement identifiable je pense, il faut peut être contacter Google dans ce cas?

Enfin, là, on parlais de rss, et donc, de l'autorisation au site d'afficher le contenu du flux.

Si je pond un article, sur un de mes sites qui vient juste de débuter et qu'il est repris via un flux sur Krosoft, je ne m'étonnerais pas que leur page soit indexée avant la mienne et de meilleur manière.
Il me faudra alors déployer de l'énergie pour le voir arriver en tête. :wink:

Edit : Tout pareil que Monty973 qui est passé 2 mn plus tôt :lol:
 
WRInaute accro
carole heinz a dit:
bonjour!

la question est simple... après avoir soumis un de mes sites dans des annuaires utilisant les flux RSS, je me suis rendue compte que ces derniers utilisaient l'intégralité de mes articles sur leur propre site...

cela est-il considéré par Google comme du Duplicate Content? cela peut-il nuire au "vrai" site, ou plutôt à l'annuaire?
Ce serait à souhaiter en tous cas.

Pour qu’il y ait du contenu dupliqué il faut avant tout qu’il y ait un contenu original.

Google sait déterminer l’original de la copie, par la date de parution.

Dans le cas contraire, ton contenu profiterait aussi à d’autres.
 
WRInaute passionné
salva a dit:
Google sait déterminer l’original de la copie, par la date de parution.

Pas toujours.

J'ai vu des articles originaux indexés en premier ils étaient le seul résultat pour une recherche sur leur titre exact quelques heures après parution.

2 jours plus tard, ils étaient en 2nde position dans les SERPs sur cette même requête avec devant un site qui reprenait seulement l'extrait de leur flux.

Evidemment, c'est l'exception, la plupart du temps "l'ordre" et respecté, mais c'est pour ça que je disais plus haut que Google n'est pas très cohérent pour ce genre de choses.
 
WRInaute accro
Monty973 a dit:
salva a dit:
Google sait déterminer l’original de la copie, par la date de parution.

Pas toujours.

J'ai vu des articles originaux indexés en premier ils étaient le seul résultat pour une recherche sur leur titre exact quelques heures après parution.

2 jours plus tard, ils étaient en 2nde position dans les SERPs sur cette même requête avec devant un site qui reprenait seulement l'extrait de leur flux.

Evidemment, c'est l'exception, la plupart du temps "l'ordre" et respecté, mais c'est pour ça que je disais plus haut que Google n'est pas très cohérent pour ce genre de choses.
C'est la raison pour laquelle j'ai rajouté:
Dans le cas contraire, ton contenu profiterait aussi à d’autres. :wink:
 
WRInaute accro
C'est aussi un peu ce qui se passe quand on commence le référencement d'un site, les annuaires passent devant généralement MAIS ça apporte du trafic au site qui n'est pas encore populaire dans les moteurs...

Etre présent dans Wikio par exemple peut faire du tord au début mais devient assez vite favorable car ça fait souvent de bon BL...

Moi j'attendrai un peu et si la situation n'évolue pas là je contacterai les "agrégateurs"...
 
Nouveau WRInaute
quelle limite pour eviter le DC ?

je réagis à ce post car j'ai un probleme similaire et je suis tombé sur cet article fort interessant
-http://googlewebmastercentral.blogspot.com/2006/12/deftly-dealing-with-duplicate-content.html
...qui souleve quelques questions
Si on choisit de ne diffuser qu'un extrait, qui serait selon un article récent paru sur le blog de google pas consideré comme du DC ( La citation de brefs extraits n’est pas du duplicate content.), quelle est selon vous la limite à ne pas franchir pour rester dans l'"extrait" ?
Toujours dans cet article, il dit "Google choisit une page pour les résultats de recherche et exclut l’autre" car il ne veux pas mettre deux contenus identiques dans une même page de résultat.
mais si le site est qui reprend le contenu est référent dans le domaine, il va pousser le site source en tête des resultats mais n'y a t-il pas un risque pour le site reprenant ce contenu ?
vous voyez, ça ne me derange pas de pousser un site avec un contenu dont je reprends des extraits mais j'ai pas trop envie d'être pénalisé...
et vous, vous reprenez du contenu, des extraits tout en étant une référence du sujet?
 
WRInaute accro
Encore une fois, je ne pense pas que Google ignore les flux RSS.
Sinon des sites comme wikio auraient été blacklistés depuis longtemps.
Je reste persuadé qu'il n'y a pas de DC possible.
Sinon on peut estimer que GNews fait du DC...
 
WRInaute discret
J'ai une question complémentaire :
le flux RSS de mon site indiquait l'auteur, la date et l'heure des articles.

Mes articles sont partagés sur facebook, twitter, wikio... ainsi qu'un site ami.
J'ai enlevé la date et l'heure de ces articles... est ce que cela peut avoir un impact sur la détection par Google du "premier" article, et donc considéré que, par exemple, mon site propose des articles en duplicate content?

La date et heure apparaissent toujours sur mes articles, seulement pas dans le flux RSS... que je voulais plus propre...


===

Autre question sur même sujet :
le flux rss est repris par un site ami, sur le meme sujet que mon site. Le webmaster publie le flux une fois par semaine sur son site, en rajoutant systématiquement un lien vers (l'accueil de) mon site.

Mon site est beaucoup moins bien placé que le sien... ce qui m'embete...
Est ce que vous pensez que Google pénalise mon site ou ne prend plus en compte ses liens retours sur chacun des articles?

ça m'embêterait de lui dmander de ne plus reprendre mes articles car c'est un ami, et mine de rien je récupère quand meme du traffic via son site...
 
WRInaute accro
Il ne faut pas uniquement penser en fonction du référencement, mais aussi et surtout en fonction des utilisateurs. Avoir viré la date du flux est dans ce sens une erreur, parce que du coup elle ne pourra plus être affiché par les agrégateurs des utilisateurs.

Quand au flux RSS, perso je ne publie pas l'intégralité du contenu de mes articles dans celui-ci, mais une accroche incitative, qui va du coup motiver l'utilisateur à cliquer sur le lien.
 
WRInaute discret
UsagiYojimbo a dit:
Il ne faut pas uniquement penser en fonction du référencement, mais aussi et surtout en fonction des utilisateurs. Avoir viré la date du flux est dans ce sens une erreur, parce que du coup elle ne pourra plus être affiché par les agrégateurs des utilisateurs.


C'est à dire?
Quelles informations recommandes tu de laisser?
Titre, date?

(Avant mon flux était formatté : titre - par (auteur) le (date) x (heure))
Formattage du CMS, qui était trop... lourd.
 
Nouveau WRInaute
Bonjour

Une petite ( !! ) question SVP:

Attitude de Google par rapport au duplicate content en ce qui concerne :

1/ Flus RSS qui, en quelques sortes, reprennent les articles originaux même si "en apparence" on ne voir qu'un partie du texte, le reste étant dans "lire la suite".

2/ Cas des sites qui reprennent (ou même re- re- prennenet !) les annonces de ventes ou d'achat d'objets ou de biens immobiliers.
Est-ce du duplicate content dans ce cas ?

Cela voudrai dire que bien des annuaires et bons nombres de sites d'annonces ne servent à rien dans la mesure ou il ne seraient pas vraiment indexés... bizarre et complexe à résoudre... :mrgreen:

Merci pour vos idées et commentaires
Cordialement
Alann
 
Discussions similaires
Haut