Cet article fait partie des archives de WebRankInfo : certes, il est ancien, mais complet et détaillé pour son époque. Si vous cherchez d'autres informations, faites une recherche sur le site ou participez au forum. Contactez-moi si besoin.
Création de ces balises en 2010
Google propose deux nouvelles balises meta destinées à mieux gérer les problèmes d'attribution de la source d'une série d'articles dupliqués. Ces balises meta (syndication-source et original-source) sont pour l'instant disponibles uniquement dans Google Actualités.
Comment détecter l'article original et les copies ?
Pour l'instant, Google Actualités tente de déterminer quel article est l'original en se basant principalement sur l'antériorité et la notoriété de la source. Malheureusement, Google se trompe parfois :-(
C'est pour tenter d'améliorer cette analyse des contenus dupliqués que Google a imaginé ces 2 balises meta. L'espoir de Google est que l'auteur insère une balise meta précisant qu'il s'agit de l'article original et que les sites qui republient l'article insèrent une balise meta indiquant l'URL de l'article original. Google souhaite aussi que les articles rédigés à partir de plusieurs sources indiquent la ou les URL des articles à l'origine du scoop.
La balise meta syndication-source
Son format est le suivant :
<meta name="syndication-source" content="http://www.example.com/article-original-pouvant-etre-publie-ailleurs.html">
Vous pouvez l'utiliser si vous êtes l'auteur d'un article et que vous proposez à d'autres sites de le publier à leur tour (principe de syndication). Dans l'attribut content, mettez l'URL de votre page (celle de l'article original), c'est-à-dire l'URL officielle (également appelée URL canonique dans le jargon du référencement). Vous devez également demander à ceux qui syndiquent votre contenu d'insérer cette balise (avec la même valeur pour l'attribut content).
La balise meta original-source
Son format est le suivant :
<meta name="original-source" content="http://www.example.com/article-original-scoop.html">
Vous pouvez l'utiliser si vous êtes l'auteur d'un article (pas forcément prévu pour être repris ailleurs), mais l'objectif de Google est surtout que cette balise soit utilisée par les journalistes qui souhaitent citer leur(s) source(s) et notamment la source à l'origine d'un scoop.
Jusqu'à présent, quand on veut citer un article comme ayant servi à la rédaction, on fait simplement un lien quelque part dans le texte. Si plusieurs articles ont servi, on fait plusieurs liens. Google propose d'utiliser autant de balises meta original-source que nécessaire pour indiquer les URL des articles originaux ayant servi.
Si j'ai bien compris (car même les explications de Google ne sont pas claires), je pourrais utiliser pour la page web que vous êtes en train de lire 2 balises meta original-source : une pour citer l'aide en ligne de Google et l'autre pour citer l'annonce sur le blog officiel de Google News (lien non disponible désormais).
Google précise que pour l'instant la balise meta original-source n'est pas exploitée pour l'algorithme de positionnement. Elle n'est collectée que pour faire des tests et des analyses statistiques.
Intérêt de ces balises
A mon avis, ces balises ne peuvent avoir de l'intérêt que si suffisamment de sites qui republient votre article jouent le jeu en précisant que vous êtes l'auteur. Vous pouvez toujours leur demander de le faire mais ça m'étonnerait qu'ils soient nombreux à le faire...
Par ailleurs, ces 2 balises me semblent bien trop compliquées. J'ai dû lire 4 fois la documentation officielle de Google, en plus de l'annonce sur le blog et quelques autres articles...
Enfin, on a du mal à comprendre pourquoi Google n'a pas utilisé la balise d'URL canonique. La raison est que les 2 balises syndication-source et original-source sont destinées exclusivement à Google Actualité (et que les significations ne sont pas tout à fait identiques).
J'ai néanmoins rajouté ces 2 nouvelles balises à mon tutoriel sur les balises meta.
Évolution de ces balises
En 2011, Google a privilégié l'utilisation de la balise rel=canonical pour identifier le contenu original et dupliqué, en remplacement de la balise original-source.
En 2012, Google Actualités a annoncé que la balise syndication-source était dépréciée et que la gestion des contenus dupliqués reposait sur la balise rel=canonical et les balises méta "disallow" ou "noindex".
En 2023, Google a mis à jour ses directives, en raison de l'inefficacité fréquente de la balise canonique pour les contenus syndiqués souvent modifiés par les éditeurs de sites web. Google recommande désormais d'utiliser les balises "noindex" ou "disallow" pour empêcher l'indexation de ces contenus syndiqués.
Ils font un copier coller de la description du produit sur leur site.
@JPP : s'ils ont un site à forte notoriété ça peut poser pb, ils pourraient passer devant dans les résultats Google. De toutes façons c'est illégal de copier le contenu des autres, il faut leur interdire.
Salut,
j'ai un site marchand et des clients reprennent les descriptions de mes pages produits.
Est-ce que ces balises sont utiles à mettre même si ce n'est pas des articles?
Merci par avance.
@JPP : ça veut dire quoi concrètement ils les reprennent ?
En tant que photographe professionnel, ça me fait penser à la fameuse mention D.R. (droits réservés) du crédit d'une photo : ça part d'une bonne intention, c'est peu utilisé au départ (lorsque que les éditeurs faisant l'effort de trouver et citer l'auteur d'une photographie) pour être ensuite banalisé, détourné et violé (tout le monde s'auto-proclamant auteur "sauf preuve du contraire", on voit même des "D.R. + nom de la rédaction" ce qui est aberrant, alors pourquoi pas des métas original-source type "http://d-r.site-diffuseur.com" ?)
GG me laisse perplexe parfois, comme si les agences d'actu allaient jouer le jeu et prendre le temps de renseigner cette méta sur chaque dépêche. On a bien des exemples en photo, voir l'affaire de la "photo volée" emblématique d'Haïti :-s
A+
Franck
Je me demande bien si cela va réellement marcher... à mon humble avis, même 99% des webmasters qui font du duplicate content n'utiliseront pas ces balises, même si ils en ont la connaissance...
Bonjour,
Je vais rajouter la balise original-source sur mon site.
Pour moi ca ressemble à un test. Google cherche à voir qui utilise ses balises et comment.
A terme ils vont sans doute pénaliser les fraudeurs (ceux utilisant la balise en se prétendant auteurs) et favoriser les originaux. Mais pour ca il leur faudra un moyen sûr de vérification.