Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Un contenu traduit peut-il provoquer des problèmes de contenus dupliqués ?

Un contenu traduit dans une autre langue est-il considéré comme du contenu dupliqué ? Réponse dans ce dossier avec des conseils SEO et une vidéo de Matt Cutts…

Traduction de site Internet

Si vous traduisez un texte d’une langue A vers une autre langue B, alors les textes A et B sont différents et ne peuvent pas poser de problèmes de contenus dupliqués. Je préfère rappeler qu’il est interdit de traduire un texte sans l’autorisation de son auteur…

Evidemment si vous ne passez pas par un traducteur professionnel mais par un outil automatique comme Google Translator, ça n’est pas pareil ! Dans ce cas les textes obtenus sont de qualité trop mauvaise pour être publiés. Vous risquez d’avoir d’autres problèmes…

Je rappelle également quelques éléments de base du référencement pour l’international :

  • des contenus traduits dans différentes langues doivent être publiés sur des URL distinctes. En d’autres termes, ne mélangez pas plusieurs langues sur une même page.
  • quand vous publiez un contenu dans une autre langue, assurez-vous que l’ensemble de la page est traduit, y compris les menus, les barres latérales et le pied de page
  • si vous n’avez qu’une seule version de votre site par langue, vous avez ce qu’on appelle un site multilingue, mais pas multipays. Dans ce cas, vous n’avez rien à déclarer ni à configurer, sauf éventuellement inclure des balises d’annotation de langue (mais ça n’est pas indispensable).
  • par contre, si vous avez plusieurs versions de votre site pour une même langue, il est largement recommandé d’inclure des balises d’annotation de langue et de déclarer dans Search Console votre ciblage par pays (idem dans Bing Webmaster Tools)
Pour en savoir plus, lisez mon guide du duplicate content
Traduction et problèmes de contenu dupliqué

Traduction et problèmes de duplicate content

La réponse en vidéo par Matt Cutts :

Source de l’image d’illustration : Shutterstock, sous licence

Cet article vous a-t-il plu ?

Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

29 commentaires

Blount

Franchement, ce serait stupide de considérer cela comme du contenu dupliqué. Ce serait forcer les sites a ne être disponible que dans une et une seule langue.

Répondre
Juggern

j’avais évoqué le sujet il y a peu de temps, voilà qui répond à ma question (Cf.

Répondre
blog moto

verdict ? :)

Répondre
Assurance-Guide.com

Il ne dit pas explicitement que le texte est considéré comme dupliqué, il dit par contre que ça « peut » être considéré comme spam. Effectivement s’il y a beaucoup d’incohérence dans le texte, avec des mots non traduits, etc, Google peut détecter le générateur de texte automatique. Ca rejoint donc l’importance de bien formuler les phrases, de respecter la ponctuation, la grammaire et l’orthographe.

Répondre
bigbangbel

Moi, ce que je comprends, c’est qu’une traduction manuelle de son site ne pénalise pas. Un site multilingue a parfaitement le droit d’exister. Par contre, le traduire seulement avec un outil automatique comme GG translate peut être considéré comme spam.

Répondre
Juggern

@Blount : Pas obligatoirement mais par contre obligatoirement un site multilingue.

Dans mon post, je posai cette question parce qu’une news était tombée sur le blog central de Google à ce sujet. J’étais anxieux parce que le contenu Français et l’autre langue sont sur des NDD différents et non sur une structure de site multilingue.

Bien que je te rejoigne sur le coté absurde de la chose, nous ne savons tout de même pas où Google va nous emmener.

Répondre
Mouhammed

Une question que je me pose. Qu’en est-il concernant les textes religieux diffusés sur un site ? Les textes sont les mêmes et ils sont repris sur beaucoup de sites. Est-ce que Google fait une exception lorsqu’il s’agit d’un cas comme celui là. Si vous avez la réponse j’aimerai bien savoir.

Etant donné aussi que je souhaite faire traduire mon site en plusieurs langues, cet article me conforte dans ma position. Merci.

Répondre
cathy

Coucou Olivier ,
Merci pour ta présentation, c’est très bien ton travail.
Par contre le vidéo en anglais c’est pas facile a comprendre,a part s’il dit la même chose ce qui est écrit.Dans ce cas la, c’est Ok!
Je te souhaite meilleur des choses de la vie.
Cathy

Répondre
Mistra

Nous publions quelques articles traduits sur notre blog donc c’est un sujet qui nous intéresse tout particulièrement.

J’étais certains que la traduction ne poserait pas de problème de duplicate content avec l’article original mais merci pour cette confirmation.

Par contre, il y a souvent plusieurs sites qui vont traduire le même article, c’est là qu’on va se retrouver avec des problèmes de duplicate entre ces sites qui proposent une traduction je suppose.

Sauf si google considère qu’il accepte ça pour les traductions mais je n’y crois pas trop…

Répondre
Paul

Une réponse qui, au demeurant, n’aborde absolument pas la question des droits afférents au texte original ! Il n’est en effet pas permis de traduire comme ça, et comme un sauvage, les écrits publics d’autrui sans autorisation et très souvent, substantielle rémunération.
C’est sans doute incompatible avec le droit à l’universalité de la culture, mais c’est comme ça !

Répondre
Olivier Duffez

On est entièrement d’accord Paul, d’ailleurs j’ai complété mon article…

Répondre
Olivier97410

quote « Google peut détecter le générateur de texte automatique. »

Faux

Google Panda ne detecte pas les spam. Je connai des gens faisant du blackhat qui scrap sur google du contenu texte et insére leurs mot clé a l’intérieur des texte. Se sont des texte Français autogénéré qui veulent absolument rien dire, et sans aucune cohérence. Sauf que c’est « unique » au yeux google. Conclusion il se positionne premier sur tout les mot clé dans les moteur de recherche. Mais je vais pas en faire de la pub, ce n’est pas le sujet.

En tous cas cet article repond à mes question, merci Olivier

Répondre
Olivier Duffez

En effet parfois Google ne repère pas cette forme de spam, heureusement ce n’est pas si fréquent de trouver en bonne position des pages avec un contenu qui ne veut « absolument rien dire ».

Répondre
Fred

Pour les textes autogénérés et complètement tordus indexés en masse, rappelons l’omniprésence de Koolioo dans les SERPs lors du concours « pandaranol »… et il y est toujours d’ailleurs (certes, pas en première page). Le blackhat a encore de l’avenir de ce côté là (d’ailleurs, le suivi de l’indexation de ces pages bidons pourrait former un indice sur l’évolution de l’algo de Google à ce niveau).

Répondre
Chambre Hotes Bourgogne

Merci pour cette info, je ne m’étais pas encore posé la question puisque je n’ai pas encore traduit mon site (qui en aurait pourtant besoin pour un hébergement touristique…) mais elle me serait probablement venue à l’esprit un jour ou l’autre !

@Paul : Il y a tellement de mots dans chaque langue et de manières différentes à la fois de comprendre et de s’exprimer qu’il est difficile à mon avis de retrouver 2 textes complètement identiques sur des traductions manuelles, ce qui ne sera évidemment pas le cas de traductions auto…

Répondre
cathy

Chambre Hotes Bourgogne

je suis d’accords avec toi, et ça 100%, moi qui est origine de SERBE, je te fait pas dire comment j’en souffre avec les expressions, notion et j’en passe..
Malgré 37 ans en France c’est très dur a comprendre Français, je veux dire la langue.. hihih
Google m’aide beaucoup a se sujet , et je leurs remercie pour se travail..
Amicalement
Cathy

@Paul : Il y a tellement de mots dans chaque langue et de manières différentes à la fois de comprendre et de s’exprimer qu’il est difficile à mon avis de retrouver 2 textes complètement identiques sur des traductions manuelles, ce qui ne sera évidemment pas le cas de traductions auto…

Répondre
vincent

Il aurait été intenable pour Google de considérer qu’un contenu traduit est un duplicate content. Une traduction est une opération de transformation avec VA…surtout dans le cas où le contenu est localisé (adapté au lectorat cible).
Et je dirais « ouf »…c’est notre métier.
Par contre, attention, dans le cas de sites marchand (type vente de produits en ligne), pour économiser sur les coûts de traduction notamment mais aussi de production des fiches produits, certains normalisent trop leurs fiches en copiant collant les description et ça…Google n’aime pas bcp bcp…il faut donc bien penser à équilibrer les contraintes…
Merci pour l’article !

Répondre
Paul

Il y a méprise et veuillez m’excuser d’avoir été hors sujet. Je voulais juste rappeler que l’auteur d’un texte, d’une image, ou d’un film, possède un droit moral sur son « œuvre », et qu’il est donc théoriquement interdit de le reproduire, de le traduire à cet effet, même par un professionnel et de la meilleure manière qui soit, sans son autorisation, et l’autorisation de son éditeur. C’est d’ailleurs en général ce dernier qui négocie la transaction, qui n’est pas exactement une cession de droits.
Concrètement, cela signifie que l’auteur ou l’éditeur d’un texte peut s’opposer de manière rétroactive à la publication d’un de ses textes trouvé traduit sur le Web, à supposer que l’éditeur de la traduction ait omis d’en demander l’autorisation de le faire.
Google Translate est ainsi théoriquement conçu pour un usage privé, et non pour que des petits malins mettent à la disposition d’un public parlant la même langue d’autres textes traduits à la volée grâce à ce procédé.
Mais un éditeur plus soucieux du beau langage se trouverait dans le même genre d’infractions en prenant la précaution d’exécuter une traduction parfaite.
Je ne pense pas que les robots soient suffisamment perfectionnés pour faire la différence entre une belle et une mauvaise traduction, ni même, et à plus forte raison, pour reconnaître leurs auteurs dans la langue originelle. Les moteurs de recherche ont une fonction de recension, pas de police. Pourquoi Google investirait-il dans de telles recherches ?
De toute façon, les différentes affaires de « plagiat » de 2011 qui ont défrayé la chronique ont bien montré que même les éditeurs supposés sérieux pouvaient se faire balader par d’illustres auteurs, ou ces derniers par se laisser berner en s’appropriant la pensée de philosophes imaginaires.

Répondre
Olivier Duffez

Je ne pense pas que les robots soient suffisamment perfectionnés pour […] reconnaître leurs auteurs dans la langue originelle

Je ne suis pas aussi sûr que toi Paul, je pense même qu’ils peuvent dans certains cas lister les textes écrits par un même auteur, en se basant sur ses habitudes de rédaction.

Répondre
@job

Un contenu traduit ne peut pas être considéré comme duplique sinon le premier a être duplique serait google car lui aussi est traduit en plusieurs langues.

Répondre
Olivier Duffez

@job : Google n’édite pas de site de contenu donc ta remarque n’est pas vraiment adaptée. Pour les rares sites de contenu édités par Google, le contenu est inédit.

Répondre
cathy

Je ne pense pas que les robots soient suffisamment perfectionnés pour faire la différence entre une belle et une mauvaise traduction, ni même, et à plus forte raison, pour reconnaître leurs auteurs dans la langue originelle

Eh bien ça c’est bien juste Paul, ton article est superbe. On peut dire que c’est bien compliquer tout cela on ce rend compte que la traduction est incomplet par les robots, et heureusement…
Amicalement

Répondre
Paul

Il y a eu l’année dernière aussi une histoire entre la presse belge francophone et Google Actualités, la plupart des titres de la première réclamant au second retrait de toutes les entrées de l’index en référence avec leurs articles, estimant qu’il s’agissait de copies mercantiles et non autorisées.
Autre chose, je suppose qu’il est facile à un robot de détecter des « habitudes de rédaction », mais quand on voit le nombre d’entrées de Google Actualités sur un même sujet, en rapport avec une même dépêche de Reuters ou de l’AFP, je doute sincèrement qu’il s’en donne la peine. Je crois même que, dans une certaine mesure, Google a besoin de « contenus dupliqués » pour subsister. Ses index, dans le cas contraire, seraient franchement pauvres !

Répondre
ybet

On commence par les traductions automatiques. La première chose est de ne pas utiliser Google pour faire la translation (par expérience), il en existe d’autres .
Ces traductions automatiques passent alors ou … pas. Rien à voir avec du contenu dupliqué ou pauvre contenu à priori. Des pages traduites automatiquement passent, d’autres pas du tout. Dans mon cas, c’est uniquement en anglais et je parle un peu l’anglais, du coup je repasse souvent derrière la traduction pour corriger les traductions de termes techniques. Prenons un exemple de traduction technique: onduleur en Français est souvent traduit (y compris par les professionnels en Inverter (un convertisseur) et est utilisé par quasiment tous les techniciens francophones (le terme réels est UPS et … Google sanctionne UPS). Comme quoi les techniques de détections des contenus dupliqués traduits ne sont pas encore au point par Google et j’ai d’autres exemples ou la réelles traduction est sanctionnée. PAr contre (c’est peut-être une explication) en utilisant UPS, on tombe souvent avec du duplicate content des pages anglophones (et pas avec Inverter) …. DU COUP, j’utilise la fausse traduction pour ce terme.
Maintenant, la valeur de ces traductions automatique est TRES FAIBLE. Essayez de traduire une de vos page en anglais puis de retraduire en Français pour voire. L’orthographe et la grammaire sont corrects (je doute fortement que GG détecte dans ce cas une page de pauvre contenu) mais elle est finalement plutôt risible dès que le niveau de vocabulaire de la phrase dépasse celui d’un gamin de 5 ans: c’est peut-être ceci qui permet à Google de détecter un « faible contenu », l’absence d’un réel vocabulaire.
Décidez que ces traductions automatiques sont sanctionnées (MAtt Cutt a largement l’habitude de raconter n’importe quoi, pour mémoire le contenu dupliqué n’était pas pour lui une source de déclassement il y a 4 ans alors que tous les référenceurs même amateurs le savaient depuis plus d’un an).
Ca doit finalement dépendre plus du vocabulaire utilisé que d’une réelle sanction pour traduction automatique: en clair, il n’y a de nouveau pas de règle. Seulement Google voudrait continuer à être le seul à traduire les pages.

Répondre
cathy

Tout a fait d’accords avec toi ybet, moi aussi je passe terrier pour soit disant ranger le vrai langages SERBE.. C’est vrai que la traduction c’est très dur a la accorder, c’est aussi une raison de divers confusion dans la communication sur net, on voudrais coopérer mais pas moyen d’écrire un bon Français.. IL y a aussi une chose très important, il faut savoir écrire exactement en langue qu’on veux qu’il sera traduit aussi exactement.. j’ai fait un essai pour voir a quelle point google traduction commet des erreur dans la traduction.. j’écrit une page d’un livre en SERBE, et j’étais très surprise, il a fait a perfection. Donc j’ai compris si je n’écrit pas exactement bon SERBE j’obtiendrais pas un bon Français..
Une bonne journée
Amicalement

Répondre
CHB

C’est une traduction google ton dernier commentaire cathy ? Parce que si c’est le cas, c’est plutôt correct, même si on reconnait plusieurs fautes de grammaire et de conjugaison…

Répondre
cathy

Là c’est moi qui a écrit librement Chambre Hote Bourgogne, j’essai de me laissé allée.. Les phrases viens de moi, mais tu as raison, en écrivons là, c’est avec le google que je corrige les mots.. si je fait un peu attention peut-être j’y arriverais mieux a faire, mais quand on a beaucoup a faire ça m’aide..
Mais tu as raison j’écrit avec les faut grammaire c’est clair.. il est très compliquer d’allée sur les forums, les gens se font des idées, mais c’est tout simplement qu’on parle en envers ,nous les étranger, et les Français soit qu’il ne comprennent rien, soit il comprennent comme ils veulent comprendre et ça fait de bagarre.. « ou c’est moi qui ne comprends rien ce qu’ils disent les autre »

Répondre
Op

Merci pour cette article Duffez, je me suis informé et former de temps en temps par vos articles et forum, aussi dans le même sujet, je trouve pas que les traductions d’articles posent du problème, mais il faut tjrs jouer sur le contenu et des mots dans le but de mettre un propre rédaction, en général il faut faire un peu d’effort…
Merci

Répondre
Aep

Le commentaire de « ybet » est très juste. Il faut parfois se méfier de Google traduction qui a des fois, une interprétation particulière de certains textes.

Répondre