Eviter l'indexation du texte GOOGLEOFF

Nouveau WRInaute
Bonjour le forum!

J'ai tombé sur un problème que je veux partager et voir s'il y a quelqu'un avec une expérience similaire. Je suis en train d'implémenter un disclaimer sur trois sites. Normalement ces conditions d'utilisations sont modèle unique donc presque la même chose. Je ne veux pas que ça soit détecté comme Duplicate Content, donc j'ai commencé a chercher sur le net comme faire pour sélectionner le texte qu'on veut que Google indexe.

Après quelques minutes, j'ai trouvé références et discussions autour du terme "Googleoff" et "Googleon". Apparemment ça sert pour que le robot Google laisse de crawler des morceaux de texte dans le code des pages... ça sera une possible solution, si bien pas beaucoup du monde ont testé ça.

Donc voici mes deux questions:

-Est-ce qu'il y a quelqu'un parmi vous qui a déjà testé cet truc?
-Est-ce que vous pouvez me conseiller comment faire pour que le disclaimer ne soit pas vu comme Duplicate Content... iframe, java, images?

Merci!!!
 
WRInaute accro
Pour faire simple, Google indexe et scanne ce qu'il veut. Les robots.txt sont déjà plus très suivis alors ce genre de pseudo codes, n'y pense pas :)
 
WRInaute passionné
utilise le canonical URL ca marche très très bien chez moi et c'est très facile à mettre en place, suffit d'une ligne dans le header
 
WRInaute accro
Bonjour,

acpnat a dit:
Je suis en train d'implémenter un disclaimer sur trois sites. Normalement ces conditions d'utilisations sont modèle unique donc presque la même chose.
Tu parles d'un petit texte "disclaimer" sur chaque page ou d'une page "disclaimer" par site ?

Si c'est une page par site, c'est sans importance. Google ne pénalisera jamais un site parce qu'il a une ou deux pages semblables à une autre d'un autre site. Si tu veux, tu peux exclure la page des visites du robot avec robots.txt.

Si c'est un texte présent sur toutes les pages, il n'est pas possible de dire à Google de ne pas l'indexer, mais tu peux le faire apparaître par une fonction JavaScript. Si elle est un peu compliquée, Google n'indexera pas le texte.

Jean-Luc
 
Nouveau WRInaute
En fait, le disclaimer apparait dans toutes les pages de diverses sites lorsque on y va pour la première fois dans le site sur n'importe quelle page... le but est de obliger a l'utilisateur de voir les conditions d'utilisation au moins une fois des que quelqu'un vient sur le site... Une fois le disclaimer est vu, il n'a apparait plus. Donc pour l'utilisateur est ok, mais pour le Googlebot? est-ce qu'il va voire ce texte dans toutes les pages et dans tous les sites?

Donc, je crois que je vais mettre ce morceau de code dans un iframe en espérant que Mr Google ne pénalise pas. Moi j'aurais aimé que le truc Googleoff / googleon était une possibilité ça aurait rendu tout ça plus facile. :(

Merci pour l'aide.
 
WRInaute accro
acpnat a dit:
En fait, le disclaimer apparait dans toutes les pages de diverses sites lorsque on y va pour la première fois dans le site sur n'importe quelle page...
Tout dépend de comment tu identifie la première visite (pour savoir si google s'y conforme) et du comment tu affiche le texte.

Imaginons 2 secondes que tu te fie a une variable de session pour savoir si le visiteur est déjà venu.
Imaginons ensuite que si la dite variable vaut 'nouveau' tu envoie un beau contenu html avec ton texte.

Alors google le verra comme n'importe quel visiteur (il ne garde pas les cookies donc ne provoque pas de session sur un site visité) et là effectivement tu sera un plein duplicate.

Il y a plein de solutions pour rendre 'invisible' ce contenu a google comme un document.write() en javascript donc a toi de voir comment fonctionne ta trappe 'première visite'
 
Discussions similaires
Haut