Exclure du référencement, des parties d’une page

WRInaute passionné
Bonsoir les gens d’ici,

Je m’étais déjà posé la question, je croyais avoir une réponse, mais j’ai découvert plus tard que ça ne fonctionne pas.

Je pensais que le
Code:
<!-- google_ad_section_start(weight=ignore) -->
était aussi interprété par le moteur de recherche, mais non.

Et le problème se pose à nouveau, mais encore plus nettement cette fois.

Comme une rapide recherche sur le Net ne donne rien, je pose la question ici, même si je n’y crois pas trop (il semble que aucun moteur de recherche n’a pensé à ça (*), ce que je ne comprend pas). Dans les GWT, je constate par exemple que les mots clés caractérisant un certain site aux yeux de Google, sont totalement non‑pertinents. Ces mots apparaissent effectivement (trop) fréquemment sur les pages, sont nécessaires pour les utilisateurs et doivent donc être présents, mais ne devraient pas être indexées par les moteurs de recherche, parce qu’il ne représente pas le contenu des pages.

N y‑a‑t‑il pas d’autres solutions que de les exclure du contenu HTML des pages et de les faire ajouter par JavaScript après le chargement de la page ? Ça me semble anti‑accessibilité, et en plus ce serait lourd (avec des risques d’erreurs surtout) de faire les modifications nécessaires.

Si quelqu'un a eu vent d’autres pistes…


(*) À l’exception de Yahoo! et de son class="noindex", mais que Google, le monopole, évidement ne supporte pas.
 
WRInaute passionné
J'ai aussi beaucoup cherché, et je 'avoue que je n'ai pas trouvé de solution autre que javascript (conteu dans le fichier .js).
j'utilise un nouveau concept en ajax pour inclure du html dans du html, mais c'est encore moins simple qu'avec le javascript ...

Le dernier recours, si c'est un mot répété, le remplacer par une imagette ... certain programme permettent de générer des images contenant du texte, moi je l'ai développé en interne (pour mettre les adresses email de mon annuaire en image pour ne pas être aspiré), ainsi que le tel des entreprises...
 
WRInaute accro
iframe ou JS/AJAX. La mise à jour n'est pas plus compliquée qu'une page classique (même backend), en AJAX il suffit d'appliquer un layout/template (vide) si requête AJAX (HTTP_X_REQUESTED_WITH).
Mais c'est vrai qu'au niveau accessibilité bof bof, ou mettre un lien dans le container AJAX afin que ce contenu soit qd meme accessible sans JS.
 
WRInaute passionné
@Longo600. J’ai pensé aussi aux images, mais je retombe sur le même problème d’accessibilité. Et si j’ajoute un attribut alt pour être accessible, ben il sera indexé, et ce sera le même résultat que de ne rien faire.
 
WRInaute passionné
tu parles de cette page par exemple? :http://www.les-ziboux.rasama.org/prenoms-arabes-et-occidentaux.html

Tu as des tonnes de balises sur cette page, en plus, cette technique date de 2004, je ne sais pas si cette balise speciale google est toujours d'actualité. Je pense qu'il faut revoir tes balises entetes H2 et H3,car elles n'apporte rien a l'internaute qui cherche sur le web ... Google est capable de mieux interpréter les blocs et types de contenus, tu devrait pouvoir laisser tel quel et enlever tes balises.
 
WRInaute passionné
Non, ce n’est pas ce site, c’est un autre. Oui, il y a un certain nombre de balises, mais elles sont justifiées, à l’exception de 3 ou 4 éléments vides.

En revérifiant le source la page que tu indique, je me suis aperçu que je me suis trompé. Pour Yahoo!, ce n’était pas class="noindex", mais class="robots-nocontent"

@Spout : merci pour tes suggestions (même si je ne pense pas les appliquer)
 
WRInaute accro
hibou57 a dit:
(*) À l’exception de Yahoo! et de son class="noindex", mais que Google, le monopole, évidement ne supporte pas.
peut être parce que ce n'est pas au webmaster de décider quelle partie de texte d'une page mérite la focalisation. Le webmaster décide quelles pages gg (et les bots en général) doit indexer et les bots doivent s'occuper du reste
 
WRInaute discret
Tu ne pourra jamais lé accessibilité et invisibilité au moteurs. parce que par définition, l'accessibilité impose que le texte soit visible sans aucun argument technique, donc... accessible à tout le monde, humains bigleux et/ou bots.
 
Discussions similaires
Haut