Diriger ordre de lecture par le crawler ?

terminus45

Nouveau WRInaute
Bonjour,
J´ai une architecture de site contenant une rangée d´onglets horizontaux juste sous le bandeau supérieur qui sont des textes non pertinents au regard du référencement. De même, j´ai une colonne à gauche contenant des boutons également en texte et aussi peu pertinents. Plus embêtant : au bas de la colonne de gauche, j´ai un fil RSS qui déploie un texte très volumineux.
De fait, le texte pertinent apparaît bien loin lorsque je fais une recherche avec un simulateur de spider..
Aujourd´hui, j´ai vu l´agence web pour modifier la position de la colonne et la faire passer à droite du champs. D´après elle, ça crée beaucoup de complications pour faire cette modification.
Je souhaiterais conserver le fil RSS car cela permet de faire des mises à jour automatiques du point de vue des robots indexeurs (dites-moi si je me trompe..).
- Est-il possible d´orienter l´ordre de visite du site par le robot en insérant une balise spécifique (lui diriger d´indexer le champs textuel avant la colonne de gauche voire la barre d´onglets supérieure) ?
- Le cas échéant, est-il possible d´ordonner au robot via l´insertion d´une balise de ne pas lire les infos contenues dans la colonne de gauche et la barre d´onglets supérieure (.htaccess balise noindex ?) ?
Quelle serait la meilleure solution selon vous ?
Je vous remercie de votre aide. Bonne journée.

ps: le site pour un aperçu du problème posé : www.externapro.fr
 

e-kiwi

WRInaute accro
Bonjour,

déjà, lors de la première visite, toutes les url sont modifiées :
-http://www.externapro.fr/tarifs.html?CAKEPHP=725a1b0bdf52b7e206fd06201e53a44b

j'espère que vous detectez Google pour ne pas lancer la session (je dis ça, mais j'ai déjà vérifié que cela n'était pas fait :) )

ensuite, pourquoi mettre ce menu horizontal si il n'est pas pertinent pour le moteur (donc pour le visiteur) autant mettre en menu ce qui est important. c'est soit pertinant pour les visiteur et robot, soit pertinant pour aucun des deux.

sinon Google est intelligent, il arrive à voir le texte présent sur toutes les pages (header, menu, colonne gauche) et donc détecte quel est le "contenu" de la page, donc à priori, avoir le menu avant ou après influe peu.

est-ce plus clair ?
 

ap34df

WRInaute occasionnel
La solution est de rendre ton menu pertinant...

Place des ancres dans les liens du menu en faisant en sorte qu'elle représente le bouton graphique et qu'elle soit non affiché.

tu <a href="url></a>, et bien fait <a href="url">keyword</a> avec un hidden sur l'ancre via css.

Ainsi, ca ne change rien au visuel et GG trouve une ancre qui lui plait et ne te sanctionne pas puisque que le mot est la reprise du texte graphique.
 

terminus45

Nouveau WRInaute
Merci à vous 2.

@e-kiwi:
"déjà, lors de la première visite, toutes les url sont modifiées :"
ce résultat est surprenant (pour moi) ! effectivement je m'aperçois que google indique des url à rallonge sur sa page de résultat concernant mon site mais cela ne correspond pas à ce qui est visible quand je navigue sur le site?! comment remédier au problème ?
"j'espère que vous detectez Google pour ne pas lancer la session (je dis ça, mais j'ai déjà vérifié que cela n'était pas fait :) )"
Là je n'ai pas compris ce que vous voulez dire. J'ai fait une recherche sur google mais n'ai pas trouvé de fil conducteur pour développer ce point.. pourriez-vous m'indiquer un axe de recherche (dans les 2 cas d'ailleurs..) ? désolé mais là je dois mettre les mains dans le cambouis mais je ne suis pas garagiste..

Concernant le fil rss, vu qu'il est crawlé avant le texte important, il bouffe tout le champs textuel et rend mon contenu tout à fait secondaire semble t-il..ne vaut-il pas mieux carrément le désactiver?

Merci encore.
 

e-kiwi

WRInaute accro
tu ne le detecte pas car tu n'y fait pas attention. en effet, la première fois de la journée ou tu vas sur le site, il lance la session. une fois que la première page est passé, la session ne passe pas dans l'url, donc tu ne constate plus le problème.

ce qu'il faut faire, c'est récupérer l'ip de ton visiteur, vérifier si il appartient à une plage IP de Google (tu trouvera des listes en cherchant ici) et si c est Google, tu ne démarre pas la session.
 

terminus45

Nouveau WRInaute
Bonjour,
Concernant l'identification de session, validez-vous le code suivant qui se concentre sur le contrôle de l'user agent comme manière de résoudre ce problème ?
<?php
function checkUaRobot(){
$robot = false;
$_UA = array("GoogleBot", "Slurp","MsnBot");
foreach($_UA as $ua) {
if(eregi($ua,$_SERVER["HTTP_USER_AGENT"])) return true;
}
}
?>
if (!checkUaRobot()) { session_start(); }
?>


Merci de votre aide!
Bonne journée à tous.
 

Discussions similaires

Haut