Vous êtes ici : Dossiers référencement > Référencement et PHP

Membre WebRankInfo ?

S'inscrire Aide

Les sessions : facteur bloquant pour le référencement

Par Olivier Duffez , Lundi 4 août 2008

Comme je l'explique dans mon article "Le PHP est-il néfaste pour le référencement", les variables transmises dans l'URL des pages dynamiques peuvent parfois gêner leur indexation.

C'est le cas des variables de session PHP qui empêchent l'indexation par les moteurs de recherche (sauf rares exceptions). La raison est simple et s'explique par le principe des sessions : un identifiant de session est attribué automatiquement (par tirage au sort) à chaque visiteur qui arrive sur un site utilisant les sessions (par exemple les sites de commerce en ligne). Cet identifiant va l'accompagner pendant toute sa visite sur le site, ce qui permettra au serveur de gérer par exemple son panier d'achat.

Si cet identifiant de session est transmis dans l'URL (sous forme de variable id ou sessionid...), alors à chaque fois qu'un robot d'indexation tel GoogleBot viendra visiter un site, toutes les pages auront une nouvelle URL. Plus précisément, une même page aura à chaque visite une nouvelle URL.

Si GoogleBot indexait ce genre de pages, il pourrait saturer son index rien qu'avec un seul site !

La solution est soit de se passer de sessions, soit de désactiver les sessions quand le visiteur est en fait un robot d'indexation de moteur de recherche (c'est une forme de cloaking acceptée par les moteurs).

Voici un exemple de code PHP de détection de robot (à vous de l'adapter, il est très simplifié) :

// ----------------------------------------------------------------
// renvoie true si le visiteur est un robot de moteur de recherche
// ----------------------------------------------------------------
function isRobot()
{
  $robots = array("Googlebot", "crawler", "Slurp", "Fast","Scooter",
"VoilaBot", "W3C", "msnbot", "ask", "exabot");
  $is_robot = false;
  foreach($robots as $robot)
  {
    if (eregi($robot, $_SERVER["HTTP_USER_AGENT"]))
    {
      $is_robot = true;
      break;
    }
  }
  return $is_robot;
}

Ce script se base sur une correspondance partielle du UserAgent, à vous de l'adapter selon vos besoins.

Remarque : sur vos pages dynamiques, n'oubliez pas de créer des URL propres avec l'URL Rewriting !

Rappel : sommaire de la rubrique PHP et référencement

A propos de l'auteur : Olivier Duffez Olivier Duffez sur Google+ Olivier Duffez sur Twitter Olivier Duffez sur Facebook Olivier Duffez sur LinkedIn

Olivier DuffezConsultant indépendant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC, RueDuCommerce...). Il édite le site WebRankInfo.com qu'il a créé en 2002, devenu la plus grande communauté francophone sur le référencement (+ 200.000 membres et 1,3 million de posts). Il a également créé la société Ranking Metrics, leader des formations emarketing en France (référencement naturel, AdWords, Analytics, réseaux sociaux).

Vous avez aimé cet article ? Partagez-le !

Vous aimez WebRankInfo ? Suivez-nous !

Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.

6 commentaires

  1. Petit Jean-Luc Abdillah dit :

    En ce qui concerne le PHP, les variables de sessions n'ont pas besoin d'être passées par l'URL.
    Mais bon chacun fait comme il le sent.

  2. Olivier Duffez dit :

    si c'est pas dans l'URL c'est où ? dans les cookies ? ils sont refusés par les robots...
    y a-t-il une autre méthode ?

  3. didier dit :

    D'après moi, les variables de sessions ($_SESSION) ne doivent pas passé part l'URL, elles sont conservées en mémoire afin d'être réutilisée tout au long de la visite sur le site.
    Je ne pense pas q'il y ai une grosse influence sur le référencement...

  4. Olivier Duffez dit :

    didier, il faut bien que la valeur de la variable soit enregistrée quelque part... Où est-ce le "en mémoire" ?

  5. Tom dit :

    En fait, hormis l'ID de session qui est généré aléatoirement et est stocké sous forme de cookie par le client, c'est le serveur qui va garder en mémoire les différentes variables de session.

  6. Olivier Duffez dit :

    Oui Tom, et c'est bien cet ID de session qui peut poser problème pour le référencement, car quand les cookies sont refusés ils sont transmis dans les URL.

Postez un commentaire !

Les champs marqués du signe * sont obligatoires. L'adresse email ne sera pas affichée.

En postant un commentaire, vous acceptez les CGU du site WebRankInfo.

Formation référencement et webmarketing

Venez chez Ranking Metrics vous former au référencement, à Google Analytics et aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (financement possible par OPCA, DIF...).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation agréé).

WebRankInfo sur Twitter

Suivez-moi sur Twitter !
WebRankInfo Twitter

Hébergement web

Hebergement web mutualise, dedie

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo. Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.

A partir de 1,90 EUR HT/mois.