Référencement et PHP
Dans : Référencement et PHP - Par Olivier Duffez, le Lundi 4 août 2008
Comme je l'explique dans mon article « Le PHP est-il néfaste pour le référencement« , les variables transmises dans l'URL des pages dynamiques peuvent parfois gêner leur indexation.
C'est le cas des variables de session PHP qui empêchent l'indexation par les moteurs de recherche (sauf rares exceptions). La raison est simple et s'explique par le principe des sessions : un identifiant de session est attribué automatiquement (par tirage au sort) à chaque visiteur qui arrive sur un site utilisant les sessions (par exemple les sites de commerce en ligne). Cet identifiant va l'accompagner pendant toute sa visite sur le site, ce qui permettra au serveur de gérer par exemple son panier d'achat.
Si cet identifiant de session est transmis dans l'URL (sous forme de variable id ou sessionid…), alors à chaque fois qu'un robot d'indexation tel GoogleBot viendra visiter un site, toutes les pages auront une nouvelle URL. Plus précisément, une même page aura à chaque visite une nouvelle URL.
Si GoogleBot indexait ce genre de pages, il pourrait saturer son index rien qu'avec un seul site !
La solution est soit de se passer de sessions, soit de désactiver les sessions quand le visiteur est en fait un robot d'indexation de moteur de recherche (c'est une forme de cloaking acceptée par les moteurs).
Voici un exemple de code PHP de détection de robot (à vous de l'adapter, il est très simplifié) :
// ----------------------------------------------------------------
// renvoie true si le visiteur est un robot de moteur de recherche
// ----------------------------------------------------------------
function isRobot()
{
$robots = array("Googlebot", "crawler", "Slurp", "Fast","Scooter",
"VoilaBot", "W3C", "msnbot", "ask", "exabot");
$is_robot = false;
foreach($robots as $robot)
{
if (eregi($robot, $_SERVER["HTTP_USER_AGENT"]))
{
$is_robot = true;
break;
}
}
return $is_robot;
}
Ce script se base sur une correspondance partielle du UserAgent, à vous de l'adapter selon vos besoins.
Remarque : sur vos pages dynamiques, n'oubliez pas de créer des URL propres avec l'URL Rewriting !
Rappel : sommaire de la rubrique PHP et référencement
Dans : Référencement et PHP - Par Olivier Duffez, le Lundi 4 août 2008
Utiliser PHP sur son site pose-t-il un problème pour le référencement ? Cet article explique que ce n'est pas le cas et donne quelques conseils associés.
Dans : Référencement et PHP - Par Olivier Duffez, le Lundi 4 août 2008
Le PHP est un langage de scripts qui est exécuté par le serveur qui héberge votre site. Il diffère en ce sens du JavaScript qui est exécuté sur le poste client, c'est-à-dire le navigateur.

Schéma très simplifié d'une requête d'une page PHP à un serveur
Le PHP est utile pour ajouter de la programmation dans les pages. Dans certains cas, il est possible d'utiliser aussi bien un langage serveur (PHP) qu'un langage client (JavaScript), par exemple pour insérer la date dans une page.
Pour interagir avec une base de données, il faut que le script soit sur le serveur.
Pour réagir aux actions de l'utilisateur (par exemple lorsque le curseur de la souris passe au-dessus d'une image), il faut utiliser un script sur le poste client.
Quoi qu'il en soit, aussi bien pour un internaute que pour un robot d'indexation comme GoogleBot, la page PHP reçue du serveur est une page contenant du code HTML, exactement comme une page statique ayant par exemple l'extension .html.
D'ailleurs il n'est même pas possible de savoir si la page a été interprétée par un serveur PHP. Le code PHP n'est plus visible par les internautes. Les pages PHP s'écrivent donc comme des pages HTML, avec un bon titre de page, des bonnes balises META, etc.
Rappel : sommaire de la rubrique PHP et référencement
Dans : Référencement et PHP - Par Olivier Duffez, le Lundi 4 août 2008
Chaque page au format HTML comprend un entête, transmis par le serveur juste avant la page elle-même. Cet entête comprend entre autres un code HTTP indiquant le statut de la page. Par exemple si la page est introuvable, l'entête indiquera le code 404 et le navigateur affichera un message d'erreur adapté. Si la page a été définitivement déplacée, le code HTTP doit être 301.
Dans : Référencement et PHP - Par Olivier Duffez, le Lundi 4 août 2008
Pour bien référencer son site, il est nécessaire de bien connaître les techniques de création de sites web. Autrefois uniquement statiques, les sites sont maintenant souvent dynamiques, grâce entre autres à des langages comme le PHP.
Cette rubrique PHP sur WebRankInfo n'a pas pour objectif de vous fournir un cours sur le PHP : vous trouverez des sites spécialisés. Elle est simplement conçue pour vous donner les bases du PHP, ainsi que certains éléments particulièrement intéressants pour bien référencer un site.