Url Rewriting, et ensuite ?

  • Auteur de la discussion binarythinking
  • Date de début
B
binarythinking
Guest
Bonjour à tous,

C'est mon premier post sur ce forum donc merci à tous ceux qui y participent, j'en ai déjà appris beaucoup.

J'ai développé le site de mon école dont l'adresse officielle (http://www.icam.fr/ist/) est automatiquement redirigée vers : http://ist.groupe-icam.fr/.

Comme notre site était entièrement en PHP/MySQL, je me suis lancé dans une petite phase d'UR pour être correctement référencé.

Malheurseusement, il semble que notre ami Google ne viste que la première page de notre site.

Est-ce que cela vient du fait de la redirection auto car seule la première page de notre site est indexée sous l'adresse officielle ?

Si oui, il y a-t-il un moyen pour que Google vienne également visiter les autres pages ?

Merci d'avance,

Pierre-Louis
 
WRInaute discret
Salut et bienvenu sur WRI,
Le refresh de ta page initiale de redirection : http://www.icam.fr/ist/ n'est pas suivi )par google.
Pour résoudre ton problème il suffit de rajouter sur cette page un lien classique du style si vous n'êtes pas redirigé, avec l'adresse http://ist.groupe-icam.fr/ et là google suivra ton lien.
A+
:wink:
 
WRInaute occasionnel
Bonjour et bienvenue,
je pense qu'il n'y a rien besoin de modifier. Une vérification des entêtes HTTP retournés montre que l'adresse http://www.groupe-icam.fr/ist/ est redirigée sur http://ist.groupe-icam.fr/page-1.html et que le serveur renvoie des codes HTTP corrects (302 puis 200).

Par contre, tu as un gros problème avec la gestion des sessions PHP : pour te rendre compte, visite le site web en désactivant les cookies, et regarde le code source de la page. Toutes les URLs sont du style :
page-100.html?PHPSESSID=d2aaf75a2dd6a1dbd8b277debbeb5ce6
Ceci est un élément blocant pour GoogleBot (et sans doute d'autres robots). Regarde dans la FAQ et les pages d'aide de Webrankinfo pour plus d'informations.

Jocelyn
 
B
binarythinking
Guest
Ok merci pour ces infos.

Je m'étais déjà rendu compte du pb de PHPSESSIONID mais je voulais m'assurer que la redirection n'était pas la cause du pb.

Je vais pouvoir avancer.

Pierre-Louis
 
WRInaute occasionnel
ccgv a dit:
Jocelyn,
Tu me confirmes que Google sait suivre le meta refresh :?:
A+

Justement, il n'y a aucun Meta refresh (balise HTML Meta utilisée dans le bloc HEAD d'une page web) ou alors j'ai très mal regardé ?:
Par contre, il y a une redirection HTTP standard, et ça GoogleBot, ton navigateur préféré ainsi que mon script de vérification d'entêtes savent tous trois les exploiter.

Donc Googlebot tombe sur la page http://ist.groupe-icam.fr/page-1.html et trouve ces vilains PHPSESSID partout et ne prend rien du tout et s'arrête net.

Jocelyn
 
B
binarythinking
Guest
La solution...

Voilà ma feinte de cowboys pour éviter ces PHPSESSIONID...

Cela vient du fait que je place un "session_start()" sur mon fichier d'index.php

Il suffit de détecter un crawler de Google comme visiteur et de desactiver les sessions en attendant qu'il fasse son petit tour...

if(!ereg('google',gethostbyaddr($_SERVER['REMOTE_ADDR']))){

session_start();

}


Je metterai une solution plus "propre" qd j'aurais eu le tps de creuser la question...

Merci à vous pour l'aide,

Pierre-Louis
 
WRInaute passionné
Salut Pierre Louis,

J'imagine que tu dois faire un session_start() ailleurs que dans ton fichier index.php, non ?
Assures-toi de les désactiver tous.

Dan
 
WRInaute discret
Jocelyn a dit:
Justement, il n'y a aucun Meta refresh (balise HTML Meta utilisée dans le bloc HEAD d'une page web) ou alors j'ai très mal regardé ?:
Salut,
J'ai regardé de sa page citée en premie comme adresse officieller : http://www.icam.fr/ist/ qui a un meta refresh : <meta http-equiv="refresh" content="0; URL=http://ist.groupe-icam.fr/">,
c'est tout.
Donc juste une question d'interprétation du Post de base :wink:
Merci de ta réponse,
A+
 
B
binarythinking
Guest
hetzeld a dit:
Salut Pierre Louis,

J'imagine que tu dois faire un session_start() ailleurs que dans ton fichier index.php, non ?
Assures-toi de les désactiver tous.

Dan

Oui merci du conseil mais j'utilise un fichier "index.php" et je viens inclure les différentes pages à l'intérieur (d'où l'intéret de l'UR).En tt cas, il n'y a donc qu'un seul session_start() pour tout le site...

J'ai fait la modif et j'attends le prochain passage de Google (qui passe au moins une fois par jour en ce moment)

Merci à tous,

Pierre-Louis
 
Discussions similaires
Haut