Google crawle des urls zarbis

WRInaute occasionnel
Je crois avoir déjà rencontré ce genre d'interrogation dans WRI, mais je n'arrive pas à la retrouver.
Grâce à RobotStats, j'ai constaté que les robots crawlaient les pages de mon site. Parfait.
Mais ce qui est bizarre, c'est qu'ils suivent également des pages dont l'url est :
Code:
http://www.vendee-entreprises.fr/annu.php?p=1&id=0bc71ed0e80a177917fbeec248d3f188
Or ces urls sont générées par un script php lorsqu'un internaute effectue une requête.
1- Comment un moteur peut-il suivre une telle adresse ? C'est qu'il crawle le site en même temps qu'un internaute qui fait une requête ?
2- Est-ce néfaste pour le référencement ? J'ai bien compris le principe de l'url rewriting, mais je ne connais pas la synthaxe pour faire une RewriteRule.

Merci les ami(e)s !
 
WRInaute accro
si le script envoie des identifiants de session dans la page, rewriter la page n'y changera strictement rien ...
il faut que tu vire les identifiants de session de ton script. c'est quoi comme script ?
mais, bradeux a raison de te dire de rewriter dans le sens ou ca te supprimera toutes les variables dans la page, et facilitera l'indexation
 
WRInaute occasionnel
xdeslandes a dit:
Comment un moteur peut-il suivre une telle adresse ?
Si qqn effectue une recherche et quitte ton site pour un autre, il va conserver ton adresse "bizard" et la propager via le HTTP_REFERER.
L'autre site va alors le récupérer, et pourra peut être le publier dans ses statistiques (style XITI ou je ne sais quoi). Si ces stats sont publiques (ca arrive), elles seront accessibles aux robots...

Ca peut venir de BL de la sorte ! Google tombe dessus et suit simplement le lien...
 
WRInaute occasionnel
KaZhaR a dit:
bah, apparemment, tu a des identifiants de session passés dans l'url ...
Non, non, ce ne sont pas des identifiants de session, mais l'encodage d'un bout de la requête que je souhaite conserver pour parcourir plusieurs pages de résultats, et aussi pour archiver les requêtes dans un répertoire spécial. En tous cas, s'il y a un url de ce type, c'est forcément à la suite d'une requête.

easyzik a dit:
Si qqn effectue une recherche et quitte ton site pour un autre, il va conserver ton adresse "bizard" et la propager via le HTTP_REFERER.
L'autre site va alors le récupérer, et pourra peut être le publier dans ses statistiques (style XITI ou je ne sais quoi). Si ces stats sont publiques (ca arrive), elles seront accessibles aux robots...

Ca peut venir de BL de la sorte ! Google tombe dessus et suit simplement le lien...
Aaaaaah, d'accord, c'est une possibilité en effet.

@tout le monde :
Ok, je vais me diriger vers le rewriting. Quel genre de suynthaxe dois-je adopter ?
 
Discussions similaires
Haut