indexation des pages php

  • Auteur de la discussion Auteur de la discussion marphi
  • Date de début Date de début
WRInaute discret
bonjour
j'ai toujours cru que les extensions .php n'étaient pas publiques, or je constate sur un site une indexation de +3000 pages par gg, qui sont toutes en extension .php.
Cela veut il dire que les robots appelent les pages et les lisent quand même ?
merci de m'informer ou de m'indiquer un post traitant de la réponse
 
WRInaute passionné
marphi a dit:
j'ai toujours cru que les extensions .php n'étaient pas publiques

J'ai pas tout compris là...


Heureusement que google indexe les pages en php sinon je change de boulot: Je vais élever des chevres dans le Larzac
 
WRInaute discret
pourquoi dit on alors que les sites en php sont tres difficiles à référencer ?et quel est alors l'interet du rewriting ?
 
WRInaute discret
Les pages en .php simple ne sont pas dur a référencer. Par contre les pages avec des variables elles ont du mal à être digéré par google. Mais on peut faire de l'url rewritting en mettant .php au lieu de .html :wink: . L'important est de cacher les variables au robot.
 
WRInaute impliqué
c'est surtout du au passage de variable dans les urls, cela peut poser des problemes pour certains robots et ralentir voir rendre impossible l'indexation de certaines pages. Le rewriting permet de pallier a cela en fournissant des url propre plus facilement indexable.
 
WRInaute passionné
Ce qui pose probleme avec les sites en php ce sont les variables qui sont présentes derrieres les URL du style toto.php?id=24&article=4586999&version=fr&index=2

Par exemple là tu as 4 variables derriere:
id,article,version et index qui ont toutes une valeur et grace à ces valeurs ça te permet d'afficher une page avec un contenu particulier.

Sauf que google comme la plupart des moteurs, il aime pas les url dites fantaisistes (avec des variables derriere) et il les indexe peu voir pas. Plus y aura de variable plus il aura du mal à indexer ta page. On dit qu'il ne faut pas depasser environ 3 variables.


L'url rewriting permet de resoudre ce probleme car au lieu d'appeller ta page toto.php?id=24&article=4586999&version=fr&index=2 tu vas appeller une page toto-tata-titi.htm et tu as un petit fichier qi te permet de dire que cette page correspond à celle avec les variables. Pour le moteurs c'est transparent, il va indexer sans probleme ta page toto-tata-titi.htm

Ce qui est en plus interessant c'est que toto tata titi ça eput etre des mots clés important.

C'est ça que tu voulais savoir?

j'avais envie d'ecrire ce matin ^^ (trop de motivation tue la motivation)
 
WRInaute discret
OK donc; c'est juste l'url qui doit etre réecrite dans le cas ou il y a des variables dedans et du coup le robot indexe plus facilement et lit les metas et le contenu ?
et le urlrewriting peut se faire automatiquement par un script ?
si c'est le cas j'imagine donc que chaque script doit se faire individuellement car il dépend des variables ?d'ou le forum spécifique ?

j'ai tout compris ????
 
Nouveau WRInaute
Bonjour,
Les pages avec .php sont considérées par GG comme des pages HTML mais les pages .php avec au moins un paramètre donne un PR0 bien qu'elles soient aussi indexées par GG ... donc intêrêt de rewritting aussi dans ce cas là ?
 
WRInaute accro
>> mais les pages .php avec au moins un paramètre donne un PR0

non :-) tu peux avoir des pages php avec 1, 2, ... parametres et avec PR

la confusion de marphi, c est qu'il a dû entendre qu'un moteur de recherche ne lisait pas le code source php, mais ca n'a rien avoir avec l indexation du resultat html généré par un code source php, quelquesoit l extention de la page :-)
 
WRInaute discret
Et pour les robots, ce n'est pas facile d'indexer les pages avec plusieurs paramètres pour ceci :

1 paramètre : on peut appeler la page seulement par :
mapage.php?param1=aaa

2 paramètres :
mapage.php?param1=aaa&param2=bbb
mapage.php?param2=bbb&param1=aaa

3 paramètres on arrive à 6 combinaisons (si j'ai bien compter :wink: )

donc ceci peux faire un nombre important de pages identiques indexées sous différents noms si le bot ne compare pas les paramètres.
 
WRInaute discret
e-kiwi a dit:
la confusion de marphi, c est qu'il a dû entendre qu'un moteur de recherche ne lisait pas le code source php, mais ca n'a rien avoir avec l indexation du resultat html généré par un code source php, quelquesoit l extention de la page :-)

exactement ça ! cela veut donc dire que le moteur appelle la page php et lit donc ensuite le code source html généré par le php ?
c'est effectivement cela que je ne pensais pas possible ..
 
WRInaute accro
il n'y a que ton serveur qui voit le code php :-) que ce soit moteur, visiteur, ou ce que tu veux, tout ce que l'on voit, c est le code html généré. mais pour en revenir a ton probleme, l extension n influ pas sur le referencement, ce qui pose probleme est le trop grand nombre de variables presents dans une url, d où la nécéssité de l'URL rewriting
 
WRInaute discret
et bien merci, j'ai tout compris !
maintenant pour l'url rewriting, il y a des scripts qui font ça automatiquement ou bien cela depend de chaque site propre ?
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut