Google, PHP et MySQL

  • Auteur de la discussion Auteur de la discussion Geronimo
  • Date de début Date de début
Nouveau WRInaute
Bonjour,

J'ai un site en PHP/MySQL

Cependant, j'ai une page avec une liste de liens vers des "fiches", en fait cette page liste succintement les entrées de la base de donnée et les fiches permettent d'avoir le détail.

Cependant, ces fiches ne sont pas référencées par Google. Est-ce que la raison serait un trop long temps d'accès à la base de donnée (je suis hébergé chez Free) ?

Je vous remercie d'avance pour vos réponses
Geronimo
 
Olivier Duffez (admin)
Membre du personnel
bienvenue sur ce forum !
depuis quand ton site est-il indexé dans Google ?
combien de paramètres sont passés dans les URL ?
utilises-tu des sessions ?
 
Nouveau WRInaute
Bonjour,

Mon site est indéxé depuis Septembre
Le seul argument passé est un id : ?id=4 par exemple et je n'utilise pas du tout les sessions.
 
Nouveau WRInaute
J'ai constaté un autre fait :

Quand je consulte les statistiques de mon site, GoogleBot passe sur toutes les pages mais pas sur ces fiches.

Merci d'avance
Geronimo
 
WRInaute passionné
Geronimo,

Sans que ce soit publié officiellement nulle part, il s'avère que Google réserve un traitement spécial aux URLs qui contiendraient la variable "id" ou ses dérivés.
Probablement parce que les variables nommées "id", "sessid", "phpsessid" , "aspid" ... sont très souvent utilisées pour stocker des variables de sessions ...
Cela s'est vérifié sur un certain nombre de sites.

Tu pourrais simplement faire une légère modification de tes sources pour renommer cette variable "id" en quelque chose de moins "rébarbatif" pour Google, par exemple "fiche".

Cela pourrait faire indexer tes différentes fiches pour autant qu'il y ait des liens "en dur" qui pointent vers elles. Ne t'attend surtout pas à ce qu'un moteur remplisse un formulaire pour accéder à tes pages... :wink:

Dan

<EDIT> J'ai hésité un moment avant de poster ce 1000ème message, m'attendant à une "farce" d'Olivier... un p'tit G de plus, c'est cool. 8) </EDIT>
 
Olivier Duffez (admin)
Membre du personnel
hetzeld a dit:
<EDIT> J'ai hésité un moment avant de poster ce 1000ème message, m'attendant à une "farce" d'Olivier... un p'tit G de plus, c'est cool. 8) </EDIT>
il n'y en auras plus d'autre !!! :o
 
WRInaute discret
Merci pour l'info, j'ai modifié mes variables id....

Je me demandais aussi pourquoi google n'avait pas indexé tous les produits de mon site alors que je les avais préparé pour lui....

On verra dans peu de temps le résultat, mais si tel est le cas, je vais doubler encore le nb de pages indexées.... !


Merci et bonne journée.
 
WRInaute discret
hetzeld a dit:
Sans que ce soit publié officiellement nulle part, il s'avère que Google réserve un traitement spécial aux URLs qui contiendraient la variable "id" ou ses dérivés.
Probablement parce que les variables nommées "id", "sessid", "phpsessid" , "aspid" ... sont très souvent utilisées pour stocker des variables de sessions ...

Après avoir lu cette remarque, je me suis empressé d'aller vérifier mes logs, et effectivement, aucune page contenant la variable ID comme paramètre n'a été visitée...

Merci beaucoup pour cette info précieuse, je vais modifier les pages concernées.
 
WRInaute impliqué
Le comportement de Google avec le paramètre id est curieux, mais la règle n'a pas l'air absolue... :o

J'ai des pages php avec id en paramètre : elles sont bien référencées. 8)
Par contre d'autres pages ne le sont pas. :evil:

Je n'ai pas encore réussi à trouver la raison de ce traitement différent... Seule piste pour l'instant : les pages référencées contiennent un paramètre ID en majuscules, et celles qui ne le sont pas id en minuscules...

De quoi rester perplexe :?: :?:
 
WRInaute discret
Oui, c'est étrange !! Mais le raisonnement de Dan se tient bien, et c'est le seul point qui différencie ces pages des autres qui sont référencées sur CinemaQuiz. Même mes anciennes newsletters ne sont pas référencée, apparemment à cause de ça.

Voila, les pages des quiz avaient un paramètre &id= , je viens de les changer en &quiz=
tout en gardant la double interprétation dans le code pour les anciennes newsletters ou les bookmark.

Pour finir WRI, ne peut-on pas imaginer que les pages php?id que tu as trouvé étaient présentes dans la base google avant qu'un changement d'algo n'interviennent dans la manière dont google suit les liens ?
 
WRInaute passionné
WebRankInfo a dit:
attention, ceci reste le feeling de Dan :?
j'ai trouvé 1.5 million de pages indexées dans Google, ayant dans l'URL les termes suivants :
Code:
php?id
donc il ne faut pas tirer de conclusions hâtives...
Mon "feeling" vient de l'interprétation d'un post de GoogleGuy sur WebMasterWorld... ce n'est donc pas tout à fait déraisonnable de penser qu'il s'agit d'autre chose qu'un tuyau crevé :wink:

Dan
 
Olivier Duffez (admin)
Membre du personnel
Richard a dit:
Pour finir WRI, ne peut-on pas imaginer que les pages php?id que tu as trouvé étaient présentes dans la base google avant qu'un changement d'algo n'interviennent dans la manière dont google suit les liens ?
Ca en ferait beaucoup quand même... Il y a sûrement d'autres raisons ! Peut-être qu'avec un bon PR Google indexe quand même les pages avec un "id" ?
 
Nouveau WRInaute
Je vous remercie pour vos réponses ;

Ca expliquerait peut-être pourquoi des liens vers ces fiches à partir d'un autre site ne sont pas référencés par Google mais par Lycos, par exemple.

Je vais mettre à jour mon site en gardant l'ancienne version en double :-D

Merci encore.
 
WRInaute passionné
Ce qui serait sympa, si les pages se font indexer en changeant le nom de la variable id, serait de revenir poster ici de manière à ce qu'on puisse compléter les "trucs et astuces".

Dan
 
WRInaute passionné
Peut-être pas... le full crawl n'est pas terminé. Avec un peu de chance il peut encore repasser par ton site :wink:

Dan
 
WRInaute impliqué
Ok, je fais le test moi aussi avec mes pages et je vous tiens au courant... :) :)

Si cela marche, je te tresse une couronne de lauriers, Dan :lol:
 
WRInaute discret
J'y penserai Danh, mais je ne peux pas encore dire si ce sera pour la prochaine Dance ou celle d'après. Il faut que je surveille : si le full crawl n'est pas fini chez moi, peut-être qu'il trouvera un lien menant aux pages avec quiz à la place d'id.
 
Nouveau WRInaute
Google a refait deux apparitions furtives sur mon site hier, mais n'a toujours pas indexé ces pages... je crois qu'il faut attendre le mois suivant :'(
 
WRInaute discret
hetzeld a dit:
Ce qui serait sympa, si les pages se font indexer en changeant le nom de la variable id, serait de revenir poster ici de manière à ce qu'on puisse compléter les "trucs et astuces".

Bonjour,

voila, comme promis, je viens vous donner des nouvelles un mois aprés:
Le full crawl a débuté le 16 pour moi.
Et hier, en examinant les logs, je viens de voir qu'il est en train d'indexer toutes les pages qu'il n'avait pas indexé auparavant, à savoir les pages de quiz ainsi que les pages de réponses.

Pour autant, il ne s'agit pas là d'un changement d'algorithme car j'ai encore des pages avec le ?id= (leur indexation est sans interet) et aucune n'a été visitées.

Voila, je pense que ton "feeling" est donc bon Dan !!
 
WRInaute passionné
On y revient deux mois plus tard.... en clair je persiste et signe ! :lol:

Voici ce que vient de déclarer GoogleGuy sur webmasterworld:
GoogleGuy a dit:
Yah, "id=" usually marks a session id, so if you can rename that I would. Also, fewer parameters are better. Good luck!
dans le post: http://www.webmasterworld.com/forum3/14701.htm (message 6)

Il serait donc judicieux de laisser de côté toutes les variables GET nommées 'id' dans les paramètres des scripts php. :wink:

Dan
 
Nouveau WRInaute
Tu pense que ce phénomène est vrai pour toutes les variables contenant id (ex id_truc ou id_machin) ou c'est spécifiquement la variable id qui est concernée ?
 
WRInaute passionné
j'ai des pages en id_quelque chose bien référencées donc je présume que seule id est concernée dans ce cas.


_________________________________
GRANDADDY
 
WRInaute passionné
Raoulmapoule,

( je me marre chaque fois que j'écris ton pseudo :lol: )

Non, je pense qu'il ne s'agit que des variables "id" et "ID" qui doivent déclencher quelque chose lors des visites de GoogleBot.
C'est vrai qu'il y a des sites qui sont indexés avec cette variable dans l'URL, mais ce sont probablement des sites anciens. J'en ai même vu avec PHPSESSID (plus de 2 millions) :lol:

https://www.google.com/search?hl=en&ie=U ... gle+Search

Vu le discours de Googleguy, je pense sage de s'abstenir d'utiliser id ou ID.

Dan
 
Nouveau WRInaute
Très intéressant tout ça !
J'ai donc moi aussi modifié mes scripts pour ne plus utiliser de "id" dans mes url, mais que ce passe t'il si on utilise les sessions ?
Il faut aussi modifier la valeur de PHPSESSID sous peine de ne pas être référencé ?
 
Nouveau WRInaute
Donc on en ouvre pas un 46e ?
Ok, sorry mais le sujet se prêtait à cette question, non ?
Il me reste plus qu'a éplucher tout ça...
 
WRInaute discret
matt a dit:
Très intéressant tout ça !
J'ai donc moi aussi modifié mes scripts pour ne plus utiliser de "id" dans mes url, mais que ce passe t'il si on utilise les sessions ?
Il faut aussi modifier la valeur de PHPSESSID sous peine de ne pas être référencé ?

En réalité, c'est surtout les sessions qui empeche google de te référencer... Donc oui, tu dois les enlever... Les variables ID empechent aussi le référencement uniquement parceque Google les "confond" avec les sessions. :)
 
WRInaute accro

Question stupide...

J'ai un site entièrement en PHP et HTML, je n'utilise pas les sessions, et je suis sur un 240plan de la société OVH.

Cependant, j'ai entendu dire que dans certain cas, les hébergeurs "activaient" les sessions par défaut, même dans le cas où le site n'était pas programmé pour celà, et qu'à ce moment-là, c'était au site à spécifier des instruction idoines, pour qu'il n'y ait pas de sessions ?

Est-ce vrai ?

Je dois dire que pourtant croyant bien connaître le PHP, pas dans son côté "orienté objet" cependant, je ne connais rien au traitement des sessions sous ce langage, je n'ai jamais pratiqué les sessions en PHP.

Merci de vos réponses.

Jean Francois Ortolo

 
WRInaute discret
J'ai eu cette mauvaise surprise sur mon site hébergé chez OVH :

J'utilise des variables de session, mais rien de visible dans l'URL.

Or je m'aperçois en me connectant sur mon site, qu'OVH rajoutait systématiquement sur la page d'arrivée sur le site (la home en général, mais ça marchait avec n'importe quelle page) un magnifique PHPSESSID=xxxxxxxxxxxxxx dans tous les liens présents sur cette page, et pointant vers des pages internes.

J'ai trouvé la parade : il suffit de rajouter dans le code PHP en haut de chaque page :

ini_set('url_rewriter.tags','form=fakeentry');

et hop, disparus les PHPSESSID !
 
Nouveau WRInaute
de mon coté pour ovh jutilise ceci ini_set("arg_separator.output","&");

autrement je viens de lire tous les posts sur la discussion avec lid et bon je vais oser poser ma question :oops:(sa fait un moment que dans ma tete no solution), comment vous faites pour connaitre les pages que google a indexé?

ddoc
 
Discussions similaires
Haut