Problème de référencement avec des liens dynamique & XHT

Nouveau WRInaute
Bonjour,

J'ai fait un site en php pour lequel les liens vers les différentes pages utilisent des variables. Les URL pour chaque options de menu sont donc de la forme :
index.php?page=toto&menu=tata
index.php?page=toto&menu=titi
etc ...
Suivant les valeurs des variables, j'affiche donc un contenu différent, avec des balises META différentes.

J'utilise soit 2 variables, et au maximum 3 variables. Donc d'après ce que j'ai pu lire ici ou là, ça ne devrait pas poser de problèmes pour Google. Je conserve une trace du passage des robots dans un base mysql, ce qui me permet de voir que googlebot passe bien réguliérement sur ces liens depuis des mois.

Le problème est que malgré ces passages réguliers, aucune de ces pages n'est indexée dans google. Seule la page d'accueil qui n'utilise pas de variable est référencée.

J'ai fait de nombreuses recherche pour essayer d'en trouver la raison (j'ai regardé principalement les problèmes de variables dans l'URL) mais a priori ça ne devrait pas bloquer google, comme l'indique les logs que j'ai du passage de googlebot sur ces pages.

La deuxième piste que j'explore, toujours sur les variables dans l'URL est liée à l'utilisation de l'esperluette (&) et de la validation XHTML. Pour que les liens contenant des variables soient valide, j'utilise "&" au lieu de "&" dans les URL, avec la directive php ini_set('arg_separator.output','&');
donc mes URL sont bien interprêté pour la navigation et sont valide XHTML, mais le lien réel est
index.php?page=toto&menu=tata

Est-ce que le problème peut venir de là ? Googlebot serait-il troublé par le & dans l'URL ? Si tel est le cas, comment concilier le référencement de page dynamique et la validation XHTML (autrement que par l'URL Rewriting ) ?

Merci d'avance,

Christophe
 
Nouveau WRInaute
Peux tu m'en dire plus sur la façon dont tu vois le nombre de pages indexées par Google et celles ignorées ?

Je n'ai qu'une quarantaine de pages qui constituent réellement la partie que je cherche à indexer (avec du contenu différent), mais je pense que les pages similaires ignorées proviennent de phpwebgallery qui est installé sur mon site pour la partie galerie photo et que je n'ai pas exclu dans le fichier robot.txt.

Sinon effectivement, je viens de trouver des pages sur google que je ne voyaient pas la semaine dernière lorsque je me suis arraché les cheveux sur le problème, il semble que j'ai posté un peu vite :oops:

Ce qui en même temps répond à ma question, google arrive bien à référencer les liens avec & pour remplacer l'esperluette.

Merci pour ton aide.
 
WRInaute accro
ola de rien...

Pour les pages indexées et ignorées, avec la commande site:www.example.com, tu fais défiler les pages de résultat jusqu'à obtenir le message "Pour limiter les résultats aux pages les plus pertinentes (total : 140), Google a ignoré certaines pages à contenu similaire.
Si vous le souhaitez, vous pouvez relancer la recherche en incluant les pages ignorées."
 
Discussions similaires
Haut