Temps pour explorer un sitemap entier ?

Nouveau WRInaute
Bonjour,

Voilà maintenant un mois et demi que mon site est lancé, et qu'il possède un fichier sitemap.xml (re-généré tous les 2 jours pour mettre à jour les url des nouvelles annonces).
Dans la section "outils pour les webmasters" mon sitemap est toujours "valide" depuis le début mais depuis plusieurs semaines j'ai :
Nombre total d'URL : 1145
URL indexées : 136

D'ou ma question : à raison de 136 url indexés en un mois et demi, il faudra plus d'un an pour que google indexe tout le site... et en sachant (ou plutôt espérant) que le nombre d'annonces va augmenter, je me demande si un jour google aura indexé tout mon site ??

En plus sur la page d'accueil du site j'ai un moteur de recherche... qui ne fonctionne qu'avec les pages référencées.. pas cool !

En vous remerciant par avance, bonne journée,

Thomas

Ps : adresse du site ci-dessous (www)
 
WRInaute accro
Si ton site est bien conçu au niveau des liens interne, tu peux complètement t'affranchir du sitemap.

Ton gros problème déjà, c'est que tu as des pages accessibles avec et sans www, ce qui génère pas mal de duplicate content.

Tu as aussi des url qui contiennent des PHPSESSID, ce qui est un frein connu pour le référencement.
 
Nouveau WRInaute
Bonjour UsagiYojimbo,

Bin non, je pense avoir ajouté qqchose dans mon htaccess pour que sans le www redirige vers avec le www :

Code:
RewriteCond %{HTTP_HOST} !^www.gitesdegaule.fr$
RewriteRule ^(.*) http://www.gitesdegaule.fr/$1 [QSA,L,R=301]

Pour les url qui contiennent les PHPSESSID se sont les premières url référencées qui sont toujours présentes, j'ai fait des modifs il y a longtemps dans mon php pour que il n'y est pas les PHPSESSID. D'ou une autre question : y'a t-il un moyen virer ce type d'url référencé (en sachant qu'elles n'existent plus depuis plus d'un mois) ??

Merci pour ta réponse rapide, amicalement,

Thomas
 
Nouveau WRInaute
Tout est question de taille

Bonjour.
En général, le nombre de liens indexés varie tous les 15 à 20 jours. Google n'indexe pas toutes les pages surtout lorqsu'elles sont dynamiques. Qui dit dynamiques dit souvent duplications de liens en fonction de tes catégories, de tes mois , bref de l'architecture de ton site ...
Donc, il indexe les liens uniques de ton site. Le reste, ce sont d'autres liens url de ton site qui pointent sur des pages déjà indexées. Donc aucun intérêt pour lui. Par conséquent, tu auras toujours cet écart !
 
WRInaute accro
Sitemaps provide additional information about your site to Google, complementing our normal methods of crawling the web. We expect they will help us crawl more of your site and in a more timely fashion, but we can't guarantee that URLs from your Sitemap will be added to the Google index.

--> Do NOT rely on XML Sitemaps !
 
Nouveau WRInaute
Bonjour,

Donc si je résume, le sitemap ne sert à rien (ou pas grand chose). En fait pour savoir combien de lien google a référencé pour mon site il faut que je fasse site:monsite ? Si oui, cela revient quasiment au même puisque j'obtiens 180 liens. Or j'ai 850 annonces, plus autant de page correspondant à chaque régions, et de même pour tous les départements. Donc en gros 1000 pages vraiment différentes....

Par ailleurs quelqu'un pourrait-il confirmer ou infirmer UsagiYojimbo et mon url-rewriting pour obtenir le "sans et avec www" ?

Comment enlever les url avec PHPSESSID qui proviennent du début de vie de mon site et qui sont toujours indexés par google ?

En vous remerciant par avance, bonne journée,

Thomas
 
WRInaute accro
Si tu as peu de pages indexées, c'est probablement à cause du fait qu'elles sont mal liées entre elles (pas assez, en tout cas).

Ce que te suggère UsagiYojimbo est correct.

Pour les PHPSESSID, si tu t'en passes actuellement, il suffit de rediriger les urls "avec &phpsessid=..." vers les mêmes URLS "sans &phpsessid=..." ;)
 
Nouveau WRInaute
bonjour HawkEye,

1) "pas assez liées entre elles" : ok, je vais y travailler : ajouter un nuage de tags, des liens vers d'autres annonces par ex. etc...

2) "Ce que te suggère UsagiYojimbo est correct" : cela veut-il dire que mon URL re-writing n'est pas correct dans le htaccess ? si oui as-tu une idée de ce qui cloche ?

3) Pour les PHPSESSID j'en ai toujours besoin, mais je force en PHP le passage de la session par le ini_set. Par contre je peut en effet faire une redirection. Mais les redirection ne sont-elles pas négatives d'un point de vue google ?

Encore merci et merci !!! Bonne journée

Thomas
 
Discussions similaires
Haut