incohérence indexation GG

WRInaute discret
Bonjour à tous,
après des jours de lecture sur WRI et autres pages web je n ai pas trouvé de solutions et de réponses à mes questions que voici:
-j'utilise "outils pour les webmasters de GG" sur lequel je pense avoir fait le nécessaire pour mon site. J'ai envoyé un sitemaps.xml pour que google index les pages de mon site. sur les 35 urls seules 18 sont indexées!!! pourquoi ne les a t il pas toutes prises????
-ensuite en utilisant le "inurl:slc71.fr" pour voir quelles sont les pages indexées par GG je trouve mes 35 pages 8O
donc je comprends rien, d'un côté il me dit qu il en a indexé que 18 et de l autre je trouve mes 35 :roll:

donc qui dois je croire?
pourquoi mes 17 pages manquantes ne sont pas indexées (et quelles sont elles?)
comment faire pour leur indexation?

est ce du au fait que googlebot n est pas passé sur toutes mes pages?

bref je rame
pour info voici mon site http://www.slc71.fr

si quelqu un à une idée des réponses des solutions
merci
 
WRInaute accro
Bonjour
Les données des outils google pour webmasters ne sont pas en temps réel; il se peut donc qu'elles ne soient pas à jour
 
WRInaute discret
oui d'après leurs outils le robot est passé le 03/06/09 mais à cette date toutes mes pages étaient déjà là et depuis plusieurs mois
donc c'est pour ça que je ne comprends pas trop

de plus en envoyant régulièrement un sitemaps il devrait actualiser? par exemple depuis ce matin je suis passé à 19 urls indexées sur 34 (car j en ai supprimé une)
je ne sais pas pourquoi certaines bloquent. et comment savoir celles qui ne sont pas indexées?

Edit: j ai oublié est ce que la présence d'un fichier robot.txt pourrait changer quelque chose? car actuellment je n en ai pas
 
WRInaute accro
Le fichier Robots.txt n'a qu'un rôle restrictif, il ne peut en rien aider à l'indexation.
Et ce n'est pas parce qu'on envoie un sitemap à Google qu'il indexe forcément toutes les pages qui y sont présentées (la preuve).
Le meilleur moyen d'avoir une indexation complète est de s'assurer que toutes les pages sont accessibles par le moteur, qu'elles ont toutes un <title> et une balise meta description différents, et d'obtenir davantage de liens entrants pour augmenter la fréquence de passage de Google.
 
WRInaute discret
nickargall a dit:
Le fichier Robots.txt n'a qu'un rôle restrictif, il ne peut en rien aider à l'indexation.
Et ce n'est pas parce qu'on envoie un sitemap à Google qu'il indexe forcément toutes les pages qui y sont présentées (la preuve).
Le meilleur moyen d'avoir une indexation complète est de s'assurer que toutes les pages sont accessibles par le moteur, qu'elles ont toutes un <title> et une balise meta description différents, et d'obtenir davantage de liens entrants pour augmenter la fréquence de passage de Google.
pour le title et description c est le cas depuis 5 jours, je n avais pas fait attention lors de la cration. donc peut etre dois je attendre que le bot repasse.
pour les liens entrants vu que c est pour ma société c est compliqué de trouver des partenaires
bon ben je vais attendre dans ce cas

dernière question: indexée veut bien dire répertorier par google et donc s affiche dans les résultats de recherches? si oui pour qio la différence entre inurl et les outils GG?
 
WRInaute accro
Parce que les outils Google ne sont pas à jour ;)
La commande "officielle" Googel pour connaître l'indexation de ton site, c'est :
"site:www.slc71.fr"
 
WRInaute discret
ok donc GWT ne sert pas à grand chose de ce côté là.

en lisant un autre sujet une question me vient à l esprit. Je ne sais pas si tu as jeté un oeil sur mon site mais voilà:
attentionpeut être (voire surement) est ce une question stupide mais :
quand on fait une recherche sur google pour trouver mon site par exemple: "slc71" ma home page est www.slc71.fr/ si ensuite on va sur une autre page (peut importe laquelle) et que l on veut revenir à l acceuil on clic sur acceuil mais cette fois la home page a pour url: www.slc71.fr/index.html est ce que ce sont les deux mêmes pages? cela a t il une influence? est ce normal
bref comme annoncé surement une question con
merci
 
WRInaute accro
Non, ce n'est pas une question con :)

Ceci peut engendrer quelques désagréments, dans le sens ou ta page d'accueil est indexée sous deux adresses différentes.
ce qu'il faut faire pour éviter tout désagrément :

- changer tous les liens menant vers /index.html pour les faire pointer vers la racine du site
- mettre en place une redirection 301 de l'url /index.html vers la racine du site, par le biais d'un fichier .htaccess placé à la racine, contenant le code suivant:

Code:
RewriteEngine on
RewriteCond %{REQUEST_URI} ^/index.html
RewriteRule $ http://www.site.ext/ [R=301,L]
 
WRInaute discret
nickargall a dit:
Non, ce n'est pas une question con :)

Ceci peut engendrer quelques désagréments, dans le sens ou ta page d'accueil est indexée sous deux adresses différentes.
ce qu'il faut faire pour éviter tout désagrément :

- changer tous les liens menant vers /index.html pour les faire pointer vers la racine du site
- mettre en place une redirection 301 de l'url /index.html vers la racine du site, par le biais d'un fichier .htaccess placé à la racine, contenant le code suivant:

Code:
RewriteEngine on
RewriteCond %{REQUEST_URI} ^/index.html
RewriteRule $ http://www.site.ext/ [R=301,L]
8O 8O 8O 8O 8O 8O
c'est du chinois pour moi tout ça. je suis débutant
je suis en html css
je n ai que 35 pages n'est il pas possible de faire autrement plus simple? du style remplacer dans chaque page
Code:
<a href="index.html" > Accueil</a>
par
Code:
<a href="/" > Accueil</a>
:roll: je ne sais même pas si c est crédible ce que je dit
ce que je comprends pas (attention j ai prévenu je suis novice) quand on clic sur www.slc71.fr/ ça pointe bien vers ma page index.html? car c est ce contenu qui est affiché je sais pas si je suis clair
 
WRInaute accro
Si tu te contentes de changer tous les liens pour les faire pointer vers "/", Google gardera quand même en "mémoire" l'adresse "index.html"

Si tu ne veux pas de celà, il faut "rediriger" google vers "/" lorsqu'il arrive sur "index.html" (ce n'est qu'une question d'adresse indexée, car c'est en effet la même chose, le même contenu, le même fichier qui est appelé)

Pour faire cette redirection, il faut donc créer le fichier .htaccess (avec le logiciel notepad ++ par exemple), y placer le code que je t'ai indiqué et mettre ce fichier en ligne à la racine de ton site.

Tu verras alors, si tout est ok, que lorsque tu tentes d'appeler l'adresse www.slc71.fr/index.html, que tu seras redirigé vers www.slc71.fr.
Google aussi subira cette redirection, et fusionnera les deux adresses dans son index.

'sais pas si j'ai été plus clair ?
 
WRInaute discret
donc j ai fait un fichier comme tu m as dit avec le code suivant:
Code:
RewriteEngine on
RewriteCond %{REQUEST_URI} ^/index.html
RewriteRule $ http://www.slc71.fr/ [R=301,L]

mais si je le mets en ligne non seulement ça ne fonctionne pas mais en plus mon site devient introuvable 8O
 
WRInaute accro
Ah peut etre, en même temps je suis pas sur de mon coup pour le code donné ;) Ceci dit, en attendant que quelqu'un de plus compétent que moi vienne donner la soluce adequate pour la redirection, ne te prends pas trop la tête sur ce détail.
 
Discussions similaires
Haut