Googlebot est passé plusieurs fois mais pas d'indexation

Nouveau WRInaute
Bonjour à tous,

Depuis presque 1 semaine, googlebot continue de passer quotidiennement sur mon site, mais les articles de mon blog ne sont plus indexés dans google, alors qu'avant mes articles étaient indexés tous les jours (une rapide recherche dans google me ressortait mes pages).

J'ai un sitemap.xml complet. Et dans google webmaster tools, pas d'erreurs, mais il y a un écart entre le nombre d'URL du sitemap et la case "URL dans l'index" (ce qui corrobore bien mes constats).

C'est normal qu'il y ai des "creux" comme ça, ou il y a un souci à votre avis ?

MErci !
 
WRInaute discret
sosclic77 a dit:
Oui tout à fait c'est bien http://www.sosclic77.fr/ , et en particulier le blog.

Un premier élément de réponse, j'ai vu dans les résultats de google l'url suivante apparaître : http://www.sosclic77.fr/?a3cf29a305e27868aa6a43a22ac1af26=a2699a6571b9 ... 02e579fd18

Commence par mettre du canonical sur des urls de références, compléter ton robots.txt, aller dans le GWT et ignorer les paramètres parasites... voilà je pense une première piste ^^
 
Nouveau WRInaute
Merci pour ta réponse.

Ce liens est "vieux", il date d'avant que j'utilise les URL simplifiée pour optimiser le référencement. J'utilise joomla, donc difficile de mettre un link (pour le canonique) dans la page. J'utilise les URL simplifiées SEF.
Et mon fichier robot.txt est propre.

Et c'est arrivé du jour au lendemain, ça m’énerve :(
 
WRInaute discret
sosclic77 a dit:
Merci pour ta réponse.

Ce liens est "vieux", il date d'avant que j'utilise les URL simplifiée pour optimiser le référencement. J'utilise joomla, donc difficile de mettre un link (pour le canonique) dans la page. J'utilise les URL simplifiées SEF.
Et mon fichier robot.txt est propre.

Et c'est arrivé du jour au lendemain, ça m’énerve :(

Je t'en prie. Mais, je pense qu'il faut y voir un indice si cette url remonte systématiquement dans les résultats de serps. Au passage, rien ne t'empeche de mettre un " Disallow: /*? " dans ton robots.txt si tu veux éviter ce type d'urls (du moins par google car les expressions rationnelles ne sont pas comprise par les autres bots)
 
Nouveau WRInaute
Ok donc ya forcément un problème ? Car je me demandais si ça pouvait arriver de temps en temps que google ne mette pas à jour son index (malgrès que le robot passe) pour un site, pendant plusieurs jours comme ça.

Pourtant j'ai tout vérifié dans webmaster tool, pas d'erreurs d'exploration, j'ai re déposé le sitemap contenant 19 URL (simplifiées). Et il me mets toujours : 19URL fournies, 12 URL dans l'index. Il m'en manque 7.

Et c'est pas plutôt "Disallow: /?*" :?:
 
WRInaute discret
sosclic77 a dit:
Ok donc ya forcément un problème ? Car je me demandais si ça pouvait arriver de temps en temps que google ne mette pas à jour son index (malgrès que le robot passe) pour un site, pendant plusieurs jours comme ça.

Pourtant j'ai tout vérifié dans webmaster tool, pas d'erreurs d'eploration, j'ai re déposé le sitemap contenant 19 URL (simplifiées). Et il me mets toujours : 19URL fournies, 12 URL dans l'index. Il m'en manque 7.

Je vais rajouter le Disallow: /*? déja.


Attention, je t'ai juste indiqué ce que j'ai détecté en faisant une analyse rapide de ton site. Je ne t'assure pas qu'il n'y a que ça comme problème mais c'est déjà un premier élément.

Un autre problème important sur ton site au passage, il est accessible soit à l'adresse avec www. soit à l'adresse sans www. Ca c'est pas bon!

Bon courage
 
Nouveau WRInaute
Merci, je viens d'ajouter une redirection pour forcer les www dans mon htaccess.

Par contre, je viens de tilter à un truc ... sur mon site j'avais 2 flux RSS dont 1 qui venait de hardware.fr.
La semaine dernière je me suis apperçu que mes pages mettaient quasi 20 secondes à s'afficher !! Et ça venait de ce flux RSS (que j'ai viré depuis).

Pensez vous que ça peut être la raison pour laquelle google ne met plus à jour mes pages dans les serps (du moins provisoirement je l'espère) ?
 
Nouveau WRInaute
Ah bon ? Je bidouille sur le site dessus depuis tout à l'heure, c'est peut être pour ça. La il est accessible.

Je viens aussi de changer de méthode au niveau du sitemap. J'ai fourni un sitemap en TXT tout simple (une simple liste de mes pages) et j'ai créé un flux RSS spécialement pour la partie blog, que j'ai fourni à google en tant que 2ieme sitemap.
 
WRInaute accro
Chez moi là, le site n'est toujours pas accessible. Ah et pour info, une flux RSS et un fichier sitemap sont deux choses totalement différentes.
 
Nouveau WRInaute
Bah ... pourtant il est bien accessible (testé sur mon pc, mon iphone ...).

Tu vas bien ici ? http://www.sosclic77.fr/

Je sais que le RSS n'est pas un sitemap à proprement parlé, mais dans l'outil google webmaster, on peut soumettre un RSS en guise de sitemap.

Dans mon tableau de sitemap j'en ai un de type "Liste" et un de type "RSS".

Extrait de l'aide google :

Un certain nombre d'outils tiers peuvent vous aider à créer des sitemaps. En plus du format standard ci-dessus, Google accepte également les formats de sitemap suivants :

RSS, mRSS et Atom 1.0 : Google accepte les flux RSS (Real Simple Syndication) 2.0 et Atom 1.0. Si vous possédez un blog doté d'un flux RSS ou Atom, vous pouvez envoyer l'URL du flux en tant que sitemap. La plupart des logiciels de développement de blogs créent les flux pour vous. Notez que, dans certains cas, ces flux ne fournissent des informations que sur les URL récentes.
Fichier texte : vous pouvez fournir à Google un simple fichier texte contenant une URL par ligne. Exemple :

http://www.example.com/fichier1.txt
http://www.example.com/fichier2.txt
 
WRInaute accro
Vérifie par contre que ton flux ne se limite pas aux dernières url. En tout cas, ça remarche là.

Quant au sitemap, rien n'oblige Google à indexer ce qu'il y trouve.
 
Nouveau WRInaute
Le flux est paramétrable, j'ai réglé sur 50 articles (mais j'augmenterais au fur et à mesure). :)

Pour le sitemap oui c'est vrai, mais je cherchais surtout un moyen de le faire vivre dynamiquement sans m'en occuper, et la solution du flux rss est bien pratique.

Merci.
 
Nouveau WRInaute
Bon bah suite à la modification du fichier .htaccess pour rediriger sosclic77.fr vers www.sosclic77.fr, ce matin mon site n'était plus accessible !!! (erreur disant qu'il y avait trop de redirections).

J'ai supprimé les modifs du htaccess et ça ne fonctionnait toujours pas, du coup j'ai "bidouillé" les redirections DNS d'OVH, puis tout remis d'origine, et maintenant je suis redirigé vers la page de webmail d'ovh ...

Super, j'aurais mieux fait denepas toucher au HTACCESS ...

Du coup j'attends de voir si la propagation des DNS va régler le problème.
 
Nouveau WRInaute
Bon j'ai fini par trouver le problème ...

J'avais fait une redirection de .sosclic77.fr vers www.sosclic77.fr, ce qui provoquait bien évidemment une boucle ...
Ce devrait rentrer dans l'ordre dans la journée.

Allez, j'arrête le HS.
 
Discussions similaires
Haut