Googlebot est passé plusieurs fois mais pas d'indexation

Discussion dans 'Crawl et indexation Google, sitemaps' créé par sosclic77, 6 Avril 2011.

  1. sosclic77
    sosclic77 Nouveau WRInaute
    Inscrit:
    16 Mars 2011
    Messages:
    14
    J'aime reçus:
    0
    Bonjour à tous,

    Depuis presque 1 semaine, googlebot continue de passer quotidiennement sur mon site, mais les articles de mon blog ne sont plus indexés dans google, alors qu'avant mes articles étaient indexés tous les jours (une rapide recherche dans google me ressortait mes pages).

    J'ai un sitemap.xml complet. Et dans google webmaster tools, pas d'erreurs, mais il y a un écart entre le nombre d'URL du sitemap et la case "URL dans l'index" (ce qui corrobore bien mes constats).

    C'est normal qu'il y ai des "creux" comme ça, ou il y a un souci à votre avis ?

    MErci !
     
  2. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 883
    J'aime reçus:
    73
    Tu as une url à nous montrer ?
     
  3. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 109
    J'aime reçus:
    279
    Peut-être le blog du www ?
     
  4. Francky1er
    Francky1er WRInaute discret
    Inscrit:
    8 Août 2007
    Messages:
    63
    J'aime reçus:
    0
  5. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 109
    J'aime reçus:
    279
    On va peut-être attendre la réponse, sinon on se répète. :mrgreen:
     
  6. sosclic77
    sosclic77 Nouveau WRInaute
    Inscrit:
    16 Mars 2011
    Messages:
    14
    J'aime reçus:
    0
  7. Francky1er
    Francky1er WRInaute discret
    Inscrit:
    8 Août 2007
    Messages:
    63
    J'aime reçus:
    0
    Un premier élément de réponse, j'ai vu dans les résultats de google l'url suivante apparaître : http://www.sosclic77.fr/?a3cf29a305e27868aa6a43a22ac1af26=a2699a6571b9 ... 02e579fd18

    Commence par mettre du canonical sur des urls de références, compléter ton robots.txt, aller dans le GWT et ignorer les paramètres parasites... voilà je pense une première piste ^^
     
  8. sosclic77
    sosclic77 Nouveau WRInaute
    Inscrit:
    16 Mars 2011
    Messages:
    14
    J'aime reçus:
    0
    Merci pour ta réponse.

    Ce liens est "vieux", il date d'avant que j'utilise les URL simplifiée pour optimiser le référencement. J'utilise joomla, donc difficile de mettre un link (pour le canonique) dans la page. J'utilise les URL simplifiées SEF.
    Et mon fichier robot.txt est propre.

    Et c'est arrivé du jour au lendemain, ça m’énerve :(
     
  9. Francky1er
    Francky1er WRInaute discret
    Inscrit:
    8 Août 2007
    Messages:
    63
    J'aime reçus:
    0
    Je t'en prie. Mais, je pense qu'il faut y voir un indice si cette url remonte systématiquement dans les résultats de serps. Au passage, rien ne t'empeche de mettre un " Disallow: /*? " dans ton robots.txt si tu veux éviter ce type d'urls (du moins par google car les expressions rationnelles ne sont pas comprise par les autres bots)
     
  10. sosclic77
    sosclic77 Nouveau WRInaute
    Inscrit:
    16 Mars 2011
    Messages:
    14
    J'aime reçus:
    0
    Ok donc ya forcément un problème ? Car je me demandais si ça pouvait arriver de temps en temps que google ne mette pas à jour son index (malgrès que le robot passe) pour un site, pendant plusieurs jours comme ça.

    Pourtant j'ai tout vérifié dans webmaster tool, pas d'erreurs d'exploration, j'ai re déposé le sitemap contenant 19 URL (simplifiées). Et il me mets toujours : 19URL fournies, 12 URL dans l'index. Il m'en manque 7.

    Et c'est pas plutôt "Disallow: /?*" :?:
     
  11. Francky1er
    Francky1er WRInaute discret
    Inscrit:
    8 Août 2007
    Messages:
    63
    J'aime reçus:
    0

    Attention, je t'ai juste indiqué ce que j'ai détecté en faisant une analyse rapide de ton site. Je ne t'assure pas qu'il n'y a que ça comme problème mais c'est déjà un premier élément.

    Un autre problème important sur ton site au passage, il est accessible soit à l'adresse avec www. soit à l'adresse sans www. Ca c'est pas bon!

    Bon courage
     
  12. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 109
    J'aime reçus:
    279
  13. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 883
    J'aime reçus:
    73
    Et pour gérer tout ça, tu peux utiliser le très bon plugin Artio JoomSEF.
     
  14. sosclic77
    sosclic77 Nouveau WRInaute
    Inscrit:
    16 Mars 2011
    Messages:
    14
    J'aime reçus:
    0
    Merci, je viens d'ajouter une redirection pour forcer les www dans mon htaccess.

    Par contre, je viens de tilter à un truc ... sur mon site j'avais 2 flux RSS dont 1 qui venait de hardware.fr.
    La semaine dernière je me suis apperçu que mes pages mettaient quasi 20 secondes à s'afficher !! Et ça venait de ce flux RSS (que j'ai viré depuis).

    Pensez vous que ça peut être la raison pour laquelle google ne met plus à jour mes pages dans les serps (du moins provisoirement je l'espère) ?
     
  15. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 883
    J'aime reçus:
    73
    Tu n'aurai pas merdé dans ton htaccess ? Là il est impossible d'accéder au site.
     
  16. sosclic77
    sosclic77 Nouveau WRInaute
    Inscrit:
    16 Mars 2011
    Messages:
    14
    J'aime reçus:
    0
    Ah bon ? Je bidouille sur le site dessus depuis tout à l'heure, c'est peut être pour ça. La il est accessible.

    Je viens aussi de changer de méthode au niveau du sitemap. J'ai fourni un sitemap en TXT tout simple (une simple liste de mes pages) et j'ai créé un flux RSS spécialement pour la partie blog, que j'ai fourni à google en tant que 2ieme sitemap.
     
  17. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 883
    J'aime reçus:
    73
    Chez moi là, le site n'est toujours pas accessible. Ah et pour info, une flux RSS et un fichier sitemap sont deux choses totalement différentes.
     
  18. sosclic77
    sosclic77 Nouveau WRInaute
    Inscrit:
    16 Mars 2011
    Messages:
    14
    J'aime reçus:
    0
    Bah ... pourtant il est bien accessible (testé sur mon pc, mon iphone ...).

    Tu vas bien ici ? http://www.sosclic77.fr/

    Je sais que le RSS n'est pas un sitemap à proprement parlé, mais dans l'outil google webmaster, on peut soumettre un RSS en guise de sitemap.

    Dans mon tableau de sitemap j'en ai un de type "Liste" et un de type "RSS".

    Extrait de l'aide google :

    Un certain nombre d'outils tiers peuvent vous aider à créer des sitemaps. En plus du format standard ci-dessus, Google accepte également les formats de sitemap suivants :

    RSS, mRSS et Atom 1.0 : Google accepte les flux RSS (Real Simple Syndication) 2.0 et Atom 1.0. Si vous possédez un blog doté d'un flux RSS ou Atom, vous pouvez envoyer l'URL du flux en tant que sitemap. La plupart des logiciels de développement de blogs créent les flux pour vous. Notez que, dans certains cas, ces flux ne fournissent des informations que sur les URL récentes.
    Fichier texte : vous pouvez fournir à Google un simple fichier texte contenant une URL par ligne. Exemple :

    http://www.example.com/fichier1.txt
    http://www.example.com/fichier2.txt
     
  19. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 883
    J'aime reçus:
    73
    Vérifie par contre que ton flux ne se limite pas aux dernières url. En tout cas, ça remarche là.

    Quant au sitemap, rien n'oblige Google à indexer ce qu'il y trouve.
     
  20. sosclic77
    sosclic77 Nouveau WRInaute
    Inscrit:
    16 Mars 2011
    Messages:
    14
    J'aime reçus:
    0
    Le flux est paramétrable, j'ai réglé sur 50 articles (mais j'augmenterais au fur et à mesure). :)

    Pour le sitemap oui c'est vrai, mais je cherchais surtout un moyen de le faire vivre dynamiquement sans m'en occuper, et la solution du flux rss est bien pratique.

    Merci.
     
  21. sosclic77
    sosclic77 Nouveau WRInaute
    Inscrit:
    16 Mars 2011
    Messages:
    14
    J'aime reçus:
    0
    Bon bah suite à la modification du fichier .htaccess pour rediriger sosclic77.fr vers www.sosclic77.fr, ce matin mon site n'était plus accessible !!! (erreur disant qu'il y avait trop de redirections).

    J'ai supprimé les modifs du htaccess et ça ne fonctionnait toujours pas, du coup j'ai "bidouillé" les redirections DNS d'OVH, puis tout remis d'origine, et maintenant je suis redirigé vers la page de webmail d'ovh ...

    Super, j'aurais mieux fait denepas toucher au HTACCESS ...

    Du coup j'attends de voir si la propagation des DNS va régler le problème.
     
  22. sosclic77
    sosclic77 Nouveau WRInaute
    Inscrit:
    16 Mars 2011
    Messages:
    14
    J'aime reçus:
    0
    Bon j'ai fini par trouver le problème ...

    J'avais fait une redirection de .sosclic77.fr vers www.sosclic77.fr, ce qui provoquait bien évidemment une boucle ...
    Ce devrait rentrer dans l'ordre dans la journée.

    Allez, j'arrête le HS.
     
Chargement...
Similar Threads - Googlebot passé fois Forum Date
Date à laquelle Googlebot est passé Crawl et indexation Google, sitemaps 15 Septembre 2013
Googlebot ne passe plus ? Crawl et indexation Google, sitemaps 7 Octobre 2009
Comment augmenter la fréquence de passage de GoogleBot Crawl et indexation Google, sitemaps 10 Décembre 2019
Site inaccessible pour GoogleBot Crawl et indexation Google, sitemaps 21 Octobre 2019
En décembre 2019 changement de l'user agent de Googlebot Crawl et indexation Google, sitemaps 5 Octobre 2019
googlebot crawle des pages inexistantes Crawl et indexation Google, sitemaps 16 Août 2019
Les pages 404 avec googlebot Crawl et indexation Google, sitemaps 14 Juin 2019
Evergreen Googlebot, basé sur Chromium (Chrome open source) Référencement Google 9 Mai 2019
Empêcher Googlebot de crawler/indexer tout un dossier Débuter en référencement 19 Avril 2019
GoogleBot scan url inexistante Crawl et indexation Google, sitemaps 17 Avril 2019
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice