Googlebot ne passe plus sur mon site

Discussion dans 'Crawl et indexation Google, sitemaps' créé par Anonymous, 22 Juillet 2002.

  1. Anonymous
    Anonymous Guest
    salut à tous !

    j'ai l'impression que GoogleBot ne passe plus sur mon site. Pourtant, le PR de mon site a augmenté, j'ai des liens dessus ... et il passe sur les pages qui pointent sur mon site.

    Avez-vous une idée :?:

    merci
     
  2. Borjoyzee
    Borjoyzee WRInaute discret
    Inscrit:
    29 Avril 2002
    Messages:
    53
    J'aime reçus:
    0
    J'ai pas d'idée moi on plus, mais je vient également de constater le même problème.
    Mon site est passé de PR4 à PR5 le mois dernier, et depuis, google n'est plus passé sur mon site alors qu'il y a 2 mois, il venait tout les 2 jours, et la copie caché qu'il fesait de mon site était toujours à jour.

    Peut-etre qu'ils ont des problèmes chez Google en ce moment, ou qu'ils sont en train de faire des modifications importantes ? (Je dit ca completement au hasard)

    Il faudrait que notre cher WRImaster nous trouve une explication ;)
     
  3. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 989
    J'aime reçus:
    293
    Ca n'est jamais facile de savoir ce genre de choses, surtout quand il ne s'agit pas de son propre site...
    Si vous avez accès aux fichiers log de votre serveur, vous pouvez analyser précisément quand est-ce que Googlebot passe sur votre site : combien de fois par jour, et combien de pages à chaque visite.
    Parfois Googlebot retarde sa prochaine visite (ou diminue sa fréquence de visites) après être tombé sur une panne du serveur (si votre site a été inaccessible pendant un certain temps). Si votre site comprend trop de liens vers des pages inexistantes (erreur 404), ça peut aussi peut-être le contrarier, surtout si ces pages font partie de votre site :?
     
  4. Anonymous
    Anonymous Guest
    :(

    Alors, comment on fait pour lui dire de repasser ?? surtout si on a plein de nouvelles choses à lui montrer ....
     
  5. Fruge
    Fruge WRInaute discret
    Inscrit:
    20 Juillet 2002
    Messages:
    94
    J'aime reçus:
    0
    J'ai accès aux log, mas comment (=avec quels logiciels) je peux en tirer quelquechose :?: ?

    Fruge.
     
  6. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 989
    J'aime reçus:
    293
    La manière la plus "bourrin" est d'ouvrir le fichier log dans un éditeur de texte et de chercher les lignes qui contiennent "googlebot".
    En supposant que vous connaissiez le format des fichiers log (en examinant quelques exemples de lignes on le comprend vite), vous pouvez déterminer si Googlebot est passé sur votre site, et si oui quelles pages il est venu indexer.
    En général il y a 1 fichier log par jour.

    Peut-être avez-vous accès à un utilitaire du style Urchin qui analyse les fichiers log. Dans ce cas, allez dans la rubrique "browsers" et cherchez Googlebot (qui est compté comme un navigateur particulier).

    Sinon je peux préparer un petit script qui va vous faire tout ce travail... :idea:
     
  7. Mitirapa
    Mitirapa WRInaute passionné
    Inscrit:
    10 Juillet 2002
    Messages:
    1 176
    J'aime reçus:
    0
    mon fichier log fait 45 mb... j'y touche pas ca prend la tête 8O
     
  8. Anonymous
    Anonymous Guest
    si je comprends bien, on est plusieurs à avoir le même problème. Dans ce cas ce n'est peut être pas trop grave.
    J'ai regardé mes logs et je n'ai rien vu de spécial si ce n'est qu'il a arrêté de passer depuis le 15 juillet ... sans raison apparente, du moins pour l'instant.
    En fait, j'ai l'impression qu'il ne suit plus les liens.

    pour en revenir à ma question, j'aimerais bien qu'il repasse avant la Google Dance qui est normalement pour bientôt. J'ai fait pas mal de modifications de contenu, ajouté beaucoup de texte et son passage pourrait m'être très bénéfique ...

    Comment est-ce que je peux le forcer à repasser sans qu'il me black liste ?
     
  9. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 989
    J'aime reçus:
    293
    Aucune idée !
    Au fait Dorine, tu pourrais t'inscrire sur ce forum, ça serait bien + simple...
     
  10. Borjoyzee
    Borjoyzee WRInaute discret
    Inscrit:
    29 Avril 2002
    Messages:
    53
    J'aime reçus:
    0
    Je suis herbergé chez OVH.net, et il propose une analyse de log grace a un outil appellé Urchin. Cet outils est payant, et necessite une installation et une gestion de l'archivage des log un peu particuliere.

    Peut-etre que quelqu'un ici connait un autre soft d'analyse de log de serveur HTTP :?:

    En tout cas, Urchin est vraiment tres partique :wink:
     
  11. Anonymous
    Anonymous Guest
     
  12. Anonymous
    Anonymous Guest
    analyser de log : analog, rapide et gratuit

    http://www.analog.cx/
     
  13. Fruge
    Fruge WRInaute discret
    Inscrit:
    20 Juillet 2002
    Messages:
    94
    J'aime reçus:
    0
    Je l'ai téléchargé, c'est pas mal en effet ! :D Ca donne des résultats interessants, c'est facile d'emploi, et en plus ca ne "pollue pas" la base de registre (sous Windows)

    Mais au passage, c'est quoi, ".cx" ?
     
  14. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 989
    J'aime reçus:
    293
    D'après Perl Gratuit, 'cx' représente Christmas Island... ne me demandez pas où c'est :)

    Bon, je vais essayer ce logiciel...
     
  15. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 989
    J'aime reçus:
    293
    après quelques essais, je dois dire que je suis un peu déçu de 'Analog'.
    Ce logiciel n'est vraiment pas très ergonomique. Certes il marche bien mais c'est tellement fastidieux à utiliser !
    Et surtout, il ne donne pas les noms des robots qui sont venus "crawler" le site... Or c'est bien ça qui nous intéresse, pour étudier le comportement de notre ami commun "googlebot"
     
  16. GusTav
    GusTav WRInaute discret
    Inscrit:
    24 Juillet 2002
    Messages:
    67
    J'aime reçus:
    0
    J'utilise OpenWebScope http://openwebscope.com.
    Facile à utiliser, peut être un peu moins puissant que Webtrends 7 mais il a l'avantage d'être gratuit !

    Ne pas oublier d'activer le DNS Lookup dans les options si ce n'est pas géré par le serveur.
     
  17. Anonymous
    Anonymous Guest
    salut

    j'ai l'impression que c'est la misère en ce moment avec Google, et pour tout le monde...
    si je regarde la page en cache de google, pour un site que je gère, la page cachée date du 17 juin, alors que celle-ci est mise à jour presque tous les jours, et qu'habituellement, google suit bien le rythme des mises à jour et indexe la page plusieurs fois par semaine.

    peut-etre des problemes de base qui ont obligé google à figer l'index... j'ai entendu dire aussi une fois que pour des problemes de spamming de la base, ça leur arrive de tout bloquer, ou de revenir en arrière sur une base plus ancienne...

    pour les PR qui évoluent dans le temps, malgré un non-indexation ,peut-on expliquer ça par un changement d'algorithme de calcul, qui impliquerait un changement de valeur pour certains ? (veinards!)

    on ne dit pas "patience est mère de sagesse" ?
    alors... patientez ! :wink:
     
  18. Fruge
    Fruge WRInaute discret
    Inscrit:
    20 Juillet 2002
    Messages:
    94
    J'aime reçus:
    0
    Oui, je suis aussi aller faire un tour sur des forum américains, et eux aussi ont remarqué que Google ne passent plus sur leurs sites...

    Et pour ce qui est du 17 juin, sache que tu as de la chance : certaines des caches utilisés par google pour les pages de mon sites datent du 1er juin :cry: !

    Bye, Fruge.
     
  19. GusTav
    GusTav WRInaute discret
    Inscrit:
    24 Juillet 2002
    Messages:
    67
    J'aime reçus:
    0
    Google passe sur notre site quasiment tout les jours pourtant c'est toujours une page datant de début juin qui apparaît dans son index. En plus il ne passe que sur la page d'index. Alllez comprendre... :(
     
  20. Borjoyzee
    Borjoyzee WRInaute discret
    Inscrit:
    29 Avril 2002
    Messages:
    53
    J'aime reçus:
    0
    Cela s'xplique très bien. Google passe fréquement sur la page de votre site qui a le plus fort PR. Il a du mettre ton site dans la liste très fermé des site qu'il visite régulierement pour voir si le contenu a changé.

    Le mois dernier, j'etais dans ton cas. Google passait presque tous les jours, et la copie chaché etait même remise a jours tout les 2 jours. Mais ce mois ci, plus rien :(
     
  21. GusTav
    GusTav WRInaute discret
    Inscrit:
    24 Juillet 2002
    Messages:
    67
    J'aime reçus:
    0
    lol je ne pense pas que notre site fasse partie d'une sorte de club VIP. Je sais que Google scanne très régulièrement certains sites qui évoluent très souvent et qui ont un très bon PageRank (genre l'Equipe ou Eurosport). Le problème c'est qu'il passe chaque jour (quasiment) mais qu'il ne met pas pour autant à jour son index : la copie cachée reste celle de début juin. J'comprend pô... snif...

    PS : par contre c'est vrai que notre page index.php3 est celle qui a le plus fort PR.
     
  22. Anonymous
    Anonymous Guest
    tu peux nous donner l'adresse de ces forums américains ???

    pour ma part, Google passe effectivement sur ma page à fort PR, qu'il remet régulièrement à jour (la dernière date du 23 juil) mais comme je l'ai dit avant, il ne suit plus du tout les liens qu'il y a dans cette page! Dommage.

    j'ai également d'autres questions :
    - comment vous faites pour connaitre la date du cache (quand ce n'est pas marqué dans la liste de résultats) ?
    - comment dire à Google de ne pas mettre en cache justement ?
     
  23. GusTav
    GusTav WRInaute discret
    Inscrit:
    24 Juillet 2002
    Messages:
    67
    J'aime reçus:
    0
    En insérant cette ligne dans le header de ta page :

    <META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">
     
  24. Fruge
    Fruge WRInaute discret
    Inscrit:
    20 Juillet 2002
    Messages:
    94
    J'aime reçus:
    0
    Salut,

    J'étais allé sur http://www.ihelpyouservices.com/forums/, que j'avais trouvé sur Google (mots-clés : pagerank, forum)...

    Fruge.
     
  25. Anonymous
    Anonymous Guest
    merci à tous pour vos réponses et votre réactivité.

    Et merci à WebRankInfo pour ce forum
     
  26. GusTav
    GusTav WRInaute discret
    Inscrit:
    24 Juillet 2002
    Messages:
    67
    J'aime reçus:
    0
    Va sur http://search.cometsystems.com/search.php

    ensuite tape :
    allinurl:www.tonsite.com

    enfin dans la page de résultat clique en desssous de ta page sur 'Archived copy'
    Cometsystems t'indiquera alors la date du dernier archivage.
     
  27. Anonymous
    Anonymous Guest
    salut
    moi, c'est plus simple, je mets à la main dans la page la date de dernière mise à jour, alors je n'ai plus qu'à lire la page en cache dans google pour savoir de quand date la version cachée !
    si tu veux rester discrète sur ce genre d'info, tu peux toujours coder ça en bas de page, du genre 25072002 en tout petit en bas de page, pour une mise à jour aujourd'hui.
     
  28. Fruge
    Fruge WRInaute discret
    Inscrit:
    20 Juillet 2002
    Messages:
    94
    J'aime reçus:
    0
    Analog

    Coucou...

    Juste une petite correction : ce logiciel donne bel et bien des infos sur GoogleBot (je viens juste d'avoir : " 9: 34:34: Googlebot" ! ("34" étant le nombre de pages qu'il a crawlé).
    Heu... il suffit de double cliquer sur "analog.exe", et il fait tout tout seul... ce n'est pas si fastidieux que ca :wink:

    En revanche, c'est vrai qu'il faut se taper la configuration, mais bon, en deux bonnes heures et en lisant la doc, ca marche ... (sauf que je n'ai pas reussi a lui dire de lire les zip :? ,... si quelqu'un sait comment faire...)

    Fruge.
     
  29. Anonymous
    Anonymous Guest
    Pour l'analyse des logs en douceur et gratuitement il y a Funnel Web qui est très complet et très simple à configurer.
    Ca n'est gratuit que pendant un mois ou deux, mais à la fin de la période il suffit de tout virer et de réinstaller le logiciel.
    l'url : http://www.quest.com
     
  30. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 989
    J'aime reçus:
    293
    Merci pour l'info, je vais aller voir ces logiciels Funnel Web Analyzer et Funnel Web Profiler. J'ai vu qu'il existe une version gratuite (limitée) et une version d'essai ?
     
  31. Fruge
    Fruge WRInaute discret
    Inscrit:
    20 Juillet 2002
    Messages:
    94
    J'aime reçus:
    0
    je l'ai essaye, c'est tres chouette (et tres facile d'emploi)... et ca permet de voir pas mal de chose (et particulier les graphes 3D) !!! 8)

    Fruge
     
  32. Anonymous
    Anonymous Guest
    Petit point négatif pour FunnelWeb, il ne prend pas beaucoup en compte les moteurs (et donc les robots) francophones, par exemple il ne connaît pas Voila et ne dispense donc pas totalement d'une lecture des logs.
     
Chargement...
Similar Threads - Googlebot Forum Date
Site inaccessible pour GoogleBot Crawl et indexation Google, sitemaps Aujourd'hui à 05:42
En décembre 2019 changement de l'user agent de Googlebot Crawl et indexation Google, sitemaps 5 Octobre 2019
googlebot crawle des pages inexistantes Crawl et indexation Google, sitemaps 16 Août 2019
Les pages 404 avec googlebot Crawl et indexation Google, sitemaps 14 Juin 2019
Evergreen Googlebot, basé sur Chromium (Chrome open source) Référencement Google 9 Mai 2019
Empêcher Googlebot de crawler/indexer tout un dossier Débuter en référencement 19 Avril 2019
GoogleBot scan url inexistante Crawl et indexation Google, sitemaps 17 Avril 2019
feuilles de styles non obtenues par Googlebot Crawl et indexation Google, sitemaps 28 Septembre 2018
Temps de réponse serveur googlebot Développement d'un site Web ou d'une appli mobile 23 Mai 2018
Strikingly et Googlebot : Contenu invisible dans la Search Demandes d'avis et de conseils sur vos sites 3 Avril 2018
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice