1. ⭐⭐⭐ Grosse PROMO en cours sur ma plateforme SEO My Ranking Metrics
    Rejeter la notice

Googlebot est un fainéant !

Discussion dans 'Crawl et indexation Google, sitemaps' créé par croque-notes, 18 Septembre 2004.

  1. croque-notes
    croque-notes Nouveau WRInaute
    Inscrit:
    3 Avril 2004
    Messages:
    4
    J'aime reçus:
    0
    salut à tous,
    je m'explique...
    mon site comprend une dizaine de pages. malheureusement malgré les nombreux passages de googlebot plusieurs fois par jour je n'en ai qu'une de référencée avec un pr de 4, la page index !
    comment se fait-il que googlebot ne suive pas les liens internes afin de visiter les autres pages.
    tous les liens internes après test sont pourtant valides !
    je sais que mes liens sont en flash aussi sur les conseils de fred j'en ai réalisés d'autres au bas de ma page, mais toujours sans aucun effet.
    ras le bol !
    merci à tous
     
  2. ybet
    ybet WRInaute accro
    Inscrit:
    22 Novembre 2003
    Messages:
    7 516
    J'aime reçus:
    1
    Une couleur bien visible ferait aussi l'affaire .... même si je doute que ce soit ca qui bloque GG. Actuellement, GG suit les liens flash (mais ne lit pas les textes)

    De toute façon, ta page d'acceuil n'est pas dans le cache de GG. PR4 donc pas blacklisté mais GG ne sait pas lire ta page /acceuil.html, (la page d'entrée du site oui).
    Ca sent le bricolage
     
  3. corvisart
    corvisart WRInaute impliqué
    Inscrit:
    3 Juillet 2003
    Messages:
    668
    J'aime reçus:
    0
    index.html = acceuil.html, non ?
    n'en gardes qu'une, celle du cache et pr4
    Double le menu sur toutes les pages, ou au moins un retour a l'index sur chaque page
    et classique, acceuil, accueil..
     
  4. Xav|865
    Xav|865 Guest
    Salut,

    ybet, qu'est ce que tu veut dire par "google ne sait pas lire ta page /acceuil.html, (la page d'entrée du site oui)."?

    Par ce que j'ai un probleme de référencement sur mon site et je me suis rendu compte que la page d'acceuil de mon site (index.html) (qui sert de redirection vers d'autre pages en fonction de la résolution d'écran du visiteur)ne figure pas dans le cache d'IE, seuls les pages vers laquel elle te redirige figurent dans le cache.

    J'ai bien sur mis des liens en html vers autres pages du site en bas de la page index.htm, mais j'ai toujours le même problème.

    Est ce que google peut indexer cette page qui ne figure pas dans le cache d'IE?

    Surtout que je lui ai interdit grace au fichier robots.txt l'indexations des pages vers lesquels index.html te redirige pour éviter d'obtenir, lors de la recherche du site sur GG, toutes les pages en rang d'ognion (index_800_600.html, index_1024_768.html, index_1280_1024.html...etc) mais d'obtenir uniquement le index.html.

    Voila, je sais pas si c'est bien clair, dis le moi si tu ne comprend pas tout.
    Allez bye!

    Edit: La redirection que j'utilise est en javascript, mais j'ai quand même rajouté des liens ahref pour indiquer à GGbot le chemin vers le reste du site.
     
  5. croque-notes
    croque-notes Nouveau WRInaute
    Inscrit:
    3 Avril 2004
    Messages:
    4
    J'aime reçus:
    0
    salut à tous

    merci pour tous ces precieux conseils !
     
  6. Xav|865
    Xav|865 Guest
    Salut

    Je ne comprend toujours pas l'histoire de GG qui ne vois pas la page index.html mais la page d'entrée du site, oui.

    Quelqun à envie de m'expliquer?
     
  7. Remi L.
    Remi L. WRInaute impliqué
    Inscrit:
    6 Septembre 2003
    Messages:
    909
    J'aime reçus:
    0
    Peut-être que Google rechigne à indexer les pages d'accueil orthographiées 'acceuil'... :mrgreen:
     
  8. ybet
    ybet WRInaute accro
    Inscrit:
    22 Novembre 2003
    Messages:
    7 516
    J'aime reçus:
    1
    Une petite particularité de Google. Suppose que ton site soit -http://www.site.com, site en PHP par exemple. Google voit 2 pages distinctes:
    -http://www.site.com et -http://www.monsite.com/index.php Ca peut sembler bizarre mais les liens pointant vers ces 2 pages (qui en fait est la même) sont généralement différents pour Google suivant la manière dont les liens sont faits. Un lien externe pointera à tous les coup sur -http://www.site.com. Par contre, en interne, on a tendance à pas se fatiguer et à mettre ../index.php.

    Dès lors si ta page site.com est dans le cache, Google à visité le site de l'extérieur. Par contre, si la page site.com/index.php n'est pas dans le cache, ca signifie généralement que GG n'est pas rentré dans les pages internes du site.

    En gros, pour les liens internes, ca modifie la manière de travailler. Il se peut très bien que la page index.php soit référencé correctement sur une requête ou la page site. Ce n'est pas limitatif à la page d'acceuil, j'ai ca sur un forum. Le nombre de liens entre la page /forum et la page /forum/index.php est totalement différents (commande Link:) et c'est la page /index.php (page d'entrée du forum) qui passe. C'est un défaut de conception "référencement" du forum oxygen dans ce cas mais ca modifie complètement la manière dont je fais mes liens des autres sites et des pages internes vers la page d'entrée du forum. En modifiant les liens externes (de mes autres sites) vers cette page, en/forum, j'ai perdu 4 places directement sur une requête de la page d'entrée du forum.
     
  9. Xav|865
    Xav|865 Guest
    Salut

    ok merci beaucoup pour ces explications, Ybet.
    C'est subtile quand même... 8O

    Allez bye
     
Chargement...
Similar Threads - Googlebot fainéant Forum Date
Comment augmenter la fréquence de passage de GoogleBot Crawl et indexation Google, sitemaps 10 Décembre 2019
Site inaccessible pour GoogleBot Crawl et indexation Google, sitemaps 21 Octobre 2019
En décembre 2019 changement de l'user agent de Googlebot Crawl et indexation Google, sitemaps 5 Octobre 2019
googlebot crawle des pages inexistantes Crawl et indexation Google, sitemaps 16 Août 2019
Les pages 404 avec googlebot Crawl et indexation Google, sitemaps 14 Juin 2019
Evergreen Googlebot, basé sur Chromium (Chrome open source) Référencement Google 9 Mai 2019
Empêcher Googlebot de crawler/indexer tout un dossier Débuter en référencement 19 Avril 2019
GoogleBot scan url inexistante Crawl et indexation Google, sitemaps 17 Avril 2019
feuilles de styles non obtenues par Googlebot Crawl et indexation Google, sitemaps 28 Septembre 2018
Temps de réponse serveur googlebot Développement d'un site Web ou d'une appli mobile 23 Mai 2018
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice