Page indéxée sans être crawlée

Discussion dans 'Crawl et indexation Google, sitemaps' créé par s2n, 8 Mai 2007.

  1. s2n
    s2n WRInaute discret
    Inscrit:
    30 Septembre 2006
    Messages:
    50
    J'aime reçus:
    0
    Bonjour,

    Google aime tellement mes pages qu'il les indexe sans les avoir lues :)

    En fait voilà. Je crèe une soixantaine de nouvelles pages il y a une semaine, et je met tout ça dans le sitemap pour que GG les indexe au plus vite. Comme d'habitude, quoi. Et puis je guette Googlebot pour voir si tout se passe bien. Mais rien depuis une semaine, GG traine un peu ces temps ci.

    Entre temps, je met un petit BL exeterne sur une de ces pages, histoire de l'apuyée un peu. Petit PR donc petite influence, mais bon...

    Et aujourd'hui, je retrouve cette page dans les SERP. Celle là et aucune des autres, donc c'est bien le BL évidemment. Et pourtant, Googlebot n'est jamais passé sur cette page, j'ai bien vérifié et re-vérifié. D'ailleurs, le résultat dans les SERP est bizarre. Pas de page en cache bien sûr, mais pas non plus de description sous le titre. Juste le titre de la page et l'URL, brut de brut. La meta description n'a donc pas été lue.

    Pourtant, et le titre alors ? Faut bien rentrer dans la page pour trouver le titre ? Oui mais justement, le titre, c'est aussi l'anchor de mon BL. Alors peut-être que ma page a juste été indexée sur cet anchor ?

    Moi, ça me surprend quand même.

    Vous en pensez quoi ?
     
  2. Serious
    Serious WRInaute passionné
    Inscrit:
    21 Novembre 2005
    Messages:
    1 834
    J'aime reçus:
    0
    Comment as-tu verifie? IP, useragent, autre?
    As-tu de l'adsense ou un autre service google sur cette page?
    As-tu un flux RSS?
     
  3. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 274
    J'aime reçus:
    0
    c'est tout à fait ça. Les pages sont incorporées dans l'index avec comme titre le contenu de l'anchor, jusqu'à ce que le bot passe la lire
     
  4. s2n
    s2n WRInaute discret
    Inscrit:
    30 Septembre 2006
    Messages:
    50
    J'aime reçus:
    0
    Oui, j'ai vérifié avec mes stats. J'ai la liste de toutes les pages crawlées chaque jour pour chaque robot.

    J'ai des adsenses sur cette page, mais je viens de vérifier, et MediaPartners n'est pas non plus passé sur la page. D'ailleurs, la pub n'est pas très ciblée sur cette page, je trouve.

    Bon, voici le screen des résultats:

    [​IMG]

    et la page en question:

    http://www.sports2nature.com/S-camalots.html

    Le résultat ne sort que sur le mot clé du titre (et au pluriel), puisque le contenu de la page est inconnu à GG.

    Autre point intéressant que je viens de voir: la commande site: trouve cette page mais l'affiche de la même manière que certaines autres pages qui ne devraient pas se trouver là pour cause de robots.txt. J'ai donc aussi des pages exclues par robots.txt mais qui sont indéxées. Pourtant celles là n'ont pas de BL externe et ne sont pas dans le Sitemap. L'affichage est du même type sans cache ni meta description, et avec l'URL à la place du titre. Je comprend rien...
     
  5. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 274
    J'aime reçus:
    0
    la googlebar n'est-elle pas sur ton navigateur ?
     
  6. s2n
    s2n WRInaute discret
    Inscrit:
    30 Septembre 2006
    Messages:
    50
    J'aime reçus:
    0
    Oui, bien sûr. J'ai la Googlebar. Ca explique tout ?

    A ce moment là, il suffirait de passer avec son navigateur munit de la barre Google sur toutes les pages qu'on veut indexer rapidement, et pas besoin d'attendre le passage des bots. Ce serai trop facile, non ?
     
Chargement...
Similar Threads - indéxée être crawlée Forum Date
Pages indexées avec paramètre utm dans l'URL Crawl et indexation Google, sitemaps 4 Février 2022
Votre page d'accueil ne peut pas être indexée par les moteurs de recherche Débuter en référencement 5 Octobre 2016
page d’accueil ne peut pas être indexée par les moteurs de recherche Débuter en référencement 23 Septembre 2016
Notre page d'accueil ne peut pas être indexée par les moteurs de recherche. Débuter en référencement 5 Janvier 2016
Nombre de pages indexées en fonction de quels paramètres? Problèmes de référencement spécifiques à vos sites 21 Novembre 2005
Page indexée 2 fois avec balise Title différente Crawl et indexation Google, sitemaps 21 Octobre 2022
Pages pas indexées en erreur type "Page avec redirection" Débuter en référencement 18 Octobre 2022
Comment indexer les pages Détectées, mais actuellement non indexées ? Problèmes de référencement spécifiques à vos sites 12 Octobre 2022
Page d'accueil non indéxée Crawl et indexation Google, sitemaps 26 Septembre 2022
URLs indexées malgré redirection Problèmes de référencement spécifiques à vos sites 5 Août 2022
Cette URL n'a pas été indexée par Google Problèmes de référencement spécifiques à vos sites 5 Août 2022
Page indexée mais pas indexée ^^ Crawl et indexation Google, sitemaps 28 Juillet 2022
Cette URL n'a pas été indexée par Google Débuter en référencement 18 Mai 2022
Search Console Cette URL n'a pas été indexée par Google Crawl et indexation Google, sitemaps 27 Mars 2022
Piratage/Hacking - Millions de pages indéxées Problèmes de référencement spécifiques à vos sites 3 Février 2022
Comment savoir si une URL est indexée par Google ? Crawl et indexation Google, sitemaps 25 Janvier 2022
Pages détectées, non indexées Débuter en référencement 22 Janvier 2022
Pages aléatoires non indexées Crawl et indexation Google, sitemaps 17 Janvier 2022
Pages de mon site indexées mais très peu de visites Problèmes de référencement spécifiques à vos sites 15 Janvier 2022
Page indexée ... puis désindexée Problèmes de référencement spécifiques à vos sites 12 Décembre 2021