Page indéxée sans être crawlée

WRInaute discret
Bonjour,

Google aime tellement mes pages qu'il les indexe sans les avoir lues :)

En fait voilà. Je crèe une soixantaine de nouvelles pages il y a une semaine, et je met tout ça dans le sitemap pour que GG les indexe au plus vite. Comme d'habitude, quoi. Et puis je guette Googlebot pour voir si tout se passe bien. Mais rien depuis une semaine, GG traine un peu ces temps ci.

Entre temps, je met un petit BL exeterne sur une de ces pages, histoire de l'apuyée un peu. Petit PR donc petite influence, mais bon...

Et aujourd'hui, je retrouve cette page dans les SERP. Celle là et aucune des autres, donc c'est bien le BL évidemment. Et pourtant, Googlebot n'est jamais passé sur cette page, j'ai bien vérifié et re-vérifié. D'ailleurs, le résultat dans les SERP est bizarre. Pas de page en cache bien sûr, mais pas non plus de description sous le titre. Juste le titre de la page et l'URL, brut de brut. La meta description n'a donc pas été lue.

Pourtant, et le titre alors ? Faut bien rentrer dans la page pour trouver le titre ? Oui mais justement, le titre, c'est aussi l'anchor de mon BL. Alors peut-être que ma page a juste été indexée sur cet anchor ?

Moi, ça me surprend quand même.

Vous en pensez quoi ?
 
WRInaute passionné
s2n a dit:
Et pourtant, Googlebot n'est jamais passé sur cette page, j'ai bien vérifié et re-vérifié.
Comment as-tu verifie? IP, useragent, autre?
As-tu de l'adsense ou un autre service google sur cette page?
As-tu un flux RSS?
 
WRInaute accro
s2n a dit:
Oui mais justement, le titre, c'est aussi l'anchor de mon BL. Alors peut-être que ma page a juste été indexée sur cet anchor ?
c'est tout à fait ça. Les pages sont incorporées dans l'index avec comme titre le contenu de l'anchor, jusqu'à ce que le bot passe la lire
 
WRInaute discret
Oui, j'ai vérifié avec mes stats. J'ai la liste de toutes les pages crawlées chaque jour pour chaque robot.

J'ai des adsenses sur cette page, mais je viens de vérifier, et MediaPartners n'est pas non plus passé sur la page. D'ailleurs, la pub n'est pas très ciblée sur cette page, je trouve.

Bon, voici le screen des résultats:

GG.jpg


et la page en question:

http://www.sports2nature.com/S-camalots.html

Le résultat ne sort que sur le mot clé du titre (et au pluriel), puisque le contenu de la page est inconnu à GG.

Autre point intéressant que je viens de voir: la commande site: trouve cette page mais l'affiche de la même manière que certaines autres pages qui ne devraient pas se trouver là pour cause de robots.txt. J'ai donc aussi des pages exclues par robots.txt mais qui sont indéxées. Pourtant celles là n'ont pas de BL externe et ne sont pas dans le Sitemap. L'affichage est du même type sans cache ni meta description, et avec l'URL à la place du titre. Je comprend rien...
 
WRInaute discret
Oui, bien sûr. J'ai la Googlebar. Ca explique tout ?

A ce moment là, il suffirait de passer avec son navigateur munit de la barre Google sur toutes les pages qu'on veut indexer rapidement, et pas besoin d'attendre le passage des bots. Ce serai trop facile, non ?
 
Discussions similaires
Haut