Googlebot/2.1 ?

Nouveau WRInaute
Hello tout le monde! je me pose une question car dans mes statistiques j'ai plusieurs sorte de googlebot :

- Mediapartners-Google/2.1 (+http://www.googlebot.com/bot.html)
- Googlebot/2.1 (+http://www.googlebot.com/bot.html)
- Mozilla/5.0 (compatible; Googlebot/2.1; +https://www.google.com/bot.html)
- Googlebot/2.1

Pour les 3 premiers pas de probleme j'en ai deja entendu parler, mais par contre le dernier "Googlebot/2.1" et sans parenthese derriere le nom, ba je me demande d'ou il vient ? d'autant plus que c'est celui qui a visité le plus de pages sur mon site derriere mediaparteners ...?
 
Nouveau WRInaute
Non je n'ai pas les adresse IP j'ai vu ca sur les stats fournis avec mon hebergeur. J'ai ca si ca peut vous aidez :roll: :
# Hits User Agent

1 99167 (80.87%) MSIE 6.0
2 11775 (9.60%) Mozilla/5.0
3 6850 (5.59%) MSIE 5.5
4 2509 (2.05%) MSIE 5.0
5 789 (0.64%) Mediapartners-Google/2.1 (+http://www.googlebot.com/bot.html)
6 278 (0.23%) Xenu Link Sleuth 1.2e
7 142 (0.12%) MSIE 5.1
8 132 (0.11%) Googlebot/2.1
9 132 (0.11%) Konqueror/3.1
10 106 (0.09%) Mozilla/4.0
11 105 (0.09%) Opera 7.2
12 100 (0.08%) Mozilla/4.0 (compatible;)
13 85 (0.07%) Microsoft-WebDAV-MiniRedir/5.1.2600
14 62 (0.05%) Mozilla/4.7
15 57 (0.05%) Googlebot/2.1 (+http://www.googlebot.com/bot.html)

Consernant l'usurpation j'ai rien trouvé :?
 
Nouveau WRInaute
J'ajoute que j'ai 109 pages prisent en compte dans google et leurs cache date du 3 mars (avant j'en avais qu'une prise en compte)!
Ca ne peut pas être "Googlebot/2.1 (+http://www.googlebot.com/bot.html)" car lui regarde que la page d'acceuil et de toute facon depuis le debut du mois il n'a crawler que 57pages (que la page d'acceuil)
Serait-ce "Googlebot/2.1" qui est venu me crawler mes 109pages? :?:
 
WRInaute impliqué
yannouk a dit:
je crois qu'il y a un topic qui parle de ca non? cherche "usurpation"

Chercher mais pas trouver :?
Je confirme ce Googlebot/2.1 est entrain (en ce moment meme 8O ) de crawler un de mes nouveaux sites!!!
D'ailleur j'en suis surpris car d'habitude les crawl se font de nuit :!: :?:
 
Nouveau WRInaute
Facile, très facile même ;)
Des plugins ajoutés aux navigateurs permettent eux-mêmes "d'injecter" des scripts dans les pages, et ce automatiquement.
Je parle ici de greasemonkey pour firefox et le script "Forum Deblocker"

Il simule un bot de votre choix (en éditant le script) afin de se faire passer pour googlebot et avoir accès aux messages cachés, etc...
- Accès aux forums où il est obligatoire de s'enregistrer,
- Voir les topics masqués,
- Voir ce qui est caché derrière les balises HIDE de certains forums.

Voici une partie très explicite du script :
Code:
GM_xmlhttpRequest({
     method: "get",
     url: location.href,
     overrideMimeType: 'text/html; charset=' + document.characterSet,
    headers:{'User-agent': 'Googlebot/2.1 (+https://www.google.com/bot.html)'},

Le souci est que les "nofollow" et autres balises meta respectées par les robots ne le sont pas par le script, qui donne donc accès à tout.

En espérant vous avoir aidé...
TwK
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut