1. ⭐⭐⭐ Grosse PROMO en cours sur ma plateforme SEO My Ranking Metrics
    Rejeter la notice

Acces googlebot aux fichiers CSS et JS impossible

Discussion dans 'Référencement Google' créé par walking7, 28 Juillet 2015.

  1. walking7
    walking7 WRInaute passionné
    Inscrit:
    17 Février 2009
    Messages:
    1 556
    J'aime reçus:
    7
    Bonjour, bonsoir

    Je recois aujourd'hui ce message par mail :

    Accès de Googlebot aux fichiers CSS et JS impossible sur le site (=>en fait tous mes sites CMS wordpress)

    Nos systèmes ont récemment détecté un problème avec votre page d'accueil qui affecte l'affichage et l'indexation de votre contenu par nos algorithmes. Plus particulièrement, Googlebot ne peut accéder à vos fichiers JavaScript ou CSS à cause de restrictions dans votre fichier robots.txt. Ces fichiers nous permettent de comprendre que votre site Web fonctionne correctement. En bloquant l'accès à ces éléments, il est donc possible que le classement du site ne soit pas optimal.

    Le truc, c'est que mes sites ont + de 6 mois d'existence. Pourquoi je reçois ce genre de message seulement maintenant ?

    En pratique, dans "Outil de test du fichier robots.txt", je vois .. 0 erreurs et 0 avertissements.
    De plus, j'ai quand meme testé et j'ai bien le bouton qui passe au vert AUTORISE, ce qui signifie qu'il n'y a aucun problème.
    De toute manière, dans mon robots.txt il n'y a aucune restriction !

    Alors, pourquoi je recois ce message .. une idée ?
    Quelqu'un d'autre dans la meme situation ou qui a recu ce message aujourd'hui ?

    :p
     
  2. loubet
    loubet WRInaute impliqué
    Inscrit:
    19 Février 2003
    Messages:
    793
    J'aime reçus:
    0
    j'ai aussi reçu ce mail aujourd'hui, pour un site où le js était bien bloqué.
     
  3. walking7
    walking7 WRInaute passionné
    Inscrit:
    17 Février 2009
    Messages:
    1 556
    J'aime reçus:
    7
    tu vois ca dans robots.txt ?
    tu avais des erreurs ou avertissements annoncés dans "outils test du fichier robots.txt" ?
     
  4. Furtif
    Furtif WRInaute passionné
    Inscrit:
    9 Août 2005
    Messages:
    2 462
    J'aime reçus:
    136
    Tu ne dois pas bloquer les repertoires qui donne acces aux css et js, vires-les de ton robots.txt, cela peut avoir un impact negatif sur l'indexation de ton site (et donc son positionnement), si tu bloques leur acces a gogolebot...

    Disallowing crawling of Javascript or CSS files in your site’s robots.txt directly harms how well our algorithms render and index your content and can result in suboptimal rankings.
    http://googlewebmastercentral.blogspot.fr/2014/10/updating-our-technic ... aster.html


    :D
     
  5. walking7
    walking7 WRInaute passionné
    Inscrit:
    17 Février 2009
    Messages:
    1 556
    J'aime reçus:
    7
    Moi j'ai rien bloqué du tout et j'ai jamais touché à ce robot.txt
    D'ailleurs voici mon robots.txt

    User-agent: *
    Disallow: /wp-admin/
    Sitemap: http://www.xxxxxx.com/sitemap.xml.gz
    0 erreurs
    0 avertissements

    Vous voyez bien y'a rien de bloqué .. à moins que disallow wp-admin peut être ?
    ..alors qu'est ce qu'il me chante google ? Il a pris un coup de chaud on dirait !
     
  6. Furtif
    Furtif WRInaute passionné
    Inscrit:
    9 Août 2005
    Messages:
    2 462
    J'aime reçus:
    136
    dans le wp admin tu as un dossier js et css.. et gogole pas content si tu bloque l'acces...
     
  7. walking7
    walking7 WRInaute passionné
    Inscrit:
    17 Février 2009
    Messages:
    1 556
    J'aime reçus:
    7
    Bonsoir,

    Donc c'est pas qu'au niveau du robots.txt que ca se passe cette histoire de blocage tu dis ?
    Je suis sous wordpress, je dois regarder où alors pour voir si ca bloque.Le wp-admin dans le ftp ? dans l'editeur wordpress ?

    Le fait que j'ai 0 erreurs ca démontre pas que y'a pas de problème ?
    bon je suis encore novice niveau CMS
     
  8. Furtif
    Furtif WRInaute passionné
    Inscrit:
    9 Août 2005
    Messages:
    2 462
    J'aime reçus:
    136
    C'est exactement dans le fichier robots.txt...

    dans ton fichier robots.txt

    User-agent: *
    Disallow: /wp-admin/
    Sitemap: http://www.xxxxxx.com/sitemap.xml.gz
    0 erreurs
    0 avertissements

    Supprime la ligne : Disallow: /wp-admin/

    comprendo ?

    Bé faut laisser le temps a gogolebot d'arriver chez toi, y'a un gros paquet de sites sur le net, chacun son tour....
    Y'a que le père noel qui arrive a livrer ses cadeaux dans des millions de foyer a la meme heure simultanément....
    et le père noel est plus balèze que le gogolebot..
     
  9. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 372
    J'aime reçus:
    2
    Le dossier wp-admin comprend les fichiers utilisés dans l'admin, qui ne concernent pas Google, théoriquement.

    Les fichiers js et css utilisés pour le front-end sont dans wp-includes ou dans wp-content/themes et wp-content/plugin

    Certains plugins spécifiques font appel à wp-admin, mais ce qu'ils génèrent ne concerne Google en rien. Donc si tu es sûr que tu n'interdis pas autre chose, tu laisses Google se démerder avec ce que tu lui sers

    D'ailleurs le plus simple, c'est d'explorer ta page comme Google. Tu verras s'il manque des choses ou pas.

    (@Furtif, désolée, mais tu as tort, sur ce coup là)
     
  10. Newbipastaper
    Newbipastaper WRInaute discret
    Inscrit:
    24 Octobre 2013
    Messages:
    235
    J'aime reçus:
    0
    Hello :) J'ai reçu le même message hier.

    Disallow: /fr/ ==> le /fr/ n'existe plus mais vu que Google continue à l'indexer, je l'ai bloqué
    Disallow: /en/ ==> idem que pour le /en/
    Disallow: /*modules/ ==> bah là ya rien à indexer, ce serait crado sinon dans les serps
    Disallow: /themes/ ==> idem

    Disallow: /panier ==> idem sinon spam de pages
    Disallow: /pages.php?* ==> ça c'est un vieux truc qui n'existe pas et que je n'arrive pas à faire désindexer malgré mes multiples demandes de suppression
    Disallow: /index.php?controller=404 ==> idem

    Après j'ai retesté le site dans tous les sens avec les outils google et il ne me dit nulle part qu'il n'arrive pas à exécuter de js ou css. Ne serait ce pas plutôt un "bug" ou un message envoyé à plein de webmasters pour qu'ils revérifient qu'ils sont bien conformes ?
     
  11. Furtif
    Furtif WRInaute passionné
    Inscrit:
    9 Août 2005
    Messages:
    2 462
    J'aime reçus:
    136
    Il n'a pas besoin de l'interdire dans le robots.tx, Gogole fera le menage tout seul et de toute facon l'admin est une zone securisée protege par un login/mdp

    Oui et ? il ne les a pas interdits dans le robots.txt.
    Qu'il vire la ligne Disallow: /wp-admin/ et il sera tranquille...

    Ou il ajoute :

    Allow: /ww-admin/css/
    Allow: /wp-admin/js/
    Disallow: /wp-admin/

    et tout le monte il est content

    :D
     
  12. Sodium
    Sodium WRInaute discret
    Inscrit:
    16 Mars 2015
    Messages:
    73
    J'aime reçus:
    0
    Ca me fait toujours sourire ce genre de trucs. Si Google était capable de se débrouiller tout seul il ne s'obstinerait pas à garder en mémoire mes url redirigées il y a plus de 6 mois. Le laisser se débrouiller tout seul sans lui indiquer quoi visiter ou non, c'est s'assurer une masse de duplicate content et de pages qui n'auraient jamais du être crawlées dans les résultats.
     
  13. walking7
    walking7 WRInaute passionné
    Inscrit:
    17 Février 2009
    Messages:
    1 556
    J'aime reçus:
    7
    M-A, j'ai fait "explorer comme google" de visu, la page vu par google ou vu par googlebot est identique. Par contre, plus bas il est noté ceci:
    Certaines ressources n'ont pas pu être obtenues par Googlebot pour cette page, en voici la liste :

    https://shareaholic.com/v2/user_info?callback=jQuery213068302113329991 ... 8162271233
    Script Bloqué

    http://analytics.shareaholic.com/dough/1.0/pageview.gif?referrer=
    Image Bloqué

    http://clickcdn.shareaholic.com/api/vglnk.js
    Script Bloqué

    http://www.monsite.com/wp-admin/admin-ajax.php?action=shareaholic_shar ... email_this
    AJAX Bloqué Outil de test du fichier robots.txt

    http://graph.facebook.com/?id=http%3A%2F%2Fwww.monsite.com%2F&callback ... 8162271236

    Et c'est pour ca qu'il me fait tout un plat le google ? Rien de grave là non ?!


    Heu, un site à + 9 mois quand même ! Et je recois aujourd'hui seulement ce truc ?

    Je penche plutôt là dessus aussi ! Sinon, il y aurai pas écrit 0 erreurs et 0 avertissements dans mon robots.txt non ?
    Dans "Paramètres d'url" aussi ,j'ai ce message "Pour le moment, Googlebot n'a rencontré aucun problème avec votre site."
    Par contre dans messagerie, j'ai bien le message tel que celui que j'ai recu par mail
    Alors, faudrait savoir ?
    Juste, j'ai jamais touché au robots.txt. Il est "par défaut" ainsi avec le thme wordpress spacious.
     
  14. spout
    spout WRInaute accro
    Inscrit:
    14 Mai 2003
    Messages:
    8 759
    J'aime reçus:
    234
  15. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 372
    J'aime reçus:
    2
    Oui, DONC il n'a rien à faire parce qu'il ne va pas empêcher Google de voir son site comme il faut :)
     
  16. Furtif
    Furtif WRInaute passionné
    Inscrit:
    9 Août 2005
    Messages:
    2 462
    J'aime reçus:
    136
    Avant ca posait pas de souci, entre-temps ca a changé, faut s'adapter

    Interdire un acces css dans le robots.txt ne te donnera pas une erreur, la verification du Robots.txt se porte simplement sur ta syntaxe.

    Si tu roules a 160 sur l'autoroute avec ta caisse, tu n'auras aucun message d'erreur de ton moteur... mais les petits hommes bleus (gogolebot) seront pas contents....
     
  17. walking7
    walking7 WRInaute passionné
    Inscrit:
    17 Février 2009
    Messages:
    1 556
    J'aime reçus:
    7
    Mon anglais n'étant pas au top (M-A spécial dédicace :mrgreen: ) que dois je comprendre de ce message ? En gros, j'a m'inquiete pas et j'ai rien à faire (j'ai pas disallow/js ..)

    Ce que j'arrive pas à comprendre c'est si googlebot est bloqué ou non, quand je test il ne l'est que pour des futilités (comme j'ai mentionné plus haut) js shareolic, facebook, twitter. Donc pas d'inquiétude particulière à avoir je pense non
     
  18. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 372
    J'aime reçus:
    2
    Tu ne t'inquiètes pas.

    Tu fais comme je t'ai dit :) un ctrl+U pour voir le code source de ta page (déconnecté, bien sûr, de ton site) et pour voir quels sont les scripts chargés. Tu envoies cette même page au "explorer comme Google" sur ta console, et si elle s'affiche bien, tu n'as rien à faire.
     
  19. walking7
    walking7 WRInaute passionné
    Inscrit:
    17 Février 2009
    Messages:
    1 556
    J'aime reçus:
    7
    Ok bon bah ca s'affiche bien. Comme j'ai dit
    Certaines ressources n'ont pas pu être obtenues par Googlebot pour cette page, en voici la liste:
    => Ca concerne 6 liens en tout Amazon (image), Shareeholic (script), facebook, twitter (Ajax)

    Donc en gros Google a envoyé ce message à tout le monde, même quand ce n'était pas vraiment nécessaire ?
    ps: c'est qui Pfizer ?
     
  20. Doubrovski
    Doubrovski WRInaute occasionnel
    Inscrit:
    9 Avril 2011
    Messages:
    435
    J'aime reçus:
    0
    Sur un wordpress, pour moi Google n'a rien à faire dans /wp-admin, ni /wp-includes.
    D'ailleurs, ces répertoires sont censés être protégés. /wp-includes doit renvoyer une erreur 403. Je pense pas que ce soit un problème de les bloquer via robots.txt.

    Seul /wp-content doit être accessible.

    Mais j'ai aussi reçu le message alors que je ne bloque que le minimum... Je vois plutôt le robots.txt comme une faille de sécurité !
     
  21. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 372
    J'aime reçus:
    2
    Je n'avais pas vu ton précédent message. Vu ce qu'il ne peut pas afficher, tu t'en fous :)
     
  22. Sodium
    Sodium WRInaute discret
    Inscrit:
    16 Mars 2015
    Messages:
    73
    J'aime reçus:
    0
    Je serais prudent à ce niveau, ce n'est pas parce que Google n'a rien à faire dans certaines parties de site qu'il ne va pas faire pression pour essayer d'y accéder tout de même (ce qui est parfaitement hypocrite, je doute fortement que le bot se dise "oulala, le robots.txt m'interdit de référencer ce dossier, je ne dois surtout pas regarder ce qu'il y a à l'intérieur).

    Le mail sonne d'ailleurs plus comme une menace qu'autre chose "En bloquant l'accès à ces éléments, il est donc possible que le classement du site ne soit pas optimal.". Ca me fait penser à une penser à une organisation mafieuse signalant que bien-sûr, sa protection est un service optionnel, mais qu'un accident est vite arrivé.
     
  23. indigene
    indigene WRInaute accro
    Inscrit:
    7 Septembre 2003
    Messages:
    3 656
    J'aime reçus:
    72
  24. walking7
    walking7 WRInaute passionné
    Inscrit:
    17 Février 2009
    Messages:
    1 556
    J'aime reçus:
    7
    bah moi j'ai rien mis du tout nul part. C'est les reglages par défaut du theme wordpress et du plugin shareaholic là.
     
  25. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 372
    J'aime reçus:
    2
    Je suppose que tu as regardé où vont ces liens ? Pour savoir s'il est intéressant de les laisser suivre par Google ?

    Et pourtant si.... il y a suffisamment de sites qui se flinguent avec des robots.txt mal faits :)

    En dehors de l'interprétation affective que je ne cite pas, il s'agit non pas d'une menace mais d'une information...
     
Chargement...
Similar Threads - Acces googlebot fichiers Forum Date
Accès de Googlebot aux fichiers CSS et JS impossible Débuter en référencement 30 Juillet 2015
Message Googlebot can't access your site Crawl et indexation Google, sitemaps 30 Septembre 2014
Interdire accès sauf pour . Googlebot URL Rewriting et .htaccess 22 Janvier 2014
Erreurs 500 pour le Googlebot et dans GWT, mais site accessible Crawl et indexation Google, sitemaps 5 Avril 2012
Interdire l'accès de GoogleBot à une page Crawl et indexation Google, sitemaps 23 Juillet 2011
Webmaster Tools : Donner accès à une partie privée à Googlebot Google : l'entreprise, les sites web, les services 3 Janvier 2010
Googlebot last access Débuter en référencement 22 Mai 2009
htaccess errordocument me fait perdre ID de session Développement d'un site Web ou d'une appli mobile 18 Août 2019
Désindexation pdf via htaccess Crawl et indexation Google, sitemaps 9 Juillet 2019
syntaxe commande dans htaccess Crawl et indexation Google, sitemaps 8 Juillet 2019
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice