Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Google crawle les fichiers CSS

Jusqu'à présent, Google ignorait totalement les feuilles de styles (CSS), mais on voit désormais des robots de Google venir les crawler. Quels sont les objectifs de Google ?

Tout comme le JavaScript, les feuilles de styles CSS sont ignorées des moteurs de recherche. Il faudra peut-être bientôt dire étaient ignorées car des robots de Google viennent en effet les crawler (c'est-à-dire venir lire les fichiers). Pour des pages web classiques, Google indexe les pages qu'il a crawlées, mais qu'en est-il des feuilles de styles ?

Google n'a aucun intérêt à indexer les feuilles de styles puisqu'elles ne contiennent pas l'information, seulement la mise en forme. L'hypothèse la plus probable est que Google commence à chercher comment lutter contre le spam basé sur les styles CSS. Rien de plus facile en effet que de cacher du texte avec le CSS, il y a même de nombreuses méthodes.

Pour cela, Google doit interpréter ces feuilles de styles, ce que savent très bien faire les navigateurs, et donc aussi Google (surtout que Google est très proche des développeurs de Firefox).

Difficile de pronostiquer une suppression rapide de l'index Google des sites utilisant des styles CSS dans l'unique but de cacher du texte. En effet, même d'autres techniques bien plus anciennes ne sont pas souvent sanctionnées...

Merci à Yvel pour l'information qu'il a bien voulu partager avec la communauté WebRankInfo, la ligne suivante dans ses logs :

crawl-66-249-66-82.googlebot.com 27989 0 - [23/Jun/2006:03:32:20 +0200] "GET /style/corps.css HTTP/1.1" 200 613 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

On en discute dans le forum : Google et les feuilles de styles CSS.

Cet article vous a-t-il plu ?

Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

6 commentaires

syntaxerror

Les noscript peuvent servir dans le cadre de menus en javacript...

Répondre
RK Azur

peut être est-ce simplement un User Agent Switcher mais je suis aussi partisan de penser que Google va de plus en plus crawler les CSS et autres fichiers de config.

Son algorythme de recherche est performant, il ne lui reste plus qu'à éliminer les spammers. Ca va bouger dans les positions lol ...

A suivre

Répondre
Fab le Fou

Disons qu'il faut souhaiter que Google ne confondent pas les effets de styles sans "mauvaises" intentions (par exemple un texte caché mais qui apparaît lors du passage du curseur) avec des techniques vraiment frauduleuses. Et puis effectivement il faudrait déjà commencer par s'occuper des sites utilisant des vieilles techniques bien plus simples à détecter (les <noscript> & co).

Répondre
JP

Je ne pense pas que google crawl les css. Si c'était le cas, je l'aurais vu dans les logs !

Affaire a suivre ... c'est pas impossibe de la part de google ! On va rapidement le savoir.

Répondre
Patrick

C'est faux ! Google ne crawl pas les fichiers CSS, cette ligne est un fake !

Répondre