Vous êtes ici : Dossiers référencement > Actualité

Membre WebRankInfo ?

S'inscrire Aide

Google commence à indexer les formulaires

Alors que jusqu'à présent les pages accessibles uniquement via un formulaire font partie de ce qu'on appelle le web invisible (des moteurs de recherche), Google a commencé à expérimenter le crawl des formulaires. C'est à la fois une bonne et une mauvaise nouvelle… explications.

Jayant Madhavan et Alon Halevy, de l'équipe Crawl et Indexation chez Google, viennent d'expliquer sur leur blog que Google venait de commencer à tester le crawl (et l'indexation) des pages accessibles par formulaire. Rappelons que pour l'instant Google ne fait que suivre les liens classiques a href pour découvrir les pages à indexer (je mets de côté les pages soumises par un fichier Google Sitemap).

Précisons que cette expérimentation ne concerne que les sites de haute qualité. On se demande bien ce qui se cache derrière cette appellation, cela signifie en tout cas que tous les formulaires ne seront pas forcément testés par Googlebot. Concrètement, voici ce qu'il faut retenir :

  • Google ne crawle que les formulaires de type GET (on met donc de côté la méthode POST), c'est-à-dire ceux qui font apparaître les paramètres dans l'URL de la page de soumission du formulaire.
  • Les différentes valeurs des listes déroulantes ou des cases à cocher seront testées (ce qui fait parfois un paquet de combinaisons)
  • Pour les champs texte, Google va tester de les remplir avec des mots-clés qui lui semblent pertinents par rapport au site ! Je serais curieux de savoir comment ils sont sélectionnés, en tout cas ça peut être intéressant d'en avoir la liste pour un site donné.
  • Une fois la page (de résultats) crawlée, Google l'analyse pour vérifier si elle ne correspond pas déjà à une page qui serait déjà dans l'index (ce qui causerait donc des problèmes de contenus dupliqués). Une vérification de la validité et de l'intérêt est également effectuée avant d'indexer la page.

Google précise que ceci ne changera rien au PageRank et (quasiment rien) au positionnement des pages actuelles d'un site. En clair, Google ne considère toujours pas (et c'est logique) que les pages accessibles par formulaires reçoivent de la popularité comme c'est le cas quand il s'agit de liens.

L'indexation des formulaires peut être rangée dans la famille des améliorations des moteurs de recherche, tout comme celle des animations Flash ou des scripts JavaScript. Faut-il pour autant se réjouir ?

  • certains formulaires mènent à des pages que le webmaster n'a pas prévu de faire indexer, car elles mènent à des contenus déjà accessibles sur d'autres pages indexées. Dans ce cas, il va falloir désormais indiquer aux robots que l'on ne souhaite pas qu'ils indexent ces pages (c'est ce que je fais pour mes outils qui reposent sur un formulaire en GET, bien pratique pour faire un lien vers une page de résultats). On peut aussi bloquer le crawl en utilisant le fichier robots.txt (ce qui bloquera forcément l'indexation).
  • certains formulaires mènent à des pages ne présentant pas forcément un contenu en tant que résultat. C'est le cas des formulaires de connexion à une zone membre, ou des achats sur un site de ecommerce ! Là non plus on ne veut évidemment pas de robots… En théorie Google a prévu ces cas mais on ne sait jamais maintenant.

Comment vont réagir les webmasters ? Que va-t-il se passer avec toutes ces pages indexées à l'insu du plein gré des webmasters :-) ? Les champs hidden seront-ils exploités (avec un risque accru de spam) ? Les autres moteurs vont-ils suivre la voie de Google ? On discute de l'indexation des formulaires par Google dans le forum…

Olivier Duffez, Lundi 14 avril 2008


Formation référencement et webmarketing

Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).


Lectures recommandées sur ce thème :

  • Déterminer l'âge d'un site
    Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org).


4 commentaires sur “Google commence à indexer les formulaires”

  1. fredp dit :

    Google a effectivement référencé plusieurs "post" de notre formulaire qui se trouve ici http://www.petitesannonces.be/vo... ce qui nous a surpris. Nous n avions pas prévu des balises titre pour certaines situations. A noter qu ils ont laissé "toutes marques" "tous modèles" mais qu ils ont joué avec les chmaps "type" et "budget" ce qui en fait n a pas beaucoup de sens pour nous ici.

  2. HawkEye dit :

    Quid des formulaires Google CSE et compagnie ?

    On s’est emm*… à empêcher l’indexation des résultats de recherche (cf. guidelines Google): pourquoi se mettre à remplir les formulaires ???

    Pas logique comme décision.

  3. CM dit :

    « certains formulaires mènent à des pages ne présentant pas forcément un contenu en tant que résultat. C’est le cas des formulaires de connexion à une zone membre, ou des achats sur un site de ecommerce ! Là non plus on ne veut évidemment pas de robots… »

    Attention, l’amélioration de Google ne concerne que les formulaires de type « GET » comme mentionné plus haut dans l’article. Or, les formulaires de connexion ou d’achat sont le plus souvent de type «POST» et s’ils ne le sont pas, ils devraient l’être.

  4. Algerie dit :

    mais cela peut etre une bonne ou mauvaise nouvelle, concernant les petits sites qui ne rewrite pas leur pages accessible via un formulaire ou qu’il ne les optimise pas…

Laisser une réponse

Hébergement web

Sivit

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.

A partir de 1,90 EUR HT/mois.

A la une sur WebRankInfo

Formation au référencement

Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.

Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !

Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.

Détails et inscription

Logiciel de pro

Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.

Téléchargement télécharger le logiciel de référencement AgentWebRanking