Google commence à indexer les formulaires
Alors que jusqu'à présent les pages accessibles uniquement via un formulaire font partie de ce qu'on appelle le web invisible (des moteurs de recherche), Google a commencé à expérimenter le crawl des formulaires. C'est à la fois une bonne et une mauvaise nouvelle… explications.
Jayant Madhavan et Alon Halevy, de l'équipe Crawl et Indexation chez Google, viennent d'expliquer sur leur blog que Google venait de commencer à tester le crawl (et l'indexation) des pages accessibles par formulaire. Rappelons que pour l'instant Google ne fait que suivre les liens classiques a href pour découvrir les pages à indexer (je mets de côté les pages soumises par un fichier Google Sitemap).
Précisons que cette expérimentation ne concerne que les sites de haute qualité
. On se demande bien ce qui se cache derrière cette appellation, cela signifie en tout cas que tous les formulaires ne seront pas forcément testés par Googlebot. Concrètement, voici ce qu'il faut retenir :
- Google ne crawle que les formulaires de type GET (on met donc de côté la méthode POST), c'est-à-dire ceux qui font apparaître les paramètres dans l'URL de la page de soumission du formulaire.
- Les différentes valeurs des listes déroulantes ou des cases à cocher seront testées (ce qui fait parfois un paquet de combinaisons)
- Pour les champs texte, Google va tester de les remplir avec des mots-clés qui lui semblent pertinents par rapport au site ! Je serais curieux de savoir comment ils sont sélectionnés, en tout cas ça peut être intéressant d'en avoir la liste pour un site donné.
- Une fois la page (de résultats) crawlée, Google l'analyse pour vérifier si elle ne correspond pas déjà à une page qui serait déjà dans l'index (ce qui causerait donc des problèmes de contenus dupliqués). Une vérification de la
validité
et de l'intérêt
est également effectuée avant d'indexer la page.
Google précise que ceci ne changera rien au PageRank et (quasiment rien) au positionnement des pages actuelles d'un site. En clair, Google ne considère toujours pas (et c'est logique) que les pages accessibles par formulaires reçoivent de la popularité comme c'est le cas quand il s'agit de liens.
L'indexation des formulaires peut être rangée dans la famille des améliorations des moteurs de recherche, tout comme celle des animations Flash ou des scripts JavaScript. Faut-il pour autant se réjouir ?
- certains formulaires mènent à des pages que le webmaster n'a pas prévu de faire indexer, car elles mènent à des contenus déjà accessibles sur d'autres pages indexées. Dans ce cas, il va falloir désormais indiquer aux robots que l'on ne souhaite pas qu'ils indexent ces pages (c'est ce que je fais pour mes outils qui reposent sur un formulaire en GET, bien pratique pour faire un lien vers une page de résultats). On peut aussi bloquer le crawl en utilisant le fichier robots.txt (ce qui bloquera forcément l'indexation).
- certains formulaires mènent à des pages ne présentant pas forcément un contenu en tant que résultat. C'est le cas des formulaires de connexion à une zone membre, ou des achats sur un site de ecommerce ! Là non plus on ne veut évidemment pas de robots… En théorie Google a prévu ces cas mais on ne sait jamais maintenant.
Comment vont réagir les webmasters ? Que va-t-il se passer avec toutes ces pages indexées à l'insu du plein gré
des webmasters :-) ? Les champs hidden seront-ils exploités (avec un risque accru de spam) ? Les autres moteurs vont-ils suivre la voie de Google ? On discute de l'indexation des formulaires par Google dans le forum…
Olivier Duffez, Lundi 14 avril 2008
Formation référencement et webmarketing
Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).
Lectures recommandées sur ce thème :
- Le Full Crawl a enfin commencé
- Googlebot, le robot d'indexation de Google
- Etude de Googlebot, le robot d'indexation de Google
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- Google sait désormais indexer le texte des animations Flash
- La danse de Googlebot :-) La Google Dance
- Contraintes d'emplacement du Sitemap
- La vie d'une page sur le web : Fresh Crawl, Deep Crawl, Google Dance
- Le début du full crawl
- Googlebot analyse certains codes JavaScript
- Incidence indexation via formulaire google
- google crawl indexation nouveaux domaines
- Google Video : formulaire d'envoi sur le web
- indexation de pages affichées apres un formulaire ??
- Rapidité Dés-indexation / Ré-indexation google
- [Google] Les fichiers Sitemaps supportés par GWT
- [Google] Technique OCR pour indexer les fichiers PDF
- indexation sur google.frfrancais mais pas google.fr France !
- formulaire contact google
- Taille de font du formulaire de post
Consultez la description détaillée des produits ou services de Google suivants : Googlebot, Google Webmaster Tools, Google Sitemaps, Google Code Project Hosting, Google Video Upload
- Déterminer l'âge d'un site
Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org).
4 commentaires sur “Google commence à indexer les formulaires”
Laisser une réponse
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
A la une sur WebRankInfo
Formation au référencement
Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.
Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !
Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.
Logiciel de pro
Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.
Derniers sites inscrits
- Math secondaire, Cours, Exercices, Devoirs, Bac, révisions
- Infographiste Freelance, Référencement site internet, création en tous genre
- Home staging pour mettre en valeur votre bien immobilier
- Bureau d'études automatisme et informatique industrielle
- Altros, société de portage salarial depuis 2002
- Création et développement de site Internet
- Publication de communiqués de presse
- Hervé Sors, un écrivain en arbre
- Création site internet seo crée et réalise vos sites internet
- Energies concept et conseils haute loire 43



Google a effectivement référencé plusieurs "post" de notre formulaire qui se trouve ici http://www.petitesannonces.be/vo... ce qui nous a surpris. Nous n avions pas prévu des balises titre pour certaines situations. A noter qu ils ont laissé "toutes marques" "tous modèles" mais qu ils ont joué avec les chmaps "type" et "budget" ce qui en fait n a pas beaucoup de sens pour nous ici.
Quid des formulaires Google CSE et compagnie ?
On s’est emm*… à empêcher l’indexation des résultats de recherche (cf. guidelines Google): pourquoi se mettre à remplir les formulaires ???
Pas logique comme décision.
« certains formulaires mènent à des pages ne présentant pas forcément un contenu en tant que résultat. C’est le cas des formulaires de connexion à une zone membre, ou des achats sur un site de ecommerce ! Là non plus on ne veut évidemment pas de robots… »
Attention, l’amélioration de Google ne concerne que les formulaires de type « GET » comme mentionné plus haut dans l’article. Or, les formulaires de connexion ou d’achat sont le plus souvent de type «POST» et s’ils ne le sont pas, ils devraient l’être.
mais cela peut etre une bonne ou mauvaise nouvelle, concernant les petits sites qui ne rewrite pas leur pages accessible via un formulaire ou qu’il ne les optimise pas…