Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Google masque parfois la requête tapée par l’internaute et la remplace par (not provided)

En décidant d’activer par défaut la version sécurisée HTTPS (protocole SSL) pour les internautes connectés à leur compte Google, le géant de la recherche en ligne va perturber fortement le monde du webmarketing, principalement les référenceurs et les métiers des web analytics. En particulier, les mots-clés générateurs de trafic SEO ne seront pas toujours disponibles. Voici toutes les explications…

Google Encrypted Search, le précurseur

En mai 2010, Google avait mis en place Google Encrypted Search, une version de son moteur de recherche fonctionnant exclusivement en SSL. Disponible uniquement sur google.com, cette version n’est utilisée que par les (rares) internautes qui souhaitent renforcer la confidentialité des données échangées pendant leur navigation sur Google.

A noter que depuis juin 2010, Google Encrypted Search n’est plus disponible sur https://www.google.fr/?gfe_rd=cr&ei=Hu1XWMajG42DaIKEl8AI mais sur https://encrypted.google.com/.

Google.com en HTTPS (SSL)

Accès à Google en mode sécurisé HTTPS (protocole SSL) : certaines informations ne sont pas transmises aux sites visités par l’internaute depuis Google

Les nouveautés annoncées hier

Beaucoup d’informations circulent depuis l’annonce de Google hier. Voici donc les faits, exprimés de façon très précise (toutes les sources d’information sont regroupées en fin d’article, et sont mentionnées entre []) :

  • Un besoin de renforcer l’expérience de personnalisation des résultats de recherche.
    Dans [1] : « As search becomes an increasingly customized experience, we recognize the growing importance of protecting the personalized search results we deliver. »
    « Comme la recherche devient une expérience de plus en plus pesonnalisable, nous avons identifié l’importance de protéger les résultats de recherche personnalisés que nous fournissons. »
  • Seul le trafic des internautes connectés à Google sera concerné.
    Dans [1] : « Over the next few weeks, many of you will find yourselves redirected to https://www.google.com (note the extra “s”) when you’re signed in to your Google Account. »
    « Dans les prochaines semaines, la plupart d’entre vous allez être redirigés vers https://www.google.com (remarquez le “s” spécifique) quand vous serez connecté à votre compte Google. »
  • Cela ne concernerait qu’une petite partie du trafic SEO.
    Dans [2] : « Keep in mind that the change will affect only a minority of your traffic. »
    « Gardez à l’esprit que ce changement n’affectera qu’une petite partie de votre trafic. »
  • Une partie des informations de chaque recherche (i.e. le mot clé utilisé surtout) ne sera plus disponible.
    Dans [2] : « When a signed in user visits your site from an organic Google search, all web analytics services, including Google Analytics, will continue to recognize the visit as Google “organic” search, but will no longer report the query terms that the user searched on to reach your site. »
    « Quand un utilisateur connecté visitera votre site depuis une recherche naturelle dans Google, tous les services Web analytics, incluant Google Analytics, seront toujours capables d’identifier le trafic organique de la recherche Google, mais ne pourront plus récupérer le mot clé utilisé par l’utilisateur dans sa recherche amenant à votre site. »Certains annoncent que plus aucune information ne sera transmise : c’est un peu excessif ?
  • A la place des mots clés cachés, un intitulé générique « (not provided »)
    Dans [2] : « To help you better identify the signed in user organic search visits, we created the token “(not provided)” within Organic Search Traffic Keyword reporting. »
    « Pour vous aider à mieux identifier le trafic de recherche organique des utilisateurs connectés à Google, nous avons créés un intitulé ‘(non fourni)’ dans le rapport  Mots clés de la Recherche Naturel. »
  • Seules les informations agrégées du trafic SEO provenant de Google seront disponibles dans les rapports.
    Dans [2] : « We are still measuring all SEO traffic. You will still be able to see your conversion rates, segmentations, and more. »
    « Nous continuons à mesurer le trafic SEO. Vous pourrez toujours regarder vos taux de conversion, vos segmentations, et plus. »
  • Les données SEO concernant les mots clés seront disponibles dans Google Webmaster Tools.
    Dans [1] : « They can also receive an aggregated list of the top 1,000 search queries that drove traffic to their site for each of the past 30 days through Google Webmaster Tools. »
    « Ils pourront aussi recevoir une liste agrégée du top 1000 des mots clés de recherche qui génère du trafic vers leur site web, pour chacun des 30 derniers jours, via Google Webmaster Tools. »De plus, dans la nouvelle version de Google analytics, il est possible de coupler des rapports de Google Webmaster Tools [3]. Cependant, il n’y aura pas les informations d’atteinte de conversion (objectif et e-commerce).
  • Aucun impact sur les données de trafic payant (dont les Adwords).
    Dans [2] : « Note that “cpc” paid search data is not affected. »
    « Notez que les données concernant la recherche payant ‘cpd’ ne seront pas affectées. »
  • Et ce n’est que le début… ?
    Dans [1] : « As we continue to add more support for SSL across our products and services, we hope to see similar action from other websites. »
    « De même que nous renforçons la prise en compte du SSL dans nos produits et services, nous espérons voir des actions similaires dans d’autres sites. »

D’un point de vue technique

Actuellement, quand on fait une recherche dans Google en étant connecté et en mode SSL (https://…), un referrer est quand même transmis au site de destination, contrairement à ce que préconise la norme définissant le protocole HTTP(S) et sa prise en compte par les navigateurs ([6], comprenant particulièrement [7]).

Google à en effet mis en place un système de redirection juste après la page de résultats en mode SSL, afin qu’un referrer soit effectivement envoyé, sous la forme « http://www.google.com/url?… »

C’est grâce à ce referrer, contenant surtout le paramètre ‘q=’, que les outils de web analytics sont capables d’identifier le trafic provenant de la recherche naturelle dans Google, et d’identifier le mot clé.

Donc, suite à ces annonces, on peut supposer que ce paramètre « q= » sera toujours présent, mais ne contient plus le mot clé. Le trafic Google SEO sera identifié, mais pas le mot clé utilisé. (On peut aussi envisager que cela concernera aussi l’information de Google suggest).

Cependant certains annoncent que le referrer serait bloqué. Abus de langage ? Je pense, car sinon il sera impossible d’identifier le trafic Google organique.

Aussi il s’agit techniquement d’un blocage volontaire de l’information, et non d’une contrainte technique insurmontable.

Impact pour le monde SEO, SEM et Web analytics

Voici mes premières réflexions :

  • Pour les utilisateurs de Google :
    • la plupart ne s’en rendront sans doute pas compte,
    • ceux qui cherchent à protéger leur vie privée sur Internet feront attention à être connecté à leur compte Google quand ils font des recherches, ce qui permettra à Google d’en savoir encore plus sur leurs habitudes et de les inciter à utiliser le bouton +1 (ainsi que d’autres fonctionnalités de personnalisation),
    • indirectement c’est peut-être donc aussi une façon d’inciter les internautes à toujours utiliser leur compte Google, et donc aussi Google+.
  • Pour le SEO (référencement naturel) :
    • dans un certain nombre de cas, au lieu d’avoir le mot-clé indiqué dans Google Analytics, on aura la mention (not provided) (ce qui signifie « non fourni » ou « non disponible »),
    • cela ne permettra donc plus de connaître dans les détails les requêtes. Il sera donc plus difficile d’évaluer l’impact des actions de référencement naturel sur le trafic et (plus grave encore) les conversions (objectifs et commerce électronique),
    • d’après Matt Cutts cité par Danny Sullivan dans son article sur ce sujet [4], moins de 10% des utilisateurs seraient connectés à leur compte au moment où ils font leur recherche. A supposer que ce chiffre soit exact (d’aucuns le considère comme bas), cela indique que 10% des informations SEO du trafic Google organique seront « floutées » et uniquement agrégées dans le trafic SEO Google organique total.
    • des informations SEO seront disponibles dans les rapports de Google Webmaster Central, mais plus associées aux données de conversion, et avec beaucoup moins d’historique (comme le rappelle Zorgloob dans son article [5]). Notons également que cela rend les référenceurs encore plus dépendants de Google…
  • Pour AdWords :
    • aucun impact puisque Google a décidé de ne pas appliquer cette rétention de données à son programme AdWords. Qui a dit que c’était 2 poids 2 mesures ?
    • certains pourraient être un peu plus tentés qu’avant d’investir dans AdWords, pour retrouver tout le détail des mots-clés et donc une analyse fine des campagnes marketing. Ce n’est pas Google qui s’en plaindrait !
  • Pour les éditeurs de solutions de web analytics :
    • Le rapport des mots clés utilisés en recherche naturelle sera encore moins précis. Il y a une perte potentielle d’information dont le volume dépend de la proportion des connectés à Google parmi les visiteurs provenant d’une recherche dans ce moteur.

Projetons-nous dans l’avenir…

Ce n’est peut-être qu’un début…

Si vous lisez bien l’article de Google, vous noterez que non seulement Google envisage d’étendre l’usage de la version SSL à d’autres de ses produits, mais il encourage d’autres acteurs du web à adopter la même démarche.

Le referrer (site référent, ou page) étant le moyen technique principal pour identifier la source de trafic, à terme cela va poser un problème important, à moins que tous les sites passent en mode SSL. Ou alors il faudra que les outils de Web analytics introduisent une nouvelle méthode technique pour récupérer l’identification de la source de trafic et les données particulières comme le mot clé utilisé.

Depuis hier, cette annonce a fait circuler beaucoup d’octets sur le web, les experts du Web analytics ont discuté fermement sur le sujet. On peut dire que, pour l’instant, cette décision ne fait vraiment pas l’unanimité, à la lecture des commentaires du post [2] et de l’article de Danny Sullivan [4], expert américain du marché de la recherche sur le web.

Edit du 24/09/2013 : Google a décidé d’étendre le blocage du referrer dans 100% des cas. Vive le not provided !

Besoin d’y voir plus clair ?

Ranking Metrics, centre agréé de formation Google AnalyticsAfin de comprendre l’impact de ces annonces sur vos propres données Google Analytics, et d’apprendre comment exploiter au mieux l’intégration de Google Webmaster Tools, n’hésitez pas à venir à nos formations Google Analytics. Pour couvrir tous vos besoins, nous avons désormais 3 modules Google Analytics : technique, marketing et SEO. Notre formateur, expert Google Analytics, maîtrise tous ces aspects (aussi bien l’outil Google Analytics que le SEO et les autres impacts).

On discute également de ce fameux (not provided) sur google.com dans le forum WebRankInfo.

Sources

  1. L’article « Making search more secure » dans le blog officiel de Google
  2. L’article « Making search more secure: Accessing search query data in Google Analytics » dans le blog officiel de Google Analytics
  3. L’article « Webmaster Tools in Google Analytics for everyone » dans le Blog officiel de Google Analytics
  4. SearchEngineLand
  5. Zorgloob
  6. Explications sur le referrer dans Wikipedia
  7. RFC 2616 – Hypertext Transfer Protocol – Section 1.5.3

Cet article vous a-t-il plu ?

Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

25 commentaires

manou

Bonjour
Je trouve ça flippant, après le tremblement de Panda (grande polémique et pour l’instant aucun effet sur mes sites), une autre menace pèse sur nos métiers, et le SEO de nos sites !

Je comprend la stratégie et les avantages que cela représente pour Google, mais je ne puis m’empêcher de penser que ça va un peu trop loin.

Répondre
tonguide

Un aveu d’échec ? Supprimer les mots clés recherchés leur permettraient d’aveugler les SEO. De cette manière, via GG suggest, ils pourraient contrôler plus facilement les mots clés qui envoient du trafic et empêcher les analyses sur les longs mots clés.

Il reste à espérer que ça n’aille pas plus loin …

Répondre
KelCom

C’est en effet très problématique, et on se demande quel est le véritable but de Google, car la sécurité… mouais, en quoi cela traduisait une ouverture dans la vie privée ?

Ce qui m’inquiète, c’est cette dépendance vis-à-vis de leurs services et ces décisions brutales et nuisibles, non seulement aux méchants référenceurs, mais bel et bien aux webmarketing et tous les métiers qui pouvaient trouver une utilité à connaître les « motivations écrites » de leurs visiteurs pour améliorer les « réponses » de leur site.

Bref, le bon sens l’emportera toujours de toute façon, à savoir sur quels mots-clés importants et indispensables se positionner, mais la communication avec le client et les différentes recherches/analyses se réduiront. Personne n’en sortira grandi ni réellement protégé.

Quand Google parle de protection avec tout ce qu’ils mettent en place, c’est doucement drôle…

Répondre
vacances

Dans le cas de la grande majorité des sites, l’impact sera nul puisque l’utilisateur lambda n’est pas connecté. Par contre, j’ai un peu de mal à comprendre la stratégie de mettre une connexion SSL sur un moteur de recherche. En quoi les données sont sensibles ?

Répondre
Jean-marc

Vous avez dit sécurité et respect de la vie privée ? En fait, Google reste le seul à pouvoir connaître TOUTES les habitudes des internautes. Il se prend pour la police du web… Au secours l’UE ! Vite une enquête !

Répondre
Jean-marc

En fait Google en est arrivé là grâce à nous. Maintenant, il n’a plus besoin de nous; alors il nous en…. Voilà comment il nous remercie.

Répondre
Damien

Il y a du positif dans ce changement.
N’arrivez-vous pas à voir ce côté là ?
En ce qui concerne les SEO + toux ceux qui sont à la pointe de l’analyse de mots clés, c’est plutôt critique.
Je pense qu’ils veulent tourner une page dans ce domaine, que la concentration se dirige peut-être ailleurs.

Répondre
fredo

Google 2011 : Panda , SSL , site-links , redirections , … Google valorisent les sites réglos … On devrait tous s’en réjouir …

Répondre
Olivier Duffez

J’ai du mal à voir la démonstration… en tout cas ce n’est pas très convaincant. Quel rapport avec le SSL, les sitelinks ou les redirections ?

Répondre
Denis

Je mets le même commentaire que sur le blog d’Olivier Andrieu. Dans la mesure où l’analyse se fait à partir du referer, en quoi le fait de crypter le flux entre l’internaute et Google change quoi que ce soit pour les outils d’analyse ? A ce que je sache, l’adresse du referer, elle, n’est pas encore cryptée !

Répondre
Olivier Duffez

Ce n’est pas le flux de données entre l’internaute et Google qui est crypté, c’est celui entre l’ordinateur de l’internaute et le routeur qui lui fournit l’accès à Internet.
Par contre, ce qui est problématique dans le cas qui nous intéresse, c’est que Google supprime certaines informations habituellement situées dans le referrer. En gros, chaque clic sur un résultat passera par une étape intermédiaire (toujours en HTTPS) qui consistera à supprimer le contenu de la variable « q » qui stocke la requête tapée par l’internaute. D’autres informations seront peut-être également supprimées, je n’en sais pas plus pour le moment.

Répondre
Ovny

Si pour le moment seulement 10% des informations SEO du trafic Google organique seront en « not provided », l’impact ne sera pas énorme.
Mais si cette statistique augmente, il sera difficile d’évaluer le comportement des utilisateurs.
Google Adwords a de beaux jours devant lui !

Répondre
Mathieu

Bonjour,

Je tenais à vous informer que aujourd’hui dans les statistiques dans Analytics, j’ai retrouvé deux fois not provided…c’est déjà commencé alors…?

Bien sûr, sur des milliers de requêtes c’est pas trop grave…mais bon à suivre…

Répondre
buzzsiteweb

Celà va toujours dans la même direction, nuire aux SEO et au webmarketing… C’est bien dommage car pour tout site il est important de connaitre quel est son public, quel sont les requêtes qui générent du trafic. En espérant que ce chiffre des utilisateurs connectés n’enfle pas trop sinon c’est foutu… Enfin il reste toujours Bing :)

Répondre
Annuaire Français

Il faut aussi reconnaitre que bonne partie des informations et services que Google met à la disposition du public est aussi disponible pour la concurrence et peut-être que celle-ci se faisant de plus en plus pressante, Google met les verrous où il peut?

Je ne pense pas que ce soit pour embêter les webmasters ou alors, Google ne veut mettre en place cette stratégie que pour son propre bénéfice, soit pour Google+ , soit pour le Shopping. Eventuellement adresse, car on ne sait pas ce que nous réserve google pour les pages entreprises.

Si tel était le cas, ce serait alors un abus de position dominante et l’on pourrait penser que Google frôle la limite de la légalité selon le principe sur lequel la recherche sécurisée est effectuée.

Que Google actionne par défaut le protocole SSL lors de la connexion sur un compte, rien d’anormal.
Si cette couche SSL est automatiquement appliquée pour la recherche, si l’internaute n’a pas choisi cette fonction librement, c’est profiter de l’occasion et du prétexte de la connexion au compte pour annihiler toute information de recherche disponible aux outils d’analyse.

Vu que la propagande pour les pages entreprises va être sûrement la plus importante réalisée par Google, plus que Google+ a mon avis et que tout autres, on peu estimer a + 30% le volume de requêtes « mystérieuses » sur vos sites.

Dans cette expectative, on pourrait prôner le boycott des pages entreprises , mais il y aura forcément des attraits qui seront difficile de contourner, comme les pages adresses qui vont se transformer probablement.

Répondre
cortes

humm à mon avis, la motivation de google est plus que les mots clefs ont une énorme valeur marchande (pour le profiling publicitaire). En ne les envoyant plus aux sites, il force l’usage de leurs outils (google analytics mais aussi doubleclick et la ribambelle d’outils qui tournent autour…). Je suis sur que les outils de google auront eux acces aux mots clefs des internautes!

Répondre
Ben

J’avais une proportion stable de (not provided) depuis le 19, mais cela commence à augmenter depuis hier. Wait & See …

Répondre
Ludovic

C’est super inquiétant tout ça…

Répondre
Studio Créations

J’utilise Livezilla comme système de chat avec pas mal d’informations sur les connectés au site et effectivement depuis quelques jours dans la colonne referrer, google.fr n’y apparait plus pour les searchstring.
Par contre google.com et autres extensions continuent à apparaître.

Répondre
Secrétariat téléphonique

Je pense que sur Google Analytics les personnes auront toujours accès aux requête, j’avais eu l’occasion de lire cela sur un article …

Encore un moyen de la part de Google de ramener tout le monde vers Google Analytics …

Répondre
Olivier Duffez

Pourquoi répandre des rumeurs ? cette information est fausse, en tout cas pour l’instant.

Répondre
Zone Référencement Inc

Il est certain que si les référenceurs ne sont plus capables de prouver leurs résultats aux entreprises avec des rapports d’analyses fiables, ceux-çi seront peut-être encouragés à utiliser Google Adwords qui fournira plus d’informations mais encore là… si on parle de 10% … ce n’est pas « la fin des temps » ;)

Pour ce qui est du reste, il n’y aura pas un énorme changement car nous pourrons encore utiliser les données du générateur de mots clés Adwords afin de voir ce que les gens cherchent.

Nous pourrons toujours optimiser les sites et les clients pourront tout de même voir une croissance de leur achalandage mais c’est plutôt déplaisant de ne plus voir vraiment TOUTES les statistiques. Je l’avoue.

Si ce n’est que 10% des utilisateurs, il sera tout de même facile de voir les tendances. Parcontre, si il s’agit de TOUTES les recherches, nous devrons naviguer en aveugles. Ce qui est un peu moins plaisant.

Pour ce qui est de la confidentialité, je crois qu’il y a vraiment une forte demande de ce côté sur le web (ce qui est relativement normal) et avec leur + , Google font directement la compétition à Facebook qui permet cette sécurité sur ses services pour la confidentialité entre les utilisateurs.

Comme Google semble complètement aveuglé par ce désir de croquer Facebook, c’est peut-être ici la seule raison de l’utilisation du ssl alors je crois qu’il ne faut pas s’en faire avec cela à moins qu’il soit question de balancer vers le SSL pour toutes les recherches effectuées par les utilisateurs, connectés ou non.

Bon référencement à tous! (Allez!… au boulot ;P )

Répondre
seb

Google se met en situation de monopole et accessoirement, met la carotte aux webmasters. Comme précisé sur sa page d’explications en anglais: les datas seront toujours enregistrées au même titre que l’HTTP: google en chantre de la privacy ^^

Répondre
Doume06

Je viens de regarder sur GA : 15% des visites sont en « not provided » en ce qui me concerne… :-(
pas top quand même leur histoire…

Répondre
Mathias

A date d’aujourd’hui je suis passé à 70% de (not provided)pour ce mois de septembre 2013 !!!
Super inquiétant !!

Répondre