Voilà comment Google analyse les requêtes des internautes

Discussion dans 'Référencement Google' créé par WebRankInfo, 17 Juillet 2008.

  1. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    20 213
    J'aime reçus:
    563
    J'ai fait une petite traduction-résumée-commentée d'un article de Google sur les technologies utilisées pour analyser les requêtes des internautes, les internautes eux-mêmes ainsi bien sûr que les pages web que nous optimisons comme des fous :)

    Les technologies utilisées par Google Search
    Amit Singhal vient de vulgariser sur le blog officiel de Google les principales technologies utilisées par le leader de la recherche sur Internet. Pour résumer, il les a classées en 3 grandes catégories représentant les défis auxquels tout moteur de recherche est confronté : comprendre de quoi parlent les pages web, comprendre les requêtes tapées par les internautes, comprendre les intentions des internautes eux-mêmes.

    Pour ceux qui veulent lire l’article original complet, c’est ici en anglais : Technologies behind Google ranking. Pour les autres, voici un petit résumé…

    Analyse des pages web
    Google a beaucoup travaillé sur son système de crawl et d’indexation, afin d’arriver à avoir un index à la fois très grand et récemment mis à jour (« frais » comme ils disent). Google dit également s’être amélioré dans la compréhension des concepts abordés sur les pages web, même si certains mots-clés n’y figurent pas. On sait que cela peut venir de l’analyse du profil du netlinking des pages (et du site). Cela peut venir également de nombreuses autres analyses, que l’ingénieur de Google ne détaille pas ici bien entendu. Google peut très bien par exemple déterminer le lieu géographique associé à un site (si c’est pertinent) et positionner ses pages en bonne place parmi les résultats sur des requêtes incluant ce lieu, même s’il ne figure pas dans le texte de la page.

    Amit Singhal indique aussi que l’algorithme de Google fait la part entre les mots importants et ceux qui le sont moins. La fraîcheur des informations d’une page est également mesurée…

    Analyse des requêtes
    Quand ils tapent leurs requêtes, les internautes ne font pas toujours bien attention aux mots qu’ils emploient. Parfois, leur formulation n’est pas la meilleure, et Google doit s’en sortir malgré tout pour comprendre ce que l’internaute cherche vraiment. On a tous vu que quand on fait une faute de frappe, Google nous suggère une correction. L’exemple donné dans l’article concerne Kofi Annan : si on cherche [kofee annan], Google nous demande si ce n’est pas plutôt [kofi annan] que nous cherchons…

    Un des points clés dans la compréhension des requêtes est l’étude des synonymes. En réalité, Google modifie parfois la requête de l’internaute afin de lui retourner des résultats plus pertinents. L’algorithme de Google exploite aussi énormément les entités nommées et les abréviations en tous genres. Par exemple, il sait bien que dans la requête [Dr Zhivago], Dr signifie Docteur, tandis que dans la requête [Rodeo Dr], Dr signifie Drive.

    Parfois le système de Google exploite l’algorithme maison d’identification des concepts. Par exemple un internaute qui tape la requête [new york times square church] ne s’intéresse pas aux articles du journal du New York Times, mais à l’église de Times Square à New York.

    Toutes ces analyses de la requêtes sont faites dans toutes les langues gérées par Google, avec les subtilités de chacune…

    Analyse des internautes qui font les recherches
    Le dernier point-clé réside dans l’analyse des internautes eux-mêmes, en plus de leur requête. L’idée est d’arriver à mieux comprendre ce qu’ils ont en tête quand ils font leurs recherches. Un des points essentiels est la prise en compte du pays dans lequel se trouve l’internaute (et/ou de l’interface de Google qu’il utilise : google.fr ? google.com ? google.be ? etc.). Une même requête doit être traitée de façon différente par Google selon ces cas de figure. Amit Singhal prend un exemple pour les francophones : un Français qui tape [Côte d’Or] cherche a priori des informations sur le département du même nom, tandis qu’un Belge (ou un français gourmand) s’intéresse plutôt à la marque de chocolat du même nom.

    Évidemment, Google a également développé tout l’aspect personnalisation, en tenant compte de l’historique des requêtes de l’internaute. Un internaute qui cherche des informations sur [jaguar] aura des résultats sur la marque de voiture de luxe s’il a déjà fait de nombreuses requêtes dans ce domaine, plutôt sur l’animal. La personnalisation n’est vraiment possible que pour les membres qui font leurs recherches sur Google tout en étant connecté avec leur compte Google, avec l’historique des recherches activé.

    Même si encore une fois cet article ne nous révèle aucun secret, je trouve l’effort louable de la part de Google de vulgariser ainsi son cœur de métier (ou plutôt son métier historique, car au vu de ses résultats financiers, son cœur de métier est plutôt la publicité en ligne, omniprésente dans la plupart des services de Google).

    edit : pour ceux qui ne se rappellent pas de qui est Amit Singhal, (re)lisez l'excellente traduction publiée sur http://www.moteurs-news.com/blog/index. ... -ca-marche et la discussion associée : https://www.webrankinfo.com/forum/t/saul-hansel-decrit-lalgorithme-de-google.74540/
     
  2. Neillys
    Neillys WRInaute occasionnel
    Inscrit:
    15 Juillet 2008
    Messages:
    374
    J'aime reçus:
    0
    Re: Voilà comment Google analyse les requêtes des internaute

    Merci, penses tu que cela un rapport avec ce qui arrive au déclassement ?
     
  3. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    20 213
    J'aime reçus:
    563
    euh non à vrai dire je ne vois pas bien de rapport
    j'ai fait cette traduc car l'article vient de sortir sur le blog de Google
     
  4. Neillys
    Neillys WRInaute occasionnel
    Inscrit:
    15 Juillet 2008
    Messages:
    374
    J'aime reçus:
    0
    En effet, j'ai posé la question avant de prendre le temps de lire... :roll:

    Bien que en effet il n'est point de rapport avec cela un point me trouble (déjà remarqué d'ailleurs) c'est les recherches appropriées au cas par cas si on est connecté.

    J'ai des exemples (pour ma profession) ou les classements des sites (1,2,3eme ) sont totalement différents, si je suis connecté ou pas, il parait d'ailleurs flagrant dans certain cas pour des requêtes que je tape deux à trois fois par jours, de voir en 1 celui ou je clique le plus, en 2 le 2eme en trois le 3eme alors que Non-connecté ils ne sont pas forcément dans la 1ere page tous ensemble.

    Si nous faisons le parallèle avec des classements de sites et les panels Test (comme La Sofres et les panels de populations pour les sondages) il ne serait pas inenvisageable de voir les classements "naturels" tendre vers ces classements.
     
  5. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 079
    J'aime reçus:
    283
    Merci pour la traduction qui va aider certaines personnes du forum.
     
  6. Michel
    Michel WRInaute passionné
    Inscrit:
    22 Décembre 2002
    Messages:
    1 357
    J'aime reçus:
    0
    Merci pour la traduction.
    J'ai tout lu/relu, c'est passionnant ce que l'on peut envisager dans le futur du moteur GG
     
  7. furimars
    furimars WRInaute discret
    Inscrit:
    12 Décembre 2005
    Messages:
    51
    J'aime reçus:
    0
    Merci pour l'info.

    C'est très intéressant.

    Je pense qu'ils renforcent régulièrement l'importance de la geolocalisation d'un site avec leur principe : "best locally relevant results served globally"

    Ca va devenir plus difficile d'apparaître correctement dans les résultats des recherches faîtes à partir d'un autre pays, même si la langue est la même.
     
  8. serval2a
    serval2a WRInaute accro
    Inscrit:
    21 Mars 2005
    Messages:
    2 578
    J'aime reçus:
    0
    Salut très intéressant surtout s'agissant de la localisation de l'internaute.
    @+
     
  9. e-kiwi
    e-kiwi WRInaute accro
    Inscrit:
    23 Décembre 2003
    Messages:
    13 257
    J'aime reçus:
    1
    dans le texte se cache une petite erreur : "sur sur". bonne lecture :)

    pour les requêtes en mode connectés, je n'ai jamais remarqué cela par contre. mais cela signifie donc qu'aucune étude de positionnement ne doit être faite en étant connecté donc
     
  10. Sébastien Billard
    Sébastien Billard WRInaute passionné
    Inscrit:
    7 Mai 2003
    Messages:
    1 700
    J'aime reçus:
    1
    C'est marrant, à la lecture de l'article, je me suis dit : le maillon faible finalement dans le recherche d'info, c'est l'utilisateur : la technologie est au point pour répondre à des requêtes bien formulées (d'ailleurs les grands principes de l'information retrieval sont connus depuis plusieurs dizaines d'années). La plus grosse difficulté semble résider dans la compréhension des requêtes.
     
  11. BadProcESs
    BadProcESs WRInaute passionné
    Inscrit:
    28 Juillet 2003
    Messages:
    1 841
    J'aime reçus:
    0
    C'est comme avec les soucis informatiques en générales : Le "problème se trouve entre la chaîse et le clavier", alias PBKAC (Problem Between Keyboard And Chair)

    :mrgreen:
     
  12. Bellegarde-webb
    Bellegarde-webb WRInaute passionné
    Inscrit:
    12 Juillet 2006
    Messages:
    1 002
    J'aime reçus:
    0
    Donc pour être encore plus clair, cela ne sert pas à grand chose de regarder sa position soi-même? Comment faire pour savoir les hauts et bas par les outils? :?:
     
  13. furimars
    furimars WRInaute discret
    Inscrit:
    12 Décembre 2005
    Messages:
    51
    J'aime reçus:
    0
    Sur les GWT, dans la rubriques statistiques, ils te donnent le positionnement moyen. C'est surtout ça qui importe sur du long terme. Comme c'est mis à jour régulièrement, ça donne une idée assez précise sur l'évolution du positionnement d'une semaine à l'autre.

    Cela serait intéressant s'ils pouvaient aussi fournir un écart type ...
     
  14. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    20 213
    J'aime reçus:
    563
    Merci pour vos retours
     
  15. cyberlahy
    cyberlahy WRInaute discret
    Inscrit:
    4 Avril 2006
    Messages:
    68
    J'aime reçus:
    0
    dommage seulement qu'on ne voit que les 20 requêtes les plus utilisées dans GWT
     
  16. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 417
    J'aime reçus:
    0
    ouai, sauf que localisation de l'internaute, c'est pas super évient avec certains FAI. Avec 9 telecom, je suis, selon les connexions, localisé à Nanterre, à Lyon ou sans localisation précise. Alors se fier à ça pour géolocaliser :roll:
     
Chargement...
Similar Threads - Voilà Google analyse Forum Date
Les robots ne respectent plus le fichier robots.txt, google, bing, voilà Problèmes de référencement spécifiques à vos sites 11 Janvier 2013
Google.fr et orange.fr/Voila.fr Référencement Google 22 Février 2012
Voila de quoi faire grincer les dents.... Droit du web (juridique, fiscalité...) 29 Avril 2016
Voilà comment réussir tous vos sudokus (triche facile !) Le café de WebRankInfo 11 Janvier 2011
Echange de lien : voilà ce qu'on m'a répondu Netlinking, backlinks, liens et redirections 10 Janvier 2011
Redirection et Voila.fr URL Rewriting et .htaccess 1 Novembre 2010
Me revoila parti dans les truc tordus ... Développement d'un site Web ou d'une appli mobile 12 Octobre 2010
Duplicate entre Wikipédia et l'encyclopédie de Voila Référencement Google 12 Juillet 2010
voila je suis novice en la matiere Demandes d'avis et de conseils sur vos sites 14 Juin 2010
voila ce que je trouve sur www.copyscape.com 6 index de mon site web. Problèmes de référencement spécifiques à vos sites 31 Mai 2010