Saul Hansel décrit l'algorithme de Google

Olivier Duffez (admin)
Membre du personnel
Saul Hansel, journaliste au NYT, vient de publier un article assez complet sur l'algo de Google. Ce qui est intéressant c'est qu'il a pu être en contact direct avec Amit Singhal, un des dieux tout puissants de l'algo de Google !
Bravo à Moteurs-News pour son article en tout cas
 
WRInaute impliqué
C'est vraiment époustouflant. ça réussit encore à m'émerveiller la réussite du web et de Google en particulier. En espérant que l'on ne se contentera pas de satisfaire uniquement ses besoins de consommateur mais aussi ses besoins de culture et d'information, on peut espèrer encore un monde meilleur :?: :?: :)
 
WRInaute accro
Hé bien voilà de la matière intéressante à se mettre sous les neurones. Et bravo à Moteurs-News pour ce gros boulot (nickel) de mise à disposition. Reco, c'est clair.
 
WRInaute impliqué
Superbe ! J'avais remarqué ça :

La solution QDF tourne autour de la détermination de « l’actualité » (hot) d’un sujet.

Si des sites d’information ou des blogs sont actuellement en train d’écrire sur ce sujet, le modèle détermine qu’il fait sans doute parti de ceux pour lesquels l’utilisateur veut une information à jour, actuelle.

Le modèle étudie également le flux de Google sur les milliards de recherches effectuées, et qui, selon Mr Singhal, est même un meilleur moyen pour déterminer l’enthousiasme à propos d’un sujet particulier.
Comme exemple, il prend ce qui arrive lorsqu’une grande ville connait une coupure d’électricité. Lorsqu’une coupure survient à New York, les premiers articles apparaissent dans les 15 minutes, les premières requêtes, elles, dans les 2 secondes.

Mr Singhal dit qu’il testa QDF pour une application simple : la décision d’inclure ou non quelques titres de presse parmi les résultats lorsque les gens effectuent une requête ayant un haut score QDF.

Bien que Google possède déjà un système différent pour inclure de telles pages, QDF offrit des résultats de meilleure qualité, plaçant ces pages soit en haut des pages de résultats pour certaines requêtes soit dans le milieu ou en bas.
 
WRInaute passionné
M'enfin... c'est pas les idées citées qui sont nouvelles, c'est qu'elles soient confirmées par une source d'une telle qualité.

C'est la différence entre une hypothèse et une information fiable, sur laquelle on peut travailler.
 
WRInaute accro
A force de tester certaines requêtes, pour répondre au mieux au utilisateurs ca devient de plus en plus souvent n'importe quoi (parle utilisateur).

C'est là le problème de Google, essayer d'être parfait. Ca marche peut-être en anglais qui utilise moins de mots, mais ...


Depuis quelques mois, essayer une requête un peu spécifique, GG détécte une faute d'orthographe (alors que ce n'en n'est pas une) et tous les sites reprenant le mot souhaité par GG passent devant.
 
WRInaute accro
ybet a dit:
A force de tester certaines requêtes, pour répondre au mieux au utilisateurs ca devient de plus en plus souvent n'importe quoi (parle utilisateur).
C'est là le problème de Google, essayer d'être parfait. Ca marche peut-être en anglais qui utilise moins de mots, mais ...
Depuis quelques mois, essayer une requête un peu spécifique, GG détécte une faute d'orthographe (alors que ce n'en n'est pas une) et tous les sites reprenant le mot souhaité par GG passent devant.

L'article est excellent, enfin des nouvelles fraiches, presque des explications.
(grand merci pour la traduction qui permet de se concentrer sur les explications et non sur la syntaxe ;) )

Mon avis rejoint Ybet, à force de mettre un peu de sel, un peu de poivre, les doses sont dépassées et la recette est foirée. On a vu depuis deux ans des déclassements sauvages et non justifiés (j'ai mon exemple perso récent), des mises en valeurs de blogs, wikipédia et autres qui pertubaient les résultats par leur trop grande présence. Du neuf devant, du vieux derrière, des erreurs de frappes qui deviennent de nouveaux mots clés recherchés...
Au final, il faut bien avouer que c'est du grand n'importe quoi : d'un endroit à l'autre les résultats sont différents, d'un jour à l'autre également. En fait, pour le webmaster de base, rien ne sert de faire un site cohérent sur la durée (en année) : il n'est plus mis en valeur par son réfé.
Sur beaucoup de requêtes, il va devenir plus intéressant de faire beaucoup de petits sites quasi bidons (blogs, site persos gratos...) , et de rediriger tout ça sur un site unique cohérent :
Bonjour les spammeurs :roll:
 
WRInaute accro
touftouf a dit:
Rien de nouveau sur cette article
c'est clair! On savait depuis la nuit des temps que les résultats étaient ajustés manuellement et que ces mêmes résultats différaient selon le profil de l'internaute, que les historiques de recherches étaient exploités dans le classement dedits résultats, etc.

Bref, que du vieux, bof...
 
WRInaute passionné
Moui !

Merci à Moteurs-News pour la traduction de l'article, mais je ne suis pas totalement convaincu ! :?

Suffit de tester les mots clefs "algorithme Google" ou encore "explication algorithme Google"
pour s'apercevoir que la fraicheur de l'article réel ici présent n'est pas en si bonne position que ça ?!
La popularité, la thématique et l'ancienneté d'un site font loi la plupart du temps !

J'ai même trouvé des sites en très bonnes positions dont la page est une belle erreur 404 ! :lol:
 
WRInaute discret
mahefarivony a dit:
touftouf a dit:
Rien de nouveau sur cette article
c'est clair! On savait depuis la nuit des temps que les résultats étaient ajustés manuellement et que ces mêmes résultats différaient selon le profil de l'internaute, que les historiques de recherches étaient exploités dans le classement dedits résultats, etc.

Bref, que du vieux, bof...

Un algo est un programme, un programme est toujours fondé sur une analyse (humaine). "...ajustés manellement..." ben oui, évidemment cela ne peut pas être autrement.

"On savait depuis la nuit des temps ..."" Encore une fois, ce qui est intéressant c'est la confirmation officielle! Personnellement, j'ai bien faire la différence entre les quasi-certitudes et les positions officielles même si ces dernières servent aussi à faire de la communication.

Pour ma part, je ne ferai donc pas "mon blasé" ... un grand Merci pour cette trad.
 
WRInaute accro
la réponse "blasée" était adressée (ironiquement) à touf touf.

Bien sûr que cette description du sieur Hansel est une véritable bombe ! Et qui permet de mieux comprendre le pourquoi du comment des résultats dans certains cas.

Et quand on voit la rapidité d'indexation des nouvelles pages ( record à battre : 1 heure top chrono ) , il serait peut etre aussi intéressant de voir les interactions entre google search et google news.
 
WRInaute discret
vous allez un peu vite sur l'aspect humain (résultats ajustés manuellement) des retouches

ils ont donné en exemple french revolution, mais je vois leur modif plutot comme "augmenter l'avantage de poids des pages qui contiennent les mots recherches collés plutot que les mots dispersés"

à aucun moment (sauf leur google finance, mais bon on leur pardonne :D, ils n'a été question de "coup par coup"

si le probleme se voit sur un exemple qui leur est remonté, ils vont faire une modif globale, par exemple par exemple...
 
WRInaute discret
[The sites with the 10 highest scores win the coveted spots on the first search page, unless a final check shows that there is not enough “diversity” in the results.]
On avait déjà remarqué que certaines requêtes apparaissent en première page, simplement parce qu'elles complètent le panier du marché, et non parce qu'elles sont particulièrement riches en mot-clé demandé.
 
WRInaute passionné
mahefarivony a dit:
touftouf a dit:
Rien de nouveau sur cette article
c'est clair! On savait depuis la nuit des temps que les résultats étaient ajustés manuellement et que ces mêmes résultats différaient selon le profil de l'internaute, que les historiques de recherches étaient exploités dans le classement dedits résultats, etc.

Bref, que du vieux, bof...

je suppose que c'est ironique, en tout cas ca fait revoir totalement la façon dont on envisage le référencement...

ca me semble fou quand même... des résultats en fonction du profil de l'internaute.
 
Haut