[Antithèse] Utilisation de plusieurs algorithmes

rituel

WRInaute impliqué
Bien que je n'ai pas le coeur à écrire sur WRI en ce moment, les inepties que j'ai pu voir à propos de la thèse des différents algorithmes m'a fait bondir au plafond et m'a motivé pour écrire le texte suivant :

Google fonctionne et a toujours fonctionné avec le principe de répartition de charges, et la seule chose qui explique les différences entre les DC c'est qu'ils font la même chose mais n'utilisent pas les même sources de données au même moment, je m'explique :

Je souhaite explorer toutes les pièces d'une immense maison et trouver celle où il y a le plus de fenêtres, Olivier se joint à moi pour m'aider dans ma tâche et on décide, afin de gagner du temps, de ne pas partir de la même pièce mais de partir chacun d'un bout à l'autre de la maison. Deux arbitres, Kendos et fredwat, ont pour mission d'écrire chacun sur un tableau l'évolution du joueur qu'ils surveillent.

Ils distribuent donc pour cela au joueur qu'ils surveillent un talkie-walkie afin que ces derniers puissent leurs communiquer en direct le résultat de leurs recherches.

Rituel et Olivier se mettent d'accord sur l'algorithme qu'ils utiliserons pour scruter les pièces :

- Ouvrir la porte
- Entrer dans la pièce
- Compter les fenêtres
- Contacter par talkie-walkie son arbitre et lui donner le N° de la pièce, le nombre de fenêtre et l'heure de la visite de celle-ci
- Passer par la porte directement à leur droite. S'il n'y a pas de porte à leur droite ou qu'elle a déjà été visitée prendre la porte à droite de cette porte.

Les arbitres se mettent également d'accord sur la manière dont ils vont formatter le tableau dont ils s'occupent :

- Une première colonne indiquera le numéro de la pièce
- Une deuxième colonne indiquera le nombre de fenêtre dans la pièce
- Une troisième colonne indiquera l'heure à laquelle a été visitée la pièce
- Les pièces seront triées par ordre décroissant de fenêtres

Un troisième joueur entre dans la partie, il s'agit d'Erazor qui a pour but de détruire ou de construire une ou plusieurs fenêtres par pièce quand il le souhaite.

Rituel et Olivier commencent donc à se ballader, pour Rituel, la première pièce possède 4 fenêtres, pour Olivier seulement 2 ... Au bout de 10 minutes les arbitres se rendent compte que Rituel et Olivier sont passés par des pièces communes mais que leur tableau est sensiblement différent car notre ami Erazor a détruit ou construit des fenêtres quand l'un des joueurs était passé alors que l'autre n'y était pas encore entré.

Maintenant on va grossièrement assigner à chacun un rôle pour que vous puissiez comprendre où je veux en venir :

La maison représente Internet
Les pièces représentent les sites
Les fenêtres sont les différents critères déterminant le classement d'un site par rapport à un autre (Les backlinks en font parti par exemple)
Rituel et Olivier sont les crawlers
Kendos et Fredwat sont les Datacenters
Erazor est le "mouvement du web" (Evolution du contenu, évolution des Backlinks ...)

Rituel et Olivier ont donc utilisé le même algorithme pour crawler les sites, Kendos et Fredwat ont eux aussi utilisés les même critères de classement et pourtant ... Leurs résultats sont désynchronisés ( Jusqu'à l'arrêt du jeu et la fusion des résultats couramment appellé Google Dance ;) ).

CQFD
 

rituel

WRInaute impliqué
Je voulais également rajouter que j'ai vraiment schématisé la chose. En réalité au lieu de parler de Rituel et Olivier j'aurais du parler d'équipe avec plusieurs joueurs à l'intérieur mais cela aurait compliqué les choses inutilement.
 

pene-r

WRInaute impliqué
Salut :wink: ,
J'ai une petite remarque complémentaire:
Kendos et fredwat, ne feraient ils pas un sous classement par nature des pièces (chambres, salles d'eau,...), correspondant aux catégories de l'annuaire google.
Je fais cette remarque car j'ai remarqué que quand beaucoup de monde s'agite (GD), les sites de mon environnement google sont plutôt stable, et quand certains constate une stabilisation, chez moi ça s'emballe. :cry:
Sinon Rituel, la démonstration est très pédagogique, tu devrais l'étendre à une démonstration globale du fonctionnement, google et référencement. :wink:

édité, comme dit au dessus, bravo :lol: :!:
 

zarlboro

WRInaute occasionnel
Bravo pour cette exposée très pédagogique.

Une petite question :

Pourquoi ne pas imaginer un autre personnage
Turulillo par exemple qui serait l'internaute.

Kendos et Fredwat sont aussi chargés de surveiller le comportement de Turulillo, voir si il est satisfait dès la première page ect... Grâce à cette surveillance Kendos et Fredwat rajoute une quatrième colonne dans leur tableau qu'on pourrait appeler "qualité du positionnement"
(Google surveille les clicks..)

Une fois cette quatrième colonne créée, Kendos et Fredwat décident de modifier la dernière étape de l'algorithme pour Rituel.

Ainsi à la fin d'une visite Olivier exécute :

- Passer par la porte directement à leur droite. S'il n'y a pas de porte à leur droite ou qu'elle a déjà été visitée prendre la porte à droite de cette porte.

Alors que Rituel exécute :

- Passer par la porte directement à leur gauche. S'il n'y a pas de porte à leur gauche ou qu'elle a déjà été visitée prendre la porte à gauche de cette porte.

Au moment de la GD, Kendos et Fredwat compare la colonne "qualité du positionnement" des tableaux obtenus par Rituel et Olivier, et peuvent ainsi reformuler de nouvelles instructions pour Olivier et Rituel.

D’ailleurs pour revenir à un autre sujet, peut-être que le tag <RK> renvoyé par une recherche XML correspond justement à cette colonne "qualité du positionnement". :?: :?:
 

rituel

WRInaute impliqué
Pour ne pas compliquer la chose "fenêtre" englobe les critères de classement des sites quels qu'il soit. Je voulais simplement expliquer le fonctionnement général de Google pour démontrer efficacement qu'il utilisait bien qu'un seul algorithme.

D'ailleurs je pense que toute personne ayant déjà développé un supercalculateur, ou n'importe quel autre système de répartition des calculs devrait aller dans mon sens.
 

Suede

WRInaute passionné
Mais cela signifie que Google ne fonctionne plus comme avant.
Ce qui se passait dans le passé au moment de la google dance était une mise à jour des différents datacenters à partir d'un même index.
Les différences constatées signifient que il fait une mise à jour décalée de chaque groupe de datacenter.
Mais vu la politique de google (Ils veulent faire ressortir le resultat qui correspond à la requete de l'internaute.), s'ils font cela, c'est qu'ils considerent qu'il y a peu de différence entre les différents datacenters.

Or on voit des différences significatives. Google s'est peut-etre rendu compte que le changement d'index entrainait des différences assez importante et pense atténuer ses différences en faisant des transitions progressives.

François
 

jeanluc

WRInaute accro
rituel a dit:
Je voulais simplement expliquer le fonctionnement général de Google pour démontrer efficacement qu'il utilisait bien qu'un seul algorithme.
Bonjour rituel,

Bravo pour ton illustration de la façon de travailler de Google. J'ai découvert il y a quelques jours Google: A Behind-the-Scenes Look, une conférence faite par Jeff Dean (Google) à l'Université de Washington en octobre 2004. On a déjà parlé sur WRI de cette excellente présentation de la façon dont Google s'y prend pour faire une recherche. Ton explication rejoint parfaitement l'explication de Jeff Dean.

A ce niveau-là, je suis d'accord avec ce que tu dis, mais je voudrais quand même mettre un bémol, car cela n'est nullement une preuve qu'il n'y a rien d'autres en cours actuellement. On est bien d'accord que l'algo de Google peut mener à des résutats différents, disons "selon les circonstances". Ce qu'on voit actuellement, me semble-t-il, c'est autre chose que des différences liées à la transition d'une version à l'autre de la data base, ou au "recovery" de quelques systèmes défectueux. On peut très bien avoir une partie des différences de résultats provenant de ton explication et une autre partie des différences provenant de différences d'algo.

Je ne pense pas qu'on puisse "prouver" l'un ou l'autre, mais on peut fournir des éléments qui soutiennent la thèse ou l'antithèse... :wink: ... sans certitude.

Jean-Luc
 

turulillo

WRInaute impliqué
Contrairement aux avis précédemment exprimés, je ne suis pas du tout enthousiaste à l’énoncé de « l’antithèse » de Rituel.
Ce qui me dérange avant tout, comme toujours chez Rituel, c’est le ton, et cela commence avec la 1ère phrase :

rituel a dit:
Bien que je n'ai pas le coeur à écrire sur WRI en ce moment, les inepties que j'ai pu voir à propos de la thèse des différents algorithmes m'a fait bondir au plafond et m'a motivé pour écrire le texte suivant :


Il semblerait que Rituel ait accès à des informations auxquelles nous autres, communs des mortels, n’avons pas accès.
De ce fait, notre ignardise, nos « inepties » l’exaspèrent.
Soit, tenons-le nous pour dit.
Cette antithèse, vous l’aurez remarqué, porte le même titre que celui utilisé, dans sa forme interrogative, par Olivier dans un récent article :
Google utilise-t-il plusieurs algorithmes à la fois ?
Il s’agit donc de la thèse, les auteurs des dîtes « inepties » se reconnaîtront.
Je ne m’attarderais pas plus sur la forme, elle ne le mérite pas plus que le fond d’ailleurs, mais il faut bien que quelqu’un se dévoue.
Je ne reviendrais pas non plus sur l’image utilisée par Rituel puisqu’elle schématise plus ou moins adroitement le fonctionnement de Google…que nous connaissons tous parfaitement du moins pour les anciens, ceux qui s’intéressent à Google, donc de ce côté, rien de nouveau.
En revanche, ce que Rituel ne semble pas comprendre, c’est que depuis quelques semaines, la routine que nous connaissons si bien a changée.
La désynchronisation des DC, qui d’habitude dure le temps d’une Google Dance, c’est à dire 2 ou 3 jours, perdure depuis Allegra.
C’est ça qui est nouveau et pas le fait qu’il y ait des DC, ça on le sait, ou qu’il y ait des crawls, ça aussi, merci on le savait, alors qu’on appelle ça des fenêtres ou les pièces d’une maison, au lieu de DC et de BL, si ça peut permettre à des nouveaux de comprendre le fonctionnement de Google, parfait, je ne m’y oppose pas, mais qu’on ne vienne pas nous regarder de haut et nous expliquer le pourquoi du comment, en montant sur de grands chevaux, en parlant d’antithèse, avec une vulgarisation destinée à des débutants.
Il y a en ce moment des membres du forum SearchEngineWatch qui débattent de ce problème et croyez moi pour les nouveaux, les autres le savent déjà, ce ne sont pas des imbéciles qui n’y connaissent rien, ils savent de quoi ils parlent, mais surtout ils donnent des exemples, des contre-exemples, en bref, ils débattent intelligemment et sans se prendre à ce point au sérieux.
Je n’ai ni l’envie, ni le courage de vous traduire ce qui se dit sur SearchEngineWatch, Olivier en a résumé une partie dans son article, je comprends que certains d’entre vous ne lisent pas l’anglais, mais par pitié, que les autres aillent sur ce thread, lisent les posts, et reviennent sur ce forum, nous dire ce qu’ils en pensent, car cette caricature de théorie exposée à la suite d’un énoncé dédaigneux, nuit à la qualité de WRI :
http://forums.searchenginewatch.com/sho ... php?t=4813
Je n’aime pas faire ce que je suis en train de faire, ce n’est pas la 1ère fois que je le fais avec Rituel, car il me semble qu’il ne faut pas le laisser propager ce genre de messages, ce sont des contre vérités, des mystifications, mais j’avoue que j’en ai marre de passer pour la Cassandre de service.
Noyer la réelle information qui consiste à dire « il se passe quelque chose d’inédit sur Google en ce moment, ce n’est peut être pas différents algos à l’oeuvre (d’ailleurs Olivier est revenu sur ce qu’il a précédemment écrit dans un autre article) mais nous avons bien affaire à un comportement nouveau de la part de Google » derrière un post qui commence par
« Bien que je n'ai pas le coeur à écrire sur WRI en ce moment, les inepties que j'ai pu voir à propos de la thèse des différents algorithmes m'a fait bondir au plafond et m'a motivé pour écrire le texte suivant » et qui enchaîne sur une vulgarisation (pas inutile d’ailleurs) de l’algo de Google, ce n’est pas rendre service aux membres de WRI.
Je vous le répète, allez lire le thread de SEW, il n’y aurait pas 4 pages de discussion avec les meilleurs référenceurs américains s’il ne se passait rien de nouveau sur Google, moi-même je n’insisterais pas autant si ce n’était pas le cas et Olivier n’aurait pas écrit 2 articles sur le sujet juste pour le plaisir…maintenant, les conclusions que nous pouvons en tirer sont peut être différentes, mais le phénomène est indéniable.
 

Bobez

WRInaute impliqué
+1 pour turulillo.
Ce message de rituel aurait du être présenté autrement que comme une "antithèse" (car ce n'en est pas une comme l'a dit jeanluc).
Je trouve qu'il aurait été parfait (en retirant le petit commentaire du début, évidemment) dans le forum "Débuter en référencement Google", pour décrire aux novices le fonctionnement général de Google.
 

lambda

WRInaute occasionnel
turulillo a dit:
... car cette caricature de théorie exposée à la suite d’un énoncé dédaigneux, nuit à la qualité de WRI ...
Regarde un peu autour de toi et tu verras qu'il y a, en matière de qualité, beaucoup plus pire sur le forum. Cites-moi, pour exemple, les derniers topics instructifs en terme de connaissance des moteurs puis fait le ratio sur le total et on en reparle.

Rituel a l'ego quelque peu surdimentionné, il est vrai :wink: . Pas quoi en faire un fromage. Moi il me fait plutôt rigoler avec ses faux départs. Quoi q'u'il en soit, je le perçois comme un des piliers qualitatif du forum (attention à ton ego, Rituel...)
 

rituel

WRInaute impliqué
Je comprends votre réaction puisque vous n'êtes pas au courant de ce qui a pu se passer ce week-end alors que j'écrivais un guide pour débutant ...

Quand vous commencez un tutoriel sur les techniques d'échange de liens à 8H00 du matin et que vous validez un premier jet vers 10 heures, puis que vous validez la version finale à 16H00 et que, mauvais concours de circonstance, un modérateur vient sauvagement éditer votre sujet avec la version de 10 heures et qu'il valide le sujet alors que vous venez de finaliser votre article ... Vous vous retrouvez avec des heures de travail perdues et ca en dégoute de réécrire quoi que ce soit d'autre après.

Tout à l'heure j'ai recu un message du créateur de Yagoort qui me demandait des conseils sur les DC en prennant pour référence l'article d'Olivier, j'ai donc consulté ce dernier et malgré la colère que j'avais, j'ai quand même écris ce message.

Pour le mot "ineptie", c'est un terme un peu dur mais il ne vise en rien le sujet original qui a le mérite d'être réflechi et d'être pour le moment qu'une théorie. A ineptie j'associerai plutôt les affirmations parfois peu prudentes (Reboot de DC ...) de certains dans le débat qui m'ont fait bondir au plafond.

Bref, je ne suis pas d'accord avec la théorie exposée par Olivier mais je la respecte, d'ailleurs rien dans mon message ne la dénigre, ce qui ne m'empêche pas de la contredire de manière positive.

Pour le reste je m'attendais plus ou moins aux remarques sachant que j'ai écris ce texte en étant énervé.
 

Megachercheur

WRInaute occasionnel
turulillo a dit:
mais j’avoue que j’en ai marre de passer pour la Cassandre de service.

Absolument d'accord avec ton post, Turulillo ! Même en mettant de côté la grossièreté du premier (il était énervé et a expliqué pourquoi), il pèche surtout par le fait qu'il rabâche des vieilleries que plus "personne" (de ceux qui s'intéressent au référencement en tout cas) n'ignore aujourd'hui.

Alors que les évolutions en cours depuis quelques mois sur Google sont passionnantes ! Je me suis moi-aussi fendu d'un article reprenant les grandes lignes de ce qui se discute sur SEW sur la désynchronisation des data centers, et les positions d'un prof de linguistique qui renvoie à leurs chères études tous les "ingénieurs informaticiens" :wink: de Google. Ca vaut vraiment le coup de suivre tout ça de près.
 

Haq

WRInaute passionné
lambda a dit:
Regarde un peu autour de toi et tu verras qu'il y a, en matière de qualité, beaucoup plus pire sur le forum. Cites-moi, pour exemple, les derniers topics instructifs en terme de connaissance des moteurs puis fait le ratio sur le total et on en reparle.

Tout à fait d'accord... j'ajoute que le nombre d'infos erronées est effrayant.
 

turulillo

WRInaute impliqué
Ton article résume très bien la situation MegaChercheur, même si je n'adhère pas, ou tout du moins si je ne peux pas confirmer tes conclusions.
Ce qui est important dans toute cette histoire, c'est déja de présenter correctement les faits...ensuite chacun est libre d'exposer sa "théorie", mais indépendamment et après avoir présenté les faits et je trouve que dans ton article, c'est plutôt réussi, même si à ta place j'aurais mis plus de conditionnel dans "L'hypothèse forte actuellement..." mais je trouve que c'est déja très bien.
J'ai rajouté ton site sur mon blog en convalescence depuis quelques mois, la Cigogne Déchaînée (dans la colonne de droite présente sur toutes les pages), mais ça te fait quand même 3 liens depuis 1 page PR5 et 2 pages PR4.
 

Megachercheur

WRInaute occasionnel
L'hypothèse d'un bug de Google (que ses ingénieurs tentent de réparer dans un sauve-qui-peut général) me semble la plus forte, comme je le dis dans l'article en signature. Mais ce n'est évidemment qu'une hypothèse... J'écarte la possibilité qu'à long terme, Google conserve plusieurs algorithmes (ça n'aurait aucun sens !)

Penser qu'il s'agit d'une manoeuvre pour déstabiliser le monde du référencement, brouiller les pistes de ceux qui font du reverse engineering sur Google, il faut vraiment être paranoïaque pour penser ça.

Ce qui m'a mis la puce à l'oreille, ça n'a rien à voir ! C'est la démonstration qui a été faite selon laquelle Yahoo! aurait plus de sites indexés que Google. Google est n°1 des moteurs pour le trafic ... car les internautes l'utilisent ! Mais si on parlait de la capacité à gérer des milliards de pages ? Là, Google s'en sort visiblement mal (voir article). Ca parait incroyable,mais c'est ainsi. Ca ne signifie pas que G soit à mettre à la poubelle...

Ce que je trouve passionnant, c'est qu'il ne s'agit plus de faire des comparaisons vaseuses entre les deux moteurs sur quelques mots-clé, et chacun de s'esbaudire que son moteur préféré (celui qui classe votre site en tête) est le meilleur alors que l'autre est pourri par le spam.

La discussion est à un autre niveau, à la croisée entre l'informatique, la linguistique et la lexicographie. Une revanche des sciences humaines sur l'informatique pure et dure.. rigolo non ?

Merci pour les liens , Turulillo :wink: (merci aussi à Olivier de WRI qui a fait un billet sur mon article dans son blog www.prweaver.fr/blog)
 

ocsima

WRInaute impliqué
turulillo a dit:
Ce qui est important dans toute cette histoire, c'est déja de présenter correctement les faits...ensuite chacun est libre d'exposer sa "théorie"
Ce qui me paraît sain comme démarche :
1) j'ai observé tels faits, si possible concrets avec la requête ou le site exemple
2) j'émets cette hypothèse qui semble correspondre à ces faits
3) quelqu'un peut-il présenter des exemples qui confirment, infirment ?

"Si ta théorie est vide, ajoutes y de la logique, elle deviendra ésotérique et paraîtra bien moins stupide"
Je ne sais pas si c'est de quelqu'un :oops: j'avais lu cela ajouté par un étudiant sur le poly d'un prof de logique
 

Megachercheur

WRInaute occasionnel
Par les requêtes sur les BL, on voir apparaître deux groupes de datacenters qui renvoient chacun des résultats similaires (il y a 78 data centers différents). Le premier groupe (ce lien porte sur un DC du premier groupe, ce n'est qu'un exemple) renvoit environ 3 milliards de résultats sur le mot anglais the. C'est un peu moins que ce que renvoit Yahoo! mais c'est un bon ordre d'idées nous lisent les spécialistes de linguistique. Le second groupe, tant qu'il existe encore, renvoit 8 milliards de résultats, une absurdité.

Je penche pour un bug, visible, qui DOIT AVOIR DES CONSEQUENCES AUTRES et sans doute graves, sinon personne n'en aurait rien à faire :wink:

La disparition progressive du second groupe par alignement sur le premier. est une question de temps. Tu as maintenant tous les éléments pour faire les tests, tu sais ce qu'il faut chercher, à toi de jouer ! Les outils ne manquent pas sur WRI.


edit:
exemple de DC qui renvoit un résultat absurde 216.239.57.107
si vous êtes mal classé sur vos mots-clé là-dessus, pas (trop) de problème. C'est sur les autres DC qu'il faut être bien (selon mon hypothèse) ! :wink:
 

Cendrillon

WRInaute accro
Megachercheur a dit:
La discussion est à un autre niveau, à la croisée entre l'informatique, la linguistique et la lexicographie. Une revanche des sciences humaines sur l'informatique pure et dure.. rigolo non ?
tu as parfaitement raison Megachercheur, et toute la problèmatique est là ... nous avons changé de niveau de complexité et les algorithmes commencent à intégrer les avancées des domaines connexes ...
la simple cuisine de BL, de mots clés, de balises, etc (qu'on les appelles comme on veut) ne suffit plus ... et ceux qui continueront à essayer de lire ce qui se passe en ce moment au travers de cette grille de lecture obsolète, continueront à nous ressortir ce genre de post dépassés ... :wink:
 

squawk

WRInaute accro
Moi ça me semble très possible (et même probable) les 2 algos, en tous cas ça explique bien les datacenters qui se synchronisent pas et après tout, quoi de plus logique que de tester de cette manière un algo... d'ailleurs ils font le même genre de test "en vrai" pour adsense (genre pour le "gooooooogle" ou les 2% d'annonces thématiques dans les adsenses "normales", je sais pas si c'est vraiment comparable mais c'est la même philosophie...bref).

Par contre j'ai pas trop suivi les différences entre les datacenters, j'ai rien remarqué de très particulier et différent au niveau positionnement sur mes sites en fonction des DC (a part les résultats de link: qui varient)... bref je me demandais si quelqu'un qui suit de près et avait fait l'inventaire des grosses différences ou des choses remarquables quelquepart, y'a peut etre déja un post ici ou sur sew dans ce cas je veux bien un lien, ça serait très utile. :wink:

Je pense que ça aiderait pas mal pour essayer de comprendre quel genre de paramètres ils ont pu modifier, voir rajouter. :)
 

lafleur2004

WRInaute passionné
Je suis toujours pas convaincu de cette histoire des deux algos, mais mettons... Qu'est-ce qui vous fait dire qu'il s'agit de deux algos ? Pourquoi pas un simple changement de pondération de un ou quelques critères ?
 

herveG

WRInaute accro
en tout cas, j´ai encore remarqué hier soir que sur 2 DC, le titre de ma page d´accueil était un titre quin´est plus actuel dpeui au moins 6 ou 8 mois..... alors je veux bien croire qu il y ait désynchronisation, je veux bien croire qu´il y ait deux algorythme, mais cela ne m explique pas pourquoi sur deux DC les versions cache de mes pages d´accueil datent d´il y a 6 ou 8 mois !! A mon avis, avant l´aspect "algorithme (chargé du classement des résultats), il semble que l´aspect "indexation" et "mise à jour des caches" ne soit pas bien clair (au moins en ce qui concerne quelques DC)......
 

turulillo

WRInaute impliqué
herveG a dit:
en tout cas, j´ai encore remarqué hier soir que sur 2 DC, le titre de ma page d´accueil était un titre quin´est plus actuel dpeui au moins 6 ou 8 mois..... alors je veux bien croire qu il y ait désynchronisation, je veux bien croire qu´il y ait deux algorythme, mais cela ne m explique pas pourquoi sur deux DC les versions cache de mes pages d´accueil datent d´il y a 6 ou 8 mois !! A mon avis, avant l´aspect "algorithme (chargé du classement des résultats), il semble que l´aspect "indexation" et "mise à jour des caches" ne soit pas bien clair (au moins en ce qui concerne quelques DC)......

Effectivement, ça aussi c'est très flagrant de ce qui se passe en ce moment,, des DC qui montre des titres qui datent de Mathusalem.
 

Cendrillon

WRInaute accro
lafleur2004 a dit:
Je suis toujours pas convaincu de cette histoire des deux algos, mais mettons... Qu'est-ce qui vous fait dire qu'il s'agit de deux algos ? Pourquoi pas un simple changement de pondération de un ou quelques critères ?
finalement cela revient au même ... dans les 2 cas il y "aurait" bien 2 types de traitements distinct suivant les DC ... :wink:
 

turulillo

WRInaute impliqué
Effectivement, je ne vois pas la différence entre "un simple changement de pondération de un ou quelques critères" et plusieurs algos, c'est pareil.
Perso, je penche pour le même algo mais avec des données différentes, et il faut aussi savoir comment se fait l'utilsation des données sur les différents DC, ce que je veux dire par la, c'est que j'ai remarqué que j'étais systématiquement renvoyé vers certains DC pour les interrogation sur le cache d'une page, je fait la requête sur un des DC ou sur Google.com et je suis renvoyé vers un autre DC.
Dans ce cas, certains DC ne seraient ils pas simplement des espaces de stockage, des copies du Web à différentes époques, mais que Google n'utilise pas pour l'interrogation par requête.
En gros, lorsque nous interrogeons Google.com ou .fr, il nous envoie sur un de ses DC, mais il existerait des DC vers lesquels il ne renverrait jamais l'internaute, sauf pour un cached:, ils restent accessibles en tapant directement leur adresse IP dans le navigateur, mais ils son inaccessibles via Google.com , .fr, .es, etc... c'est à dire pour le commun des mortels....je suis assez clair ?
 

herveG

WRInaute accro
herveG a dit:
en tout cas, j´ai encore remarqué hier soir que sur 2 DC, le titre de ma page d´accueil était un titre quin´est plus actuel dpeui au moins 6 ou 8 mois..... alors je veux bien croire qu il y ait désynchronisation, je veux bien croire qu´il y ait deux algorythme, mais cela ne m explique pas pourquoi sur deux DC les versions cache de mes pages d´accueil datent d´il y a 6 ou 8 mois !! A mon avis, avant l´aspect "algorithme (chargé du classement des résultats), il semble que l´aspect "indexation" et "mise à jour des caches" ne soit pas bien clair (au moins en ce qui concerne quelques DC)......

alors la....je suis sur le c..... !! je disais que le title sur certains DC etait vieux d´il y a 6 à 8 mois..... je vérifie alors le cache et que vois-je ? que le cache est a jour.

En d´autres termes, le title affiché dans les résultats ne correpond pas au title de la version cache.......

et vous savez d´ou il vient ce title ?????? c est le titre de mon entrée DMOZ !!!!!! c´est-y pas balaise ca ????

Est-ce que google en aurait marre des title optimisés à mort, sans queue ni tete (facon "suite de mots-clés") et aurait décidé de prendre le title de DMOZ (qui a priori est un "bon titre" puisque vériifé par un humain ??) a indiquer dans ces résultats ??

c est le scoop ??
 

squawk

WRInaute accro
Oula j'espere que rituel va pas voir ça :wink:

Tu as vu ça sur quel DC Herve que je regarde si je vois des trucs du genre ?
 

herveG

WRInaute accro
et en plus. ca sétend aux autres DC.....!! ca devient une généralité on dirait !

Va sur l outil google dance "backlinks suite". essayes "gites vienne". partout ou tu vois "Les G ITE S de LA C R O I X M E R I O T" en title, ce sont les DC ou le title est reprise de mon entrée DMOZ.

https://www.webrankinfo.com/outils/googl ... dance2.php

Il n y en avait qu un ou deux hier..... et la, c est déja 4 ou 5 je crois....
 

herveG

WRInaute accro
Alors, suis je le seul à observer ce phnénomène ? A vos claviers...on vérifie..hop hop hop....!! ;)
 

pene-r

WRInaute impliqué
c'est bizarre il n'y a pas d'accès à l'annuaire, groupes ou images, quand on fait une recherche :roll:
comme si la recherche, se faisait ailleurs, et dans ma catégorie aucun changement.
J'espère que ça va pas venir, car l'éditeur ne m'a pas gâter au niveau des mots clés dans le titre :cry:
 

herveG

WRInaute accro
meme remarque pour moi !

pour ceux qui ne sont pas dans DMOZ, il pourrait etre intéressant de savoir si ils ont noté une différence de positionnement sur entre les DC ou j´observe ce phénomène et les autres, sur des requetes présentes dans leur title.
 

squawk

WRInaute accro
Je ne vois que mon title actuel sur tout les DC et j'ai testé plusieurs mots clés, rien vu en rapport avec dmoz (pourtant je suis dedans)...
 

Megachercheur

WRInaute occasionnel
J'ai mis en place un test évolutif pour essayer d'y voir plus clair sur l'hypothèse d'un bug de Google. Il s'agit de tester l'hypothèse d'une synchronisation qui devrait intervenir dans les semaines (ou mois ?) qui viennent, qui prendrait la forme d'un alignement des datacenters du groupe B (appelés à disparaître progressivement) sur les datacenters du groupe A (qui utilisent le nouvel algorithme).

Trois articles :
La désynchronisation des data centers de Google
Mise en place d'un test sur la désynchronisation des DC
Le test sur la désynchronisation des DC, page évolutive

Le premier texte est celui dont j'ai parlé sur ce fil il y a deux jours (merci à tous ceux qui m'ont spontanément fait un lien). Les deux suivants concernent le test mis en place. Je précise que ce test n'est pour l'instant significatif de rien du tout. Il a un contenu prédictif, il faut donc que le temps passe pour savoir si ce qui est prévu arrive (ou pas).
 

Discussions similaires

Haut