| |
|
Voir le sujet précédent :: Voir le sujet suivant
|
| Auteur |
Message |
| |
|
hetzeld WRInaute accro

Inscrit le: 02 Déc 2002 Messages: 2205 Localisation: France - Angleterre
|
Posté le : Lun Juin 30, 2003 14:52 Sujet du message: L'algorithme du PageRank expliqué |
|
|
Bonjour à tous,
J'ai mis en ligne un article s'inspirant de l'excellent article (en anglais) de Ian Rogers expliquant l'algorithme du PageRank (en français) d'une manière compréhensible par tous, du mois je l'espère...
Cet article sera complété dans les jours qui suivent et d'autres exemples de liens inter-pages seront repris et "disséqués".
J'ai beaucoup simplifié la calculatrice de PageRank de WebWorkShop, pour en faire un outil facile à utiliser tout en découvrant les exemples.
immo.wildcroft.com/publication/article39.html
Tous vos commentaires et suggestions sont les bienvenus
Dan |
|
| |
|
 |
tada WRInaute passionné

Inscrit le: 09 Mai 2003 Messages: 667
|
Posté le : Lun Juin 30, 2003 14:59 Sujet du message: L'algorithme du PageRank expliqué |
|
|
très clair ! |
|
| |
|
 |
cariboo WRInaute passionné

Inscrit le: 08 Fév 2003 Messages: 755 Localisation: PARIS
|
Posté le : Lun Juin 30, 2003 15:20 Sujet du message: L'algorithme du PageRank expliqué |
|
|
Très chouette...
Mais ma boule de cristal personnelle ( ) m'indique que dans quelques jours, tu devras sans doute ajouter un chapitre supplémentaire à ton exposé... |
|
| |
|
 |
hetzeld WRInaute accro

Inscrit le: 02 Déc 2002 Messages: 2205 Localisation: France - Angleterre
|
Posté le : Lun Juin 30, 2003 15:23 Sujet du message: L'algorithme du PageRank expliqué |
|
|
| cariboo a écrit: |
Très chouette...
Mais ma boule de cristal personnelle ( ) m'indique que dans quelques jours, tu devras sans doute ajouter un chapitre supplémentaire à ton exposé... |
Merci !
Le chapitre en plus est en cours de rédaction...
Dan |
|
| |
|
 |
luckyluk WRInaute passionné

Inscrit le: 23 Nov 2002 Messages: 663 Localisation: frontière franco-belge..péruwelz-condé
|
Posté le : Lun Juin 30, 2003 15:27 Sujet du message: L'algorithme du PageRank expliqué |
|
|
heu...
j'ai pas de boule de cristale moi!!!
mais bon....tant pis j'attendrai la date officielle alors....
vu que vous avez pas l'air ........causant là dessus...
merci dan, je m'exercerai ....sans doute un jour....quand j'aurais du courage... |
|
| |
|
 |
Ludivine WRInaute impliqué

Inscrit le: 29 Jan 2003 Messages: 350
|
Posté le : Lun Juin 30, 2003 15:46 Sujet du message: Re: L'algorithme du PageRank expliqué |
|
|
| hetzeld a écrit: |
J'ai mis en ligne un article s'inspirant de l'excellent article (en anglais) de Ian Rogers expliquant l'algorithme du PageRank (en français) d'une manière compréhensible par tous, du mois je l'espère...
Tous vos commentaires et suggestions sont les bienvenus
Dan |
Mille mercis pour l avoir mis en FRANCAIS !!!  |
|
| |
|
 |
Katia WRInaute impliqué

Inscrit le: 04 Sep 2002 Messages: 491 Localisation: Sud de la France
|
Posté le : Lun Juin 30, 2003 16:20 Sujet du message: L'algorithme du PageRank expliqué |
|
|
Merci à Dan pour cette analyse.
C'est une piste de reflexion très intéressante.
Mais intuitivement , j'ai du mal à croire qu'un lien externe puisse faire perdre autant de
PR à un site.
Essayons de dépasser l'intuition. Faisons l'hypothèse que pour le 7ème exemple qu'il ne s'agisse pas d'une page externe qui soit liée par la page C mais d'une page interne. Cet exemple serait d'ailleurs très intéressant à présenter.
Dans le sixième exemple, la valeur totale des pages du site est de 9,66.
Dans le septième exemple, la valeur totale des pages du site serait de 7,19 (en ajoutant la nouvelle page).
Ma question est donc la suivante. L'ajout d'une page dans un site peut elle faire perdre autant de poids au PR global du site (somme des pages)?
Katia |
|
| |
|
 |
hetzeld WRInaute accro

Inscrit le: 02 Déc 2002 Messages: 2205 Localisation: France - Angleterre
|
Posté le : Lun Juin 30, 2003 16:50 Sujet du message: L'algorithme du PageRank expliqué |
|
|
| Katia a écrit: |
Essayons de dépasser l'intuition. Faisons l'hypothèse que pour le 7ème exemple qu'il ne s'agisse pas d'une page externe qui soit liée par la page C mais d'une page interne. Cet exemple serait d'ailleurs très intéressant à présenter.
|
L'exemple que tu donnes serait malheureusement sans intérêt (sans vouloir t'offenser ) car il n'y a pas de notion intérieur/extérieur dans l'algorithme.
Cela reviendrait donc exactement au même si cette page ne fait pas un lien en retour.
Cette perte, dans l'exemple 7, vient uniquement du fait que la page C (qui redistribuait tout à la page A par son lien retour) ne redistribue plus que la moitié à la page A et l'autre moitié à l'autre page.
Par contre, si cette page supplémentaire fait un lien en retour vers A, le PR de cette dernière monte à 5.07...
C'est facile à visualiser avec le calculateur.
Je rajoute cet exemple en ligne ... patiente 10 minutes.
<edit>C'est fait ! avec un commentaire pour l'exemple 7</edit>
Dan |
|
| |
|
 |
cariboo WRInaute passionné

Inscrit le: 08 Fév 2003 Messages: 755 Localisation: PARIS
|
Posté le : Lun Juin 30, 2003 17:15 Sujet du message: L'algorithme du PageRank expliqué |
|
|
| Citation: |
| vous avez pas l'air ........causant là dessus... |
Désolé pour ces mystères... Mais quelques modifications profondes du comportement de Google sont devenues clairement visibles maintenant.
Je crois que Dan, comme moi, attend un peu pour en être sûr, avant de se lancer dans des descriptions hasardeuses du phénomène.
Katia> Le calcul présenté par Dan est très, très simplifié pour des raisons didactiques. Je crois d'ailleurs que la "vraie" formule du PR utilisée par Google, est bien construite sur le schéma présenté, mais pourrait être plus complexe que ça.
Elle pourrait notamment contenir des coefficients de pondération subtils, constituant la "patte" de Google, qu'ils se garderont bien de révéler.
Le phénomène de "dilution" dont tu parles est assez spectaculaire, mais parce que les valeurs de départ de PR sont faibles. Dans la pratique, la valeur de départ du lien entrant (imaginons un PR Google de 5), ne sera pas de 1, mais de n^5 (valeur de n ?), dans ce cas la perte de PR relative est moindre...
Mais ce qui compense également dans la pratique, c'est l'existence de liens entrants, qui compense la dilution liée aux liens sortants. |
|
| |
|
 |
hetzeld WRInaute accro

Inscrit le: 02 Déc 2002 Messages: 2205 Localisation: France - Angleterre
|
Posté le : Lun Juin 30, 2003 17:24 Sujet du message: L'algorithme du PageRank expliqué |
|
|
| cariboo a écrit: |
Désolé pour ces mystères... Mais quelques modifications profondes du comportement de Google sont devenues clairement visibles maintenant.
Je crois que Dan, comme moi, attend un peu pour en être sûr, avant de se lancer dans des descriptions hasardeuses du phénomène. |
Google a déposé récemment un nouveau brevet qui permettrait un calcul du PR "on the fly".... mais c'est peut-être un peu prématuré d'aborder ce sujet.
Par contre, la formule sur laquelle j'appuie l'article est celle-là même publiée dans le document de Google décrivant l'algorithme. N'oublions pas que le PR n'est qu'une des variables intervenant dans le classement des résultats de recherche.
Je l'ai mentionné dans l'article, mais j'aurais peut-être dû l'écrire en rouge :
Les valeurs du calculateur sont des valeurs de calcul, sans aucune mise à l'échelle comme sur la toolbar. Il ne faut donc pas comparer les deux !
En reprenant le tableau d'équivalence "toolbar/réel" (pour autant qu'on soit en base 10), les exemples donnés auraient tous un PR0 ou PR1 affiché par la toolbar, pas plus !
Dan |
|
| |
|
 |
cariboo WRInaute passionné

Inscrit le: 08 Fév 2003 Messages: 755 Localisation: PARIS
|
Posté le : Lun Juin 30, 2003 17:41 Sujet du message: L'algorithme du PageRank expliqué |
|
|
Bon, Dan a vendu la mèche...
Oui, il semblerait que depuis Esmeralda, on serait passé à un update continu partiel, avec des pages deepfreshcrawlées, dotées d'un PR calculé "on the fly" et qui apparaissent directement dans les SERPs sans passer par la phase Googledance...
Le résultat, c'est que l'ordre des résultats change sans arrêt, d'un jour sur l'autre, à cause de l'effet combiné du round robin (tous les datacenters ne sont pas mis à jour simultanément), du veryfreshbot (les pages qui apparaissent avec une date de fraicheur), et du deepfreshbot (qui n'introduit que les pages des sites fréquemment crawlées).
Elément nouveau, et intéressant pour la suite : les pages introduites dans le cadre de du deepfreshbot semble bénéficier aussi d'une prime de fraicheur, moindre que pour le veryfreshbot, mais sensible...
Pour l'instant, ce processus ne concerne pas encore tous les sites... |
|
| |
|
 |
hetzeld WRInaute accro

Inscrit le: 02 Déc 2002 Messages: 2205 Localisation: France - Angleterre
|
Posté le : Lun Juin 30, 2003 18:03 Sujet du message: L'algorithme du PageRank expliqué |
|
|
| cariboo a écrit: |
| Bon, Dan a vendu la mèche... |
Si au moins cela rapportait autre chose que de la considération...
C'était bien un secret de Polichinelle, non ?
Sur une des pages de mon site ajoutée récemment (la traduction de google-watch), le PR varie constamment.
Comme le dernier article mis en ligne hier soir a été crawlé par Google ce matin, on pourra voir dans un ou deux jours s'il affiche un PR. Pour l'instant il a une barre grise.
| Citation: |
Mise en ligne vers 17H dimanche (avec un lien sur page d'accueil par feed RSS)
Crawl de la page d'accueil hier 17:58:06 et découverte du lien par crawler12
Crawl de l'article ce matin 07:27:37 par crawler10 |
Top chrono !
Dan |
|
| |
|
 |
WebRankInfo Administrateur du site

Inscrit le: 19 Avr 2002 Messages: 13854 Localisation: Toulouse
|
Posté le : Lun Juin 30, 2003 18:31 Sujet du message: L'algorithme du PageRank expliqué |
|
|
Le pb récurrent avec ce genre d'articles, c'est les gens qui le lisent trop vite et pour qui les seules valeurs de PR qui leur parlent sont celles données par la toolbar (je sais, c'est le cas de tout le monde, mais il faut savoir faire abstraction). Et donc fatalement Dan tu auras souvent des remarques à propos de tes exemples où figurent des valeurs de PR.
Je pense franchement que ces exemples sont très didactiques, mais leur interprétation est souvent difficile à cause de ce changement d'échelle nécessaire pour relativiser.
Il est encore un peu tôt pour en parler, mais disons qu'il y aura très prochainement un nouvel outil qui devrait intéresser tous ceux qui s'intéressent au PR des pages de leur site...
Mystère ! |
|
| |
|
 |
Katia WRInaute impliqué

Inscrit le: 04 Sep 2002 Messages: 491 Localisation: Sud de la France
|
Posté le : Lun Juin 30, 2003 18:44 Sujet du message: L'algorithme du PageRank expliqué |
|
|
| hetzeld a écrit: |
L'exemple que tu donnes serait malheureusement sans intérêt (sans vouloir t'offenser ) car il n'y a pas de notion intérieur/extérieur dans l'algorithme.
Dan |
Parfait, on est à peu près d'accord là dessus.
Donc, entre l'exemple 6 et l'exemple 7, il n'y a qu'une seule différence (et pas 2) : le fait d'ajouter un lien vers une nouvelle page de son propre site!
Et résultat...la somme des pageranks pour l'ensemble des pages du site diminue (en comptant la nouvelle page bien sur).
Cela signifierait que d'ajouter un nouveau lien interne à son site lui ferait perdre globalement de la valeur.
Avant d'ajouter ce lien on a:
Page A 4.98
Page B 1.56
Page C 1.56
Page D 1.56
Somme des PageRank 9.66
Après avoir ajouté ce lien on a :
Page A 3.31
Page B 1.09
Page C 1.09
Page D 1.09
Page E 0.61
Somme des PageRank 7.19
C'est bien çà que tu veux démontrer?
Katia. |
|
| |
|
 |
WebRankInfo Administrateur du site

Inscrit le: 19 Avr 2002 Messages: 13854 Localisation: Toulouse
|
Posté le : Lun Juin 30, 2003 19:13 Sujet du message: L'algorithme du PageRank expliqué |
|
|
| je viens d'essayer à l'instant d'aller revoir ces exemples 6 et 7 mais malheureusement la page de l'article de Dan ne s'affiche pas en entier... Je suis le seul ? |
|
| |
|
 |
| |
|
|
|
|
Autres sujets de discussion :
Définitions :
|
|