Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Pubsubhubbub : aide à l'indexation temps réel

Pubsubhubbub est un protocole  open source destiné à faciliter les abonnements aux flux RSS/Atom, permettant aux abonnés d'être notifiés en quasi temps réel de l'arrivée de nouveaux éléments, tout en réduisant la charge des éditeurs hébergeant ces flux. Développé par Brad Fitzpatrick, Brett Slatkin et Mihai Parparita, 3 ingénieurs de Google, Pubsubhubbub est déployé progressivement sur un grand nombre de produits Google. Wordpress le propose via un plugin, et vous, allez-vous l'adopter ? Cet article vous explique tout !

Présentation de Pubsubhubbub

Logo PubSubHubbub
Logo du protocole PubSubHubbub

Vous trouverez toutes les informations détaillées sur le site officiel code.google.com/p/pubsubhubbub/

Je cite le bon article de Didier Durand :

L'architecture de PubSubHubbub est basée sur 3 types d'acteurs :

  • les éditeurs de contenu (publishers) : leurs utilisateurs publient des nouveaux éléments de contenus (articles, micro-blogs, etc...) au gré de leurs activités
  • les concentrateurs (hubs) : les éditeurs signalent à ces concentrateurs les nouveaux éléments de contenus dès leur parution. L'intérêt: l'éditeur signale une seule fois et il peut atteindre en cascade via le concentrateur des milliers de services à l'écoute de son activité...
  • les abonnés : ce sont tous les services Internet qui ont annoncé - par échange de messages idoines - au(x) concentrateur(s) leur intérêt pour 1 ou N (N pouvant être des millions) flux d'information issus des éditeurs. Dès qu'il est notifié par un éditeur, le concentrateur répercute instantanément (en tout cas, il essaie...) les abonnés de la présence d'un nouveau contenu sur le flux Atom ou RSS d'intérêt. Le concentrateur pousse même l'efficacité jusqu'à livrer le nouvel élément de contenu lui-même avec la notification de sa naissance.

Explications en vidéo :

Concrètement, il faut comprendre qu'un abonné peut être prévenu dans la seconde même où un contenu est publié !

Un tutoriel Pubsubhubbub est disponible ici en slides sur Google Docs.

Vous publiez du contenu ? Utilisez un hub Pubsubhubbub

Déclarer un hub dans un flux RSS ou Atom

Si vous êtes éditeur de contenus, vous avez tout intérêt à utiliser les services d'un hub qui améliorera les performances de la distribution de vos contenus par le biais des flux. Pour cela dans votre flux RSS vous devez déclarer les "coordonnées" du hub, par le biais d'une ligne <link rel="hub" href="URL du hub">. Par exemple les flux FeedBurner définissent http://pubsubhubbub.appspot.com comme hub (ce dernier n'étant pas réservé aux abonnés FeedBurner).

Quand un abonné à votre flux cherche à savoir s'il y a eu une nouvelle publication, au moment où il consulte le flux il peut se rendre compte que le flux déclare utiliser un hub. Dans ce cas, plutôt que de continuer à solliciter le flux, il va solliciter le hub, ce qui au final va s'avérer plus efficace aussi bien pour l'abonné que pour l'éditeur de contenus.

Utiliser un hub Pubsubhubbub sur un blog WordPress

Si vous avez un blog WordPress hébergé sur WordPress vous n'avez rien à faire, c'est déjà configuré. Si vous utilisez WordPress sur votre propre site, il vous suffit d'installer le plugin disponible ici. et tout est ensuite automatique. Ce plugin va déclarer le hub que vous utilisez et va envoyer des pings à certains gros hubs (tels que Demo hub (sur Google App Engine) et SuperFeedr) dès que vous mettez en ligne de nouveaux articles. Vous pouvez bien sûr en configurer d'autres en allant dans les options de l'extension WordPress. Je suppose qu'elle sera prochainement intégrée directement dans le script WordPress...

Produits utilisant Pubsubhubbub

Parmi les produits exploitant ce protocole, citons :

  • Google Alerts
  • Google Reader
  • Blogger
  • Google Buzz
  • FeedBurner
  • WordPress
  • Typepad
  • etc.

et certainement des centaines d'autres !

Votre avis

Que pensez-vous de tout ça ? J'espère que vous avez compris de quoi il s'agissait car ce n'est pas si simple que ça à présenter. J'ai passé un peu de temps à récolter des infos et à vous les présenter. Pour ma part je n'aurais pas pu trouver pire comme nom : Pubsubhubbub :-) Son petit nom officiel est Hubbub : c'est mieux non ?

On discute de Pubsubhubbub et d'indexation temps réel dans le forum WebRankInfo.

Cet article vous a-t-il plu ?

Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

14 commentaires

Ant2103

c'est un vieux post : est-ce toujours d'actualité ? Une bonne pratique selon vous ?
Merci de partager votre retour d'expérience

Répondre
Olivier Duffez

Désolé je ne l'ai pas testé depuis longtemps, mais je pense qu'il fonctionne encore

Répondre
Manu

@Hafid normalement il n'y a aucun problème pour supporter le plugin (thèmes gratuits ou payants).

Répondre
hafid

Salut; Je me demande si tout les themes de wordpress, surtout gratuits , supportent ce plugin.
En tout je n'ai rien à perdre à l'essayer .

Répondre
Julien

Hello,

En effet, ce n'est pas si facile :) Cela dit, Superfeedr (qui hoste les hub de Tumblr, Posterous, Gowalla et de très nombruex (plus petits autres) delivre plus de 20M d'entrée ATOM par jour :)

Si vous en voulez un, n'hésitez pas à faire signe.

Répondre
Referencement

Intéressant topic, je vais faire un test pour voir si l’ensemble fonctionne très bien. Dans tous les cas merci pour l’article.

Répondre
Nico

Peut être livrer de la pub au passage.
Pour une structure comme Google, le hub ne serait peut être pas rentable mais une solution en plus afin de s'approprier l'audience en attendant d'avoir un modèle économique direct ou par filiation à un autre service (Adword et/ou Adsense par exemple).

Répondre
Nico

Oui pour les hubs.

Exemple grossièrement raccourci : prenons un gros hub sur lequel 900 000 flux actif envoient le signal d'une mise à jour. Sur ce hub il y a 500 000 abonnés.

On va dire que ces 900 000 flux ont chacun 2 mises à jour par jour, ça fait 1 800 000 requêtes vers le Hub.
Le hub devra "livrer" aux 500 000 abonnés les mise à jour. Évidement les abonnés ne sont pas abonnés aux 900 000 flux, donc le hub fait le calcul à chaque requête de mise à jour de flux pour savoir dans les 900 000 abonnés à qui la mise à jour devra être livré et la livrer.

Compte tenu qu'il y a 1 800 000 requêtes entrante à traiter 500 000 abonnés qui ont chacun leur liste de flux, il y a bien sûr des optimisations par cache et index mais bon ça reste un traitement gourmand.

Répondre
Olivier Duffez

En effet moi aussi je me demande un peu comment les hubs vont-ils faire pour être rentables...

Répondre
Nico

Cela fait un petit moment que c'est sorti sans décoller, le truc c'est que cette techno est très gourmande.
Le serveur "agrégateur" reçoit et traite des centaines de milliers de requêtes, en gros à moins d'avoir l'infrastructure de Google il faut passer par un service externe (berk).

Rien ne vaut une agrégation classique (vérification une fois toutes les x minutes) si il y a des mises à jours dans les flux où on est abonné.

Répondre
Olivier Duffez

Très gourmand pour qui ? Les hubs ?

Répondre
Altenide

Oui tout à fait sur mon blog, je devait avoir la tête en l'air, il est précisé dans la doc du plugin "php ver 5", c'est maintenant corrigé je fonctionnais en 4.2. Je vais pouvoir maintenant estimer les retombées de ce nouveau protocole.

Répondre
Altenide

Intéressant en effet cette nouvelle réactivité d'indexation. Merci pour cet Article. Par contre le plugin wordpress semble souffrir d'un petit "fatal error".

Répondre
Olivier Duffez

je n'ai pas vu ce pb de fatal error, c'est sur ton blog ?

Répondre