Présentation de Pubsubhubbub

Vous trouverez toutes les informations détaillées sur le site officiel code.google.com/p/pubsubhubbub/
Je cite le bon article de Didier Durand :
L'architecture de PubSubHubbub est basée sur 3 types d'acteurs :
- les éditeurs de contenu (publishers) : leurs utilisateurs publient des nouveaux éléments de contenus (articles, micro-blogs, etc...) au gré de leurs activités
- les concentrateurs (hubs) : les éditeurs signalent à ces concentrateurs les nouveaux éléments de contenus dès leur parution. L'intérêt: l'éditeur signale une seule fois et il peut atteindre en cascade via le concentrateur des milliers de services à l'écoute de son activité...
- les abonnés : ce sont tous les services Internet qui ont annoncé - par échange de messages idoines - au(x) concentrateur(s) leur intérêt pour 1 ou N (N pouvant être des millions) flux d'information issus des éditeurs. Dès qu'il est notifié par un éditeur, le concentrateur répercute instantanément (en tout cas, il essaie...) les abonnés de la présence d'un nouveau contenu sur le flux Atom ou RSS d'intérêt. Le concentrateur pousse même l'efficacité jusqu'à livrer le nouvel élément de contenu lui-même avec la notification de sa naissance.
Explications en vidéo :
Concrètement, il faut comprendre qu'un abonné peut être prévenu dans la seconde même où un contenu est publié !
Un tutoriel Pubsubhubbub est disponible ici en slides sur Google Docs.
Vous publiez du contenu ? Utilisez un hub Pubsubhubbub
Déclarer un hub dans un flux RSS ou Atom
Si vous êtes éditeur de contenus, vous avez tout intérêt à utiliser les services d'un hub qui améliorera les performances de la distribution de vos contenus par le biais des flux. Pour cela dans votre flux RSS vous devez déclarer les "coordonnées" du hub, par le biais d'une ligne <link rel="hub" href="URL du hub">
. Par exemple les flux FeedBurner définissent http://pubsubhubbub.appspot.com
comme hub (ce dernier n'étant pas réservé aux abonnés FeedBurner).
Quand un abonné à votre flux cherche à savoir s'il y a eu une nouvelle publication, au moment où il consulte le flux il peut se rendre compte que le flux déclare utiliser un hub. Dans ce cas, plutôt que de continuer à solliciter le flux, il va solliciter le hub, ce qui au final va s'avérer plus efficace aussi bien pour l'abonné que pour l'éditeur de contenus.
Utiliser un hub Pubsubhubbub sur un blog WordPress
Si vous avez un blog WordPress hébergé sur WordPress vous n'avez rien à faire, c'est déjà configuré. Si vous utilisez WordPress sur votre propre site, il vous suffit d'installer le plugin disponible ici. et tout est ensuite automatique. Ce plugin va déclarer le hub que vous utilisez et va envoyer des pings à certains gros hubs (tels que Demo hub (sur Google App Engine) et SuperFeedr) dès que vous mettez en ligne de nouveaux articles. Vous pouvez bien sûr en configurer d'autres en allant dans les options de l'extension WordPress. Je suppose qu'elle sera prochainement intégrée directement dans le script WordPress...
Produits utilisant Pubsubhubbub
Parmi les produits exploitant ce protocole, citons :
- Google Alerts
- Google Reader
- Blogger
- Google Buzz
- FeedBurner
- WordPress
- Typepad
- etc.
et certainement des centaines d'autres !
Votre avis
Que pensez-vous de tout ça ? J'espère que vous avez compris de quoi il s'agissait car ce n'est pas si simple que ça à présenter. J'ai passé un peu de temps à récolter des infos et à vous les présenter. Pour ma part je n'aurais pas pu trouver pire comme nom : Pubsubhubbub :-) Son petit nom officiel est Hubbub : c'est mieux non ?
On discute de Pubsubhubbub et d'indexation temps réel dans le forum WebRankInfo.
c'est un vieux post : est-ce toujours d'actualité ? Une bonne pratique selon vous ?
Merci de partager votre retour d'expérience
Désolé je ne l'ai pas testé depuis longtemps, mais je pense qu'il fonctionne encore
@Hafid normalement il n'y a aucun problème pour supporter le plugin (thèmes gratuits ou payants).
Salut; Je me demande si tout les themes de wordpress, surtout gratuits , supportent ce plugin.
En tout je n'ai rien à perdre à l'essayer .
Hello,
En effet, ce n'est pas si facile :) Cela dit, Superfeedr (qui hoste les hub de Tumblr, Posterous, Gowalla et de très nombruex (plus petits autres) delivre plus de 20M d'entrée ATOM par jour :)
Si vous en voulez un, n'hésitez pas à faire signe.
Intéressant topic, je vais faire un test pour voir si l’ensemble fonctionne très bien. Dans tous les cas merci pour l’article.
Peut être livrer de la pub au passage.
Pour une structure comme Google, le hub ne serait peut être pas rentable mais une solution en plus afin de s'approprier l'audience en attendant d'avoir un modèle économique direct ou par filiation à un autre service (Adword et/ou Adsense par exemple).
Oui pour les hubs.
Exemple grossièrement raccourci : prenons un gros hub sur lequel 900 000 flux actif envoient le signal d'une mise à jour. Sur ce hub il y a 500 000 abonnés.
On va dire que ces 900 000 flux ont chacun 2 mises à jour par jour, ça fait 1 800 000 requêtes vers le Hub.
Le hub devra "livrer" aux 500 000 abonnés les mise à jour. Évidement les abonnés ne sont pas abonnés aux 900 000 flux, donc le hub fait le calcul à chaque requête de mise à jour de flux pour savoir dans les 900 000 abonnés à qui la mise à jour devra être livré et la livrer.
Compte tenu qu'il y a 1 800 000 requêtes entrante à traiter 500 000 abonnés qui ont chacun leur liste de flux, il y a bien sûr des optimisations par cache et index mais bon ça reste un traitement gourmand.
En effet moi aussi je me demande un peu comment les hubs vont-ils faire pour être rentables...
Cela fait un petit moment que c'est sorti sans décoller, le truc c'est que cette techno est très gourmande.
Le serveur "agrégateur" reçoit et traite des centaines de milliers de requêtes, en gros à moins d'avoir l'infrastructure de Google il faut passer par un service externe (berk).
Rien ne vaut une agrégation classique (vérification une fois toutes les x minutes) si il y a des mises à jours dans les flux où on est abonné.
Très gourmand pour qui ? Les hubs ?
Oui tout à fait sur mon blog, je devait avoir la tête en l'air, il est précisé dans la doc du plugin "php ver 5", c'est maintenant corrigé je fonctionnais en 4.2. Je vais pouvoir maintenant estimer les retombées de ce nouveau protocole.
Intéressant en effet cette nouvelle réactivité d'indexation. Merci pour cet Article. Par contre le plugin wordpress semble souffrir d'un petit "fatal error".
je n'ai pas vu ce pb de fatal error, c'est sur ton blog ?