Pubsubhubbub : aide à l'indexation temps réel
Par Olivier Duffez
, Vendredi 5 mars 2010
Pubsubhubbub est un protocole open source destiné à faciliter les abonnements aux flux RSS/Atom, permettant aux abonnés d'être notifiés en quasi temps réel de l'arrivée de nouveaux éléments, tout en réduisant la charge des éditeurs hébergeant ces flux. Développé par Brad Fitzpatrick, Brett Slatkin et Mihai Parparita, 3 ingénieurs de Google, Pubsubhubbub est déployé progressivement sur un grand nombre de produits Google. WordPress le propose via un plugin, et vous, allez-vous l'adopter ? Cet article vous explique tout !
Présentation de Pubsubhubbub

Logo du protocole PubSubHubbub
Vous trouverez toutes les informations détaillées sur le site officiel code.google.com/p/pubsubhubbub/
Je cite le bon article de Didier Durand :
L'architecture de PubSubHubbub est basée sur 3 types d'acteurs :
- les éditeurs de contenu (publishers) : leurs utilisateurs publient des nouveaux éléments de contenus (articles, micro-blogs, etc...) au gré de leurs activités
- les concentrateurs (hubs) : les éditeurs signalent à ces concentrateurs les nouveaux éléments de contenus dès leur parution. L'intérêt: l'éditeur signale une seule fois et il peut atteindre en cascade via le concentrateur des milliers de services à l'écoute de son activité...
- les abonnés : ce sont tous les services Internet qui ont annoncé - par échange de messages idoines - au(x) concentrateur(s) leur intérêt pour 1 ou N (N pouvant être des millions) flux d'information issus des éditeurs. Dès qu'il est notifié par un éditeur, le concentrateur répercute instantanément (en tout cas, il essaie...) les abonnés de la présence d'un nouveau contenu sur le flux Atom ou RSS d'intérêt. Le concentrateur pousse même l'efficacité jusqu'à livrer le nouvel élément de contenu lui-même avec la notification de sa naissance.
Explications en vidéo :
Concrètement, il faut comprendre qu'un abonné peut être prévenu dans la seconde même où un contenu est publié !
Un tutoriel Pubsubhubbub est disponible ici en slides sur Google Docs.
Vous publiez du contenu ? Utilisez un hub Pubsubhubbub
Déclarer un hub dans un flux RSS ou Atom
Si vous êtes éditeur de contenus, vous avez tout intérêt à utiliser les services d'un hub qui améliorera les performances de la distribution de vos contenus par le biais des flux. Pour cela dans votre flux RSS vous devez déclarer les "coordonnées" du hub, par le biais d'une ligne <link rel="hub" href="URL du hub">. Par exemple les flux FeedBurner définissent http://pubsubhubbub.appspot.com comme hub (ce dernier n'étant pas réservé aux abonnés FeedBurner).
Quand un abonné à votre flux cherche à savoir s'il y a eu une nouvelle publication, au moment où il consulte le flux il peut se rendre compte que le flux déclare utiliser un hub. Dans ce cas, plutôt que de continuer à solliciter le flux, il va solliciter le hub, ce qui au final va s'avérer plus efficace aussi bien pour l'abonné que pour l'éditeur de contenus.
Utiliser un hub Pubsubhubbub sur un blog WordPress
Si vous avez un blog WordPress hébergé sur WordPress vous n'avez rien à faire, c'est déjà configuré. Si vous utilisez WordPress sur votre propre site, il vous suffit d'installer le plugin disponible ici. et tout est ensuite automatique. Ce plugin va déclarer le hub que vous utilisez et va envoyer des pings à certains gros hubs (tels que Demo hub (sur Google App Engine) et SuperFeedr) dès que vous mettez en ligne de nouveaux articles. Vous pouvez bien sûr en configurer d'autres en allant dans les options de l'extension WordPress (vous trouverez une liste de hubs ici). Je suppose qu'elle sera prochainement intégrée directement dans le script WordPress...
Produits utilisant Pubsubhubbub
Parmi les produits exploitant ce protocole, citons :
- Google Alerts
- Google Reader
- Blogger
- Google Buzz
- FeedBurner
- WordPress
- Typepad
- etc.
et certainement des centaines d'autres !
Votre avis
Que pensez-vous de tout ça ? J'espère que vous avez compris de quoi il s'agissait car ce n'est pas si simple que ça à présenter. J'ai passé un peu de temps à récolter des infos et à vous les présenter. Pour ma part je n'aurais pas pu trouver pire comme nom : Pubsubhubbub :-) Son petit nom officiel est Hubbub : c'est mieux non ?
On discute de Pubsubhubbub et d'indexation temps réel dans le forum WebRankInfo.
Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.
11 commentaires
Postez un commentaire !
Les champs marqués du signe * sont obligatoires. L'adresse email ne sera pas affichée.
En postant un commentaire, vous acceptez les CGU du site WebRankInfo.
Formation référencement et webmarketing
Venez chez Ranking Metrics vous former au référencement, à Google Analytics et aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (financement possible par OPCA, DIF...).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation agréé).
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo. Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
Catégories des dossiers
- Actualité
- Android
- Autres produits Google
- Brèves
- Conseils référencement
- Débuter en référencement
- Droit et Internet
- e-marketing
- Ecrire pour le web et le référencement
- Gmail
- Google AdSense
- Google AdWords
- Google Analytics
- Google Chrome
- Google Images
- Google Labs
- Google Maps
- Google Mobile
- Google News
- Google Search
- Google Toolbar
- Google Webmaster Tools
- Google+
- Indexation Google
- L'entreprise Google
- Les API de Google
- Livres sur le référencement et les moteurs de recherche
- Outils
- PageRank
- R&D référencement
- Ranking Metrics
- Référencement Bing
- Référencement des images
- Référencement et PHP
- Référencement local
- Référencement Yahoo
- Référencement Yandex
- Réseaux sociaux
- Sitemaps
- Stratégies de liens
- Stratégies de mots-clés
- Techniques de référencement
- Webmastering
- WebRankInfo
- YouTube
Dans l'annuaire
- Sellerie O'Haras - Tout pour l'équitation
- Notre-Dame, école maternelle et primaire à Faches-Thumesnil
- DOMcaraïbes - Caribbean News, Blog et Magazine
- Toute l'origine et l'actualité informatique
- Laverie automatique à Nice machines super essorantes repassage lavage
- Voyage en bus à destination de toute l'Europe
- Design et fabrication de luminaire en bois
- Agence immobilère Laforêt Immobilier à Douai



5 mars 2010 à 15:26
Intéressant en effet cette nouvelle réactivité d'indexation. Merci pour cet Article. Par contre le plugin wordpress semble souffrir d'un petit "fatal error".
5 mars 2010 à 16:33
je n'ai pas vu ce pb de fatal error, c'est sur ton blog ?
6 mars 2010 à 21:54
Oui tout à fait sur mon blog, je devait avoir la tête en l'air, il est précisé dans la doc du plugin "php ver 5", c'est maintenant corrigé je fonctionnais en 4.2. Je vais pouvoir maintenant estimer les retombées de ce nouveau protocole.
9 mars 2010 à 21:06
Cela fait un petit moment que c'est sorti sans décoller, le truc c'est que cette techno est très gourmande.
Le serveur "agrégateur" reçoit et traite des centaines de milliers de requêtes, en gros à moins d'avoir l'infrastructure de Google il faut passer par un service externe (berk).
Rien ne vaut une agrégation classique (vérification une fois toutes les x minutes) si il y a des mises à jours dans les flux où on est abonné.
10 mars 2010 à 8:28
Très gourmand pour qui ? Les hubs ?
10 mars 2010 à 16:00
Oui pour les hubs.
Exemple grossièrement raccourci : prenons un gros hub sur lequel 900 000 flux actif envoient le signal d'une mise à jour. Sur ce hub il y a 500 000 abonnés.
On va dire que ces 900 000 flux ont chacun 2 mises à jour par jour, ça fait 1 800 000 requêtes vers le Hub.
Le hub devra "livrer" aux 500 000 abonnés les mise à jour. Évidement les abonnés ne sont pas abonnés aux 900 000 flux, donc le hub fait le calcul à chaque requête de mise à jour de flux pour savoir dans les 900 000 abonnés à qui la mise à jour devra être livré et la livrer.
Compte tenu qu'il y a 1 800 000 requêtes entrante à traiter 500 000 abonnés qui ont chacun leur liste de flux, il y a bien sûr des optimisations par cache et index mais bon ça reste un traitement gourmand.
10 mars 2010 à 22:33
En effet moi aussi je me demande un peu comment les hubs vont-ils faire pour être rentables...
17 mars 2010 à 13:09
Peut être livrer de la pub au passage.
Pour une structure comme Google, le hub ne serait peut être pas rentable mais une solution en plus afin de s'approprier l'audience en attendant d'avoir un modèle économique direct ou par filiation à un autre service (Adword et/ou Adsense par exemple).
18 mars 2010 à 18:25
Intéressant topic, je vais faire un test pour voir si l’ensemble fonctionne très bien. Dans tous les cas merci pour l’article.
10 mai 2010 à 14:59
Hello,
En effet, ce n'est pas si facile :) Cela dit, Superfeedr (qui hoste les hub de Tumblr, Posterous, Gowalla et de très nombruex (plus petits autres) delivre plus de 20M d'entrée ATOM par jour :)
Si vous en voulez un, n'hésitez pas à faire signe.
25 avril 2011 à 13:20
Salut; Je me demande si tout les themes de wordpress, surtout gratuits , supportent ce plugin.
En tout je n'ai rien à perdre à l'essayer .