Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

L'algorithme Yahoo de référencement naturel

Priyank Garg, directeur de Yahoo Search, répond aux questions d'Eric Enge à propos de l'importance des liens dans l'algorithme de Yahoo Search, de la politique de Yahoo concernant l'achat et la vente de liens, de la lutte contre le spamdexing, les balises meta robots noindex et nofollow, et enfin de la classe robots-nocontent...

Voici ce que j'ai retenu de l'interview de Priyank Garg par Eric Enge (voir ici en anglais) :

  • les liens en pied de page ne sont pas pris en compte pour le positionnement, seulement pour l'indexation.
  • sur les 3 dernières années, la part relative des liens (et des anchor text) a diminué dans l'algorithme de Yahoo, en raison de l'intégration de nouveaux critères
  • quelques critères utilisés par Yahoo, parmi plusieurs centaines :
    • mise en page des contenus du site
    • distribution de la qualité du contenu
    • degré de spam du contenu du site
    • degré de spam d'une page en particulier
    • emphase des mots sur une page
    • contexte des textes de liens sur une page
  • la lutte contre le spam est effectuée à la fois par l'algorithme et par des humains
  • Yahoo n'a a priori rien contre les liens payés : leur algorithme est censé savoir détecter la valeur apportée par un lien aux internautes. Un lien vendu qui apporte une information de qualité au lecteur est pris en compte par Yahoo. Mais encore une fois, on se demande comment un moteur peut vraiment savoir si un lien a été vendu...
  • une page avec une balise meta robots noindex ne sortira pas dans les résultats de Yahoo pour aucun des mots présents dans son code source. Néanmoins, dans certains cas particuliers où une telle page reçoit de nombreux liens de très bonne qualité, Yahoo peut l'afficher dans les résultats pour des requêtes portant sur des mots situés dans les textes de ces liens. Dans ces cas, Yahoo n'affiche pas de descriptif, uniquement l'URL. Rappelons également qu'une page avec une balise meta robots noindex transmet des informations par le biais des liens situés sur cette page (elle transmet donc du jus de lien : PageRank, TrustRank et CompagnieRank :-) ).
  • sur une page avec une balise meta robots nofollow, les liens ne sont pas utilisés dans l'algorithme de positionnement, mais ils peuvent être exploités par le robot pour découvrir et indexer des nouvelles pages.
  • tout comme pour la balise meta robots noindex, une page interdite de crawl dans le fichier robots.txt (et donc a fortiori interdite d'indexation) peut sortir dans les résultats si de nombreux liens de bonne qualité pointent vers elle. Cela arrive dans ce cas pour des requêtes portant sur des mots présents dans les textes de ces liens.
  • Yahoo détecte les modèles de pages d'un site et en déduit un certain nombre d'informations. Cela aide par exemple à détecter les liens les plus utiles aux internautes. Rappelons que le webmaster peut aider Yahoo à identifier les zones importantes d'une page, tout simplement en indiquant à l'inverse quelles sont les zones à ignorer (avec la classe CSS robots-nocontent)

On discute aussi de l'algo de Yahoo Search sur le forum Yahoo.

Les 2 principaux crawlers de Yahoo Search

Yahoo Slurp

  • Nom : Yahoo! Slurp
  • Moteur : Yahoo! Search
  • Description : Crawler des pages web de Yahoo! Search
  • Nom d'agent (UserAgent) : Mozilla/5.0 (compatible; Yahoo! Slurp; https://help.yahoo.com/kb/search-for-desktop/SLN22600.html?impressions=true)

Yahoo MMCrawler

  • Nom : Yahoo-MMCrawler
  • Moteur : Yahoo! Search (???)
  • Description :  Crawler des contenus multimédias pour Yahoo! ? Même intervalle d'adresses IP que l'ancien robot FAST-WebCrawler/3.x Multimedia. Il vient visiter exclusivement le fichier robots.txt et les fichiers multimédia.
  • Nom d'agent (User Agent) : Yahoo-MMCrawler/3.x (mms dash mmcrawler dash support at yahoo dash inc dot com)

Cet article vous a-t-il plu ?

Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

2 commentaires

Nom d'un chien

Sympa, mais les principales informations nouvelles concernent robot.txt. Sur ce qu'il y a vraiment dans l'algo, on n'en sait pas vraiment plus qu'avant.

Répondre
Nicolas F.

Sympa, manque plus que le traffic pour qu'on ai envie de se positionner sur ce moteur.

Répondre