Yahoo L'algorithme de Yahoo Search : des infos de Priyank Garg

WRInaute accro
Intéressant. J´aime bien la capacité à ignorer les liens en pie de page. Par contre, le "degré de spam" d´une page...faudrait qu´on m´explique.... ;)
 
WRInaute passionné
Idem, je ne comprend pas ce qu'ils appellent le spam d'une page ?
Ils parlent en nombre de commentaire spammeur ?
 
Olivier Duffez (admin)
Membre du personnel
leur algo cherche sans doute à détecter si une page est créée pour spammer ou pas (ou un peu...), et le degré de spam doit être la mesure de cet indice

chez Google, les évaluateurs humains ont pour consigner de dire si oui ou non une page est spam
 
WRInaute impliqué
Pour certains sites, je place la navigation à la fin du contenu pour avoir une meilleure accessibilité, cela serait donc pénalisé par Yahoo qui ignore les liens en pied de page pour le positionnement ???
 
WRInaute accro
Ils parlent sans doute plutôt des liens externes et de la prise en compte de l´anchor text dans le calcul du positionnement de la page cible. D´ailleur c´est bien indiqué qu´ils font une différence entre le suivi d´un lien dans le cadre de l´exploration / indexation et l´utilisation de ce même lien dans le but du caclul du positionnement des pages...
 
WRInaute accro
Dans certains cas, une page en noindex ou visée par le robots.txt peut quand même ressortir dans les résultats ...
Je trouve cela inadmissible. Le webmaster indique clairement au moteur qu'il ne veut pas que la page ressorte et celui-ci ignore cette directive.
 
WRInaute occasionnel
Je me demande parfois si ca sert à de quoi de perdre du temps à vouloir tous suivre ça, sans parler que ça change. Une journée c'est bon le lendemain c pénalisable...
 
WRInaute accro
kazhar a dit:
Dans certains cas, une page en noindex ou visée par le robots.txt peut quand même ressortir dans les résultats ...
Je trouve cela inadmissible. Le webmaster indique clairement au moteur qu'il ne veut pas que la page ressorte et celui-ci ignore cette directive.
je suis tout à fait d'accord, et je suis, justement, en train de chercher une méthode pour éviter cela, du genre envoyer un code 410, voire 5xx
Parce que j'ai de nombreuses pages qui sont bloquées par un robots.txt et un noindex sur la page qui se retrouvent quand même, certe juste avec l'url, dans les SERP yahoo :twisted: :twisted:

AUtre gros problème de yahoo, il essaie de découvrir de nouvelles pages, par exemple, si dans une arborescence on affiche les photos d'un répertoires, yahoo va tenter de crawler la racine de ce répertoire, alors qu'elle ne correspond à rien, surtout en remontant 2 niveau au dessus.
Il me fait donc un beau bazar dans mes erreurs 404 :evil:
 
Discussions similaires
Haut