pages indéxées - Grand n'importe quoi

WRInaute occasionnel
On en avait deja parlé - mais ca s'accelere
Google m'a doublé mon nombre de pages indéxées (de 254 à 574)
Y compris des pages avec la balise noindex, follow

Y a t'il une maniere de demander au bot de ne pas suivre certains liens?
 
WRInaute accro
enfin, avec un meta noindex ca devrait fonctionner theoriquement.
apres, un nofollow, ca empeche qu'il prenne le lien en compte dans les backlinks, mais pas qu'il ne va pas visiter la page vers laquelle il redirige.

tu a un exemple de page qui a un noindex, et qui est indéxée ?
 
WRInaute accro
tiens et "noarchive" ça marche ?

Je veux dire, si tu as un "noindex", mais que la page est en cache, peut-être que le "noindex" n'active pas une sortie de cache, et que "noarchive" le ferait...

Je sais pas hein, je propose.
 
WRInaute occasionnel
Oui mais celle là doit etre indexée. C'est la forme photo-id
Tandis que les url style photo-prev-id et photo-next-id ne doivent pas etre indéxée car elles sont en duplicate.
 
WRInaute accro
ok excuse moi, mal lu ton post.

Contournons le problème, pourquoi passes-tu par photo-prev-720 ?

Si tu connais l'id, tu fais prev = id-1 et next = id+1

et tu construits tes liens sous la forme

photo-<? echo $prev ?> et photo-<? echo $next ?>

pas plus simple ?
 
WRInaute occasionnel
heu oui
sauf que id prev n'est pas forcement egal à id-1
Je pourrais faire quelque chose comme ca,
mais ca me couterais deux requetes supplementaires... et mes pages sont deja saturées en requetes. Mes pages photos sont celles les plus téléchargées elles doivent consommer le moins de ressources possibles.
 
WRInaute accro
je comprends, c'est ce que je me suis dit par la suite ;)

quoi qu'il en soit, tu dois pouvoir savoir facilement quelle est l'id de prev et quelle est l'id de next, et construire tes liens previous et next assez facilement et sans bouffer trop à mon avis ;)

d'autant que ça règlera ton risque de duplicate, et que ça augmentera la "crawlabilité" de ton site ;)
 
WRInaute occasionnel
Il te suffit lors de la requête qui affiche ta photo, de demander la précédente et la suivante en même temps.

Avec une seule requête tu auras les 3 id : precedente, actuelle, suivante.

Sauf si tu as des tables avec beaucoup de champs, et où c'est très couteux d'apeller les 3 id au lieu d'un, c'est le plus économique, rapide et pratique...

Et tu pourrais donc appliquer photo-id au lieu de photo-prev-id
 
A
Anonymous
Guest
Je confirme !

J'ai aussi constaté ce phénomène sur TOUS les sites que j'ai publié dernièrement : les balises noindex,nofolow,nocache ne sont pas respectées ainsi que les directives dans le fichier robots.txt
Pour certains sites le nombre de pages est passés de 15 000 à +100 000 pages!!!
Quand à les supprimer par le biais de la console google... bon courage ! pour le moment on peut pas dire que cela soit efficace en ce qui me concerne.
Il en resulte une foultitude de pages similaires et souvent une pénalisation dans la qualité du référencement.
Je n'ai pas constaté ce problème chez yahoo ou msn...

Comme solution je n'ai rien trouvé d'autre que de réécrire le code des url concernées à l'aide d'un code javascript encore ignoré par google à ce jour.
 
WRInaute occasionnel
merci pour le coup de pouce

Vell la gestion du precedent et suivant est loin d'etre aussi simple car on ne les connait pas, ou alors faudrait les calculer lors de chaque changement (ajout et suppression d'une photo)

Ceimedia si ce que tu dis est vrai ce sujet concerne tout le monde pas juste nos sites.
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut