Robots.txt desindexation d'url et probleme en raison de redirections 302

Discussion dans 'Débuter en référencement' créé par neutron, 25 Octobre 2009.

  1. neutron
    neutron Nouveau WRInaute
    Inscrit:
    12 Juillet 2009
    Messages:
    14
    J'aime reçus:
    0
    Bonjour,

    J'ai un annuaire et inutile de me dire de changer de système ce n'est pas possible car le système repose sur un principe spécial qui a demandé beaucoup de travaille pour le but recherché mais qui pose problème coté référencement. On renvoie du lourd en volume de trafic on ne cherche pas à donner du backlink aux sites inscrits.

    En gros tous les liens de l'annuaire vers les sites sont du type sortie.php?id=id_du_site_destination&autreparametres
    Pour corser le tout il peux même arriver que ce lien ne renvoie pas toujours sur le même site, je passe les raisons, le sujet n'est pas du domaine du référencement.

    Je pensais le problème des indexations des pages en redirection 302 terminé depuis longtemps mais force est de constater que google nous index ces urls et comme contenu il met la page du site de destination sur lequel on redirige !!!!
    Notre but n'est clairement pas de ce retrouver sur des requetes de nos sites inscrits, on veux même l'éviter à tout prix et on veux aussi éviter que ceci passe pour du duplicate contente ou du cloaking.

    Mes questions sont donc les suivantes :

    1) Est ce que ceci peux passer pour du duplicate contente (vu qu'on ce retrouve indexé avec du contenu qui est en fait des pages des sites de nos inscrits) ou du cloaking (vu qu'une même url sortante peux renvoyer parfois sur des sites différents) ?
    2) Je pensais placer dans mon fichier robots.txt une commande pour dire aux moteurs de ne pas suivre les liens du type sortie.php et donc aucun des liens qui vont vers les sites inscrits. Mais ceci pose 3 sous questions :
    a) Est ce que ceci va provoquer la suppression automatique de google des liens de ce type qu'il a déjà indexé ? ou bien il faut ensuite demander un retrait de ces pages et si c'est le cas ne risque t'on pas une pénalité à demander le retrait d'un grand nombre de pages ?
    b) Est ce que ceci ne risque pas de nous provoquer une pénalité du fait qu'on va lui demander de retirer (si le point (a) à pour réponse oui) un grand nombre de pages ?
    c) Etant un annuaire on a beaucoup de lien de ce type par page donc on va indiquer à google qu'il y a 95% des liens des pages qu'il ne doit pas indexer. Est ce que ceci risque de nous poser problème ? Ou de nous poser des pénalités ?

    Merci d'avance pour vos réponses et si vous avez besoin de précisons pour répondre n'hésitez pas car nous sommes un peu perdu sur le sujet et visiblement on a pas trouvé de cas identique donc pas de solution ni de résultat d'impact suivant les procédures mises en place.
     
  2. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 417
    J'aime reçus:
    0
    tu interdits l'indexation de sortie.php dans le robots.txt et ensuite tu demandes la suppression de ces url dans le GWT
     
  3. neutron
    neutron Nouveau WRInaute
    Inscrit:
    12 Juillet 2009
    Messages:
    14
    J'aime reçus:
    0
    Bonjour,

    Merci mais je me posais pas mal de question comme cités ci-dessus.
    Est ce que le fait de le placer dans le robots.txt va automatiquement retirer de google ceux qu'il a déjà indexé ?
    Et est ce que le fait de lui demander de retirer un grand nombre d'url ne va pas nous créer une penalité ou je ne sais quoi ?

    Merci d'avance.
     
  4. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 928
    J'aime reçus:
    78
    Bonjour,

    si tu le bloques juste via le robots.txt, ca peut être long avant que Google ne le supprime.

    Et non, l'utilisation de l'outil de suppression d'url ne déclenche pas de pénalité sur le site.
     
  5. neutron
    neutron Nouveau WRInaute
    Inscrit:
    12 Juillet 2009
    Messages:
    14
    J'aime reçus:
    0
    Et le fait d'avoir un grand nombre de lien du site qui sont interdit à l'indexation, ceci ne risque pas de perturber google ou de donner moins de poid au site ? Ou que sais-je encore ?
     
Chargement...
Similar Threads - Robots desindexation probleme Forum Date
Désindexation de la pagination via le robots.txt Crawl et indexation Google, sitemaps 23 Septembre 2013
Erreur Fichier Robots.txt > désindexation de site Problèmes de référencement spécifiques à vos sites 7 Août 2012
suppression des pages bloquées par robots.txt Débuter en référencement Lundi à 20:51
Faut-il déclarer le sitemap dans le robots.txt ou search console ? Crawl et indexation Google, sitemaps 14 Juillet 2021
Les mots-clés de mon site ne sont pas détectés par les robots de référencement Problèmes de référencement spécifiques à vos sites 7 Juillet 2021
Wordpress et le robots.txt Débuter en référencement 21 Juin 2021
Search Console noindex détecté dans la balise Meta robots Débuter en référencement 21 Mai 2021
Urls filtrées indexées et crawl robots.txt Crawl et indexation Google, sitemaps 19 Mai 2021
Robots : n'autoriser que les 4 ou 5 moteurs de recherche principaux Crawl et indexation Google, sitemaps 15 Janvier 2021
erreurs robots.txt Crawl et indexation Google, sitemaps 23 Décembre 2020