Difficulté à empêcher les moteurs de référencer une section

Discussion dans 'Problèmes de référencement spécifiques à vos sites' créé par TigrouMeow, 14 Juin 2006.

  1. TigrouMeow
    TigrouMeow Nouveau WRInaute
    Inscrit:
    20 Octobre 2005
    Messages:
    8
    J'aime reçus:
    0
    Bonjour,

    J'essaye en vain d'empêcher Google de passer sur une certaine partie de mon site. Mon site est www.meow.fr et contient une section ou il y a des caractères chinois. En fait elle est seulement inaccessible via un clic sur le caractère chinois (à gauche en dessous du menu) ou par utilisation d'un formulaire. Il y a un grand nombre de caractères sur le site, et vu que le contenu n'a aucun intérêt et désavantage les autres pages, je veux que cette partie ne soit pas référencée.

    La manière simple d'empécher le référencement de ces pages a été de rajouter dans le header la meta qui indique le non référencement.

    Mais avec ça, je vois que GoogleBot va encore charger ces pages.

    L'autre moyen est le "robots.txt". Exclure par le répertoire, j'ai essayé mais ça me pose trop de problèmes, tous mes liens, les images, mes références deviennent fausses... Et exclure par fichier, le problème c'est que mon site entier utilise seulement un seul fichier qui est l'index.php. J'ai tenté l'url rewriting de cette manière :

    Cela aurait permit d'avoir un semblant de fichier chinese.php (qui n'existe en fait pas), et qui aurait transformer une requête "virtuelle" en une vrai. Pas de chance, l'url rewriting à priori, quand il voit un "?" considère que ce qui est derrière doit être gardé, et il ne s'occupe que ce qui est devant, en fait du nom du fichier... Je savais pas ça, et j'ai pas trouvé de technique pour contourner ce problème.

    La seule technique que j'ai trouvé, c'est de faire une copie pure et simple de mon index.php en ask.php, et de refaire les liens de ma section chinoise vers ask.php, et d'exclure ce fichier dans le robots.txt. Cela reste malpropre d'utiliser un fichier doublon, bref ça me dérange un peu :)

    Que pensez-vous de cette solution ? Est-ce la meilleure ? Voyez-vous une solution avec l'url rewriting, comme je voulais faire ? (peut-être je ne sais pas tout... et sûrement pas d'ailleurs !)

    Merci :wink:
     
  2. david96
    david96 WRInaute passionné
    Inscrit:
    28 Août 2005
    Messages:
    1 204
    J'aime reçus:
    0
  3. TigrouMeow
    TigrouMeow Nouveau WRInaute
    Inscrit:
    20 Octobre 2005
    Messages:
    8
    J'aime reçus:
    0
    Hein ? Mais c 'est pas le but, justement je me bat pour un meilleur référencement, alors si je supprime mon site... :(
     
  4. HecateOR
    HecateOR WRInaute discret
    Inscrit:
    20 Avril 2006
    Messages:
    147
    J'aime reçus:
    0
    Pas tout ton site, juste les url des pages que tu ne veux pas qu'il indexe... :roll:
     
  5. david96
    david96 WRInaute passionné
    Inscrit:
    28 Août 2005
    Messages:
    1 204
    J'aime reçus:
    0
    Bâ oui ! :lol:
     
  6. TigrouMeow
    TigrouMeow Nouveau WRInaute
    Inscrit:
    20 Octobre 2005
    Messages:
    8
    J'aime reçus:
    0
    Le problème c'est que c'est trop tard :) Google n'arrête pas depuis 2 jours d'indexer des pages qui n'ont plus lieu d'être... J'ai l'impression qu'il a une sauvegarde des liens d'avant et qu'il les parcoure tous ! Alors qu'ils ont tous changé...
     
  7. david96
    david96 WRInaute passionné
    Inscrit:
    28 Août 2005
    Messages:
    1 204
    J'aime reçus:
    0
  8. jeanluc
    jeanluc WRInaute accro
    Inscrit:
    3 Mai 2004
    Messages:
    2 875
    J'aime reçus:
    0
    Bonsoir,

    C'est normal qu'avec la meta "robots" avec "noindex, nofollow", Googlebot continue de visiter ces pages, mais elles disparaîtront de l'index. Il faut bien que Googlebot visite ces pages pour y lire la meta et ainsi savoir que la page ne doit plus apparaître dans les résultats de recherche. Je suppose qu'après quelques passages à un rythme normal, ces passages vont s'espacer, parce que je serais étonné que Googlebot consacre beaucoup de ressources à des pages qu'il ne peut pas exploiter.

    Si tes URL concernées sont de la forme /index.php?rubrik=chinese&answer=azerty&id=123, tu peux mettre la ligne suivante dans robots.txt :
    Code:
    Disallow: /index.php?rubrik=chinese
    Ceci indique aux robots de ne pas visiter de page dont l'adresse commence par /index.php?rubrik=chinese.

    Jean-Luc
     
  9. TigrouMeow
    TigrouMeow Nouveau WRInaute
    Inscrit:
    20 Octobre 2005
    Messages:
    8
    J'aime reçus:
    0
    Merci bien, à priori Google à arrêter de référencer ces pages ! Par contre, j'ai du faire une erreur et dans mon robots.txt j'ai mis :
    Ne serait-ce pas plutôt ceci :
    En fait je m'en suis aperçu aujourd'hui, et j'ai vu que Google référençait ces pages maintenants... donc j'espère que ce "/" est important.

    Sinon autre question, tous les combien Google va voir le fichiers robots.txt ?
     
  10. jeanluc
    jeanluc WRInaute accro
    Inscrit:
    3 Mai 2004
    Messages:
    2 875
    J'aime reçus:
    0
    Oui, le "/" du début est nécessaire.

    Considère que Google lit le robots.txt au moins une fois toutes les 24 heures. Puis, il lui faudra, au pire, quelques jours avant que tous les Googlebots en tiennent compte.

    Jean-Luc
     
Chargement...
Similar Threads - Difficulté empêcher moteurs Forum Date
difficultés pour migrer mon site vers un autre hébergeur Demandes d'avis et de conseils sur vos sites 10 Février 2022
Cibler prospects webmaster en difficulté Problèmes de référencement spécifiques à vos sites 2 Septembre 2019
Gmail difficulté à lire les messages sur bureau Gmail, Google Talk, Blogger et Orkut 24 Juillet 2019
URL Rewriting : difficultés avec RewriteCond ? URL Rewriting et .htaccess 5 Décembre 2018
Difficulté de référencement sur un mot clé Problèmes de référencement spécifiques à vos sites 2 Novembre 2016
Cancres.fr résau social pour ados en difficulté Demandes d'avis et de conseils sur vos sites 6 Septembre 2014
Pourquoi analytics pourrait avoir de la difficulté à détecter l'acquisition d'un site? Google Analytics 3 Juillet 2014
Difficultés d'affichage de mon site avec IE Développement d'un site Web ou d'une appli mobile 16 Mai 2014
Difficultés de référencement Débuter en référencement 29 Novembre 2013
Difficulté à être référencé sur des mots clé pourtant précis Problèmes de référencement spécifiques à vos sites 15 Février 2013
Estimer la difficulté d'être en 1er position de google ? Référencement Google 19 Décembre 2012
difficulté à se positionner dans les moteurs de recherche Problèmes de référencement spécifiques à vos sites 18 Novembre 2012
Difficulté de référencement de mon site internet Problèmes de référencement spécifiques à vos sites 23 Octobre 2012
Difficulté à référencer son blog sur google Problèmes de référencement spécifiques à vos sites 18 Octobre 2012
Plusieurs sites sous un même Hébergement, quelques difficultés. Débuter en référencement 26 Avril 2012
Difficulté de référencement google.sites Débuter en référencement 5 Février 2011
Difficultés avec Google free monitors et résulltats erronés Débuter en référencement 25 Août 2010
Serveurs 1&1 en difficulté / down Administration d'un site Web 22 Août 2010
Difficultés de référencement Problèmes de référencement spécifiques à vos sites 9 Août 2010
Estimer la difficulté d'un référencement Débuter en référencement 14 Avril 2010