Google ne respecte pas noindex et les consignes du robot.txt

Discussion dans 'Référencement Google' créé par Jaki, 8 Septembre 2005.

Tags:
  1. Jaki
    Jaki Nouveau WRInaute
    Inscrit:
    25 Janvier 2005
    Messages:
    8
    J'aime reçus:
    0
    C'est vraiment pénible ça ! je vient de publier 4 sites sur des thématiques différentes (donc des nouveaux sites) et je constate que des url appartenant à des dossiers précisés dans le robot.txt ou comportant des balises noindex, nofolow, noarchive sont systématiquement indexé...
    J'ai constaté cela à de nombreuse reprises (je veux dire sur de nombreux sites)

    Par exemple :

    User-agent: *
    Disallow: /noindex/


    https://www.google.fr/search?sourceid=na ... hats%2Enet

    C'est casse pied : ça fait plein de pages duplicate !

    QQ a t il une solution ?
    1 - pour supprimer les pages indexées
    2 - éviter que cela se reproduise

    Merci de toute aide sur le sujet
     
  2. echanges-liens
    echanges-liens WRInaute discret
    Inscrit:
    26 Août 2005
    Messages:
    249
    J'aime reçus:
    0
    Je confirme et je suis très intéressé aussi par une solution (nous avons tout tenté y compris : <META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW"> et cela, sans résultat...)
     
  3. csangouard
    csangouard WRInaute discret
    Inscrit:
    14 Novembre 2002
    Messages:
    79
    J'aime reçus:
    0
    Et si simplement, ce que l'on prend tous comme une manifestation du duplicate serait un signal de la part de google qui affirme "hé, je connais cette url, mais je ne touche plus à cette page et ne met pas de description" pour telle ou telle raison: interdiction d'indexation, page dupliquée, page redirigée, etc.

    Dans ce cas, on distinguerait indexation d'url et indexation de page. Ce qui voudrait dire que Google joue sur les mots avec sa facheuse habitude de tout indexer.
     
  4. easy_zik
    easy_zik WRInaute occasionnel
    Inscrit:
    7 Juillet 2003
    Messages:
    375
    J'aime reçus:
    0
    effectivement aucune de Tes pages "noindex/" n'ont leur contenu d'indexé...

    peut-être que Google fait qd même des requètes HEAD sur ces pages, mais pas de requètes GET...
     
  5. HawkEye
    HawkEye WRInaute accro
    Inscrit:
    23 Février 2004
    Messages:
    13 858
    J'aime reçus:
    5
    Re: google ne respecte pas noindex et les consignes du robot

    ...avec un "s" à robotS.txt ça marche mieux...

    perso, j'ai aucune page sous robots.txt >> disallow qui n'est indexée.

    aucune exp. en matière de noindex,nofollow (je préfère fourrer la bête...)
     
  6. shrom
    shrom WRInaute impliqué
    Inscrit:
    5 Juillet 2004
    Messages:
    781
    J'aime reçus:
    0
    Une explication ici
     
  7. echanges-liens
    echanges-liens WRInaute discret
    Inscrit:
    26 Août 2005
    Messages:
    249
    J'aime reçus:
    0
    Bravo, exact. Merci pour l'information.
     
  8. Foxus
    Foxus WRInaute passionné
    Inscrit:
    9 Janvier 2005
    Messages:
    1 276
    J'aime reçus:
    0
    quans vous faite une recherche francophone, voyez vous encore les page qu'il faut pas ou non ?
     
Chargement...
Similar Threads - Google respecte noindex Forum Date
Logo Google+ : attention de respecter le design! Google+ 6 Octobre 2014
Votre site ne respecte pas les consignes Google relatives à la qualité Problèmes de référencement spécifiques à vos sites 1 Avril 2014
Les robots ne respectent plus le fichier robots.txt, google, bing, voilà Problèmes de référencement spécifiques à vos sites 11 Janvier 2013
Duplicate dû à antériorité non respectée par Google Référencement Google 19 Novembre 2012
Les liens nofollow internes sont respectés par Google Netlinking, backlinks, liens et redirections 30 Septembre 2008
Google Image ne respecte pas mon robots.txt Problèmes de référencement spécifiques à vos sites 11 Juillet 2006
Google ne respecte pas mon robots.txt! Débuter en référencement 19 Décembre 2005
Google respecte les copyrights! Crawl et indexation Google, sitemaps 25 Mars 2005
Google ne respecte pas les robots.txt ? Problèmes de référencement spécifiques à vos sites 8 Septembre 2003
Comment faire respecter mon nom de domaine chez google? Référencement Google 31 Juillet 2002
Aucunes données sur Google Analytics - prestashop Google Analytics Jeudi à 11:40
Cette URL n'a pas été indexée par Google Débuter en référencement Mercredi à 23:07
Mon site n’est pas indexé sur Google Débuter en référencement 10 Mai 2022
Connexion au compte Google Search Console d'un client Google : l'entreprise, les sites web, les services 28 Avril 2022
Problème d'affichage des campagnes Google Ads dans un tableau de bord Data Studio AdWords 26 Avril 2022
Problème : Google Crawl et Index des pages en No Index et bloqué par le robot.txt Crawl et indexation Google, sitemaps 26 Avril 2022
Quels changements pour le local avec Google Business Profile Google : l'entreprise, les sites web, les services 14 Avril 2022
Deux propriétés dans Google Analytics Google Analytics 13 Avril 2022
Google Keyword Planner: que signifie volume de recherche '0'? AdWords 31 Mars 2022
Données Google analytics vs Cloudflare Google Analytics 29 Mars 2022