Nombre de pages indexés trop élevé

Discussion dans 'Crawl et indexation Google, sitemaps' créé par pickupalliance, 24 Janvier 2015.

  1. pickupalliance
    pickupalliance Nouveau WRInaute
    Inscrit:
    17 Mai 2013
    Messages:
    29
    J'aime reçus:
    0
    Bonjour à tous.
    Je me permets de vous demander de l'aide concernant mon site. Le problème est le suivant. Lorsque je tape la commande site:www.example.com j'ai environ 540 résultats (ce qui correspond à ce qui est écrit dans WMT). Or, le nombre de page sur mon site n'est que d'environ 200. Lorsque je parcours les pages des résultats de google, au bout de la 20ème page j'ai le message :Afin d'afficher les résultats les plus pertinents, nous avons omis quelques entrées qui sont très similaires aux 198 entrées actuelles.Si vous le souhaitez, vous pouvez relancer la recherche pour inclure les résultats omis. " Je relance donc la recherche avec les résultats omis et là je me retrouve avec des url du type :
    http://www.example.com/categorie/articles/feed
    La description de ce résultat n'est pas accessible à cause du fichier robots.txt de ce site.

    Et quand je clique dessus je me retrouve sur une page de flux rss tont le title est : "commentaire sur : nom_article"

    Mais encore plus bizarre, quand je clique sur la dernière page de recherche google, il ne me met plus 540 résultat mais 216 ...

    Ma question est la suivante :
    1. est ce que ces urls en trop peuvent nuir à mon référencement malgré qu'ils soient bloqué par le fichier robot.txt ?
    2. Est-il possible de supprimer ces urls ?

    Merci de vos réponses
     
  2. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 136
    J'aime reçus:
    273
    Bonjour,

    Vous pouvez indiquer l'URL du site pour que les membres de la communauté d'entraide puissent vérifier l'indexation des pages.

    Cordialement.
     
  3. pickupalliance
    pickupalliance Nouveau WRInaute
    Inscrit:
    17 Mai 2013
    Messages:
    29
    J'aime reçus:
    0
  4. dedmustaoe
    dedmustaoe Nouveau WRInaute
    Inscrit:
    30 Janvier 2015
    Messages:
    4
    J'aime reçus:
    0
    Le "Too many connections" vient du fait que le site que tu as conçu ouvre trop de connexion à la base MySQL en même temps (beaucoup de visites en même temps et/ou scripts nécessitant de l'optimisation). Le nombre max de connexions simultanées est de 30 sur les mutus pro.
     
  5. pickupalliance
    pickupalliance Nouveau WRInaute
    Inscrit:
    17 Mai 2013
    Messages:
    29
    J'aime reçus:
    0
    Merci de votre retour. Où voyez-vous ce "Too many connections" ? Est-ce que ça a un rapport avec le nombre trop important de pages indexées ?
     
  6. loubet
    loubet WRInaute impliqué
    Inscrit:
    19 Février 2003
    Messages:
    793
    J'aime reçus:
    0
    pas de rapport pour cette remarque sans fondement.
     
  7. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 136
    J'aime reçus:
    273
    Bonjour,

    Vous laissez des pages inutiles s'indexer, c'est pour ça.

    N'hésitez pas à vous présenter au forum : ici et entre deux messages présenter vos avis aussi sur les sujets : ici.

    Cordialement.
     
  8. pickupalliance
    pickupalliance Nouveau WRInaute
    Inscrit:
    17 Mai 2013
    Messages:
    29
    J'aime reçus:
    0
    Bonjour, en effet il y a des pages inutiles qui s'indexent mais je ne vois pas pourquoi. J'ai pourtant pris soin de bien configurer le htacess et le fichier robots mais rien n'y fait.
    PS : je me suis déjà présenté :)
     
  9. Baguettefrancaise
    Baguettefrancaise WRInaute discret
    Inscrit:
    3 Décembre 2014
    Messages:
    204
    J'aime reçus:
    0
    lol on m'a aussi conseillé site:www.example.com en 2015
     
  10. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 136
    J'aime reçus:
    273
    Bonjour,
    Vous pouvez vérifier le travail réalisé.
    Ok, pas remarqué avec l'historique des messages.
    :)

    Cordialement.
     
  11. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 138
    J'aime reçus:
    350
  12. pickupalliance
    pickupalliance Nouveau WRInaute
    Inscrit:
    17 Mai 2013
    Messages:
    29
    J'aime reçus:
    0
    Merci, donc si j'ai bien compris j'ajoute Noindex: /feed dans le fichier robot.txt
    et je dois supprimer manuellement et un par un toutes les urls des flux rss des commentaires ?
    ou est-ce que la directive Noindex: /feed empêche également l'indexation et le crawl des flux de commentaires ?
    merci :)
     
  13. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 138
    J'aime reçus:
    350
    La directive Noindex: /feed correspond à un répertoire /feed à la racine, ce n'est pas ton cas
    essaie Noindex: /*/feed
    mais teste dans l'outil de test du robots.txt dans la Search Console (ex GWT)
     
  14. pickupalliance
    pickupalliance Nouveau WRInaute
    Inscrit:
    17 Mai 2013
    Messages:
    29
    J'aime reçus:
    0
    Avec l'outil de test lorsque je met : "Noindex: /*/feed" ça me met " autorisé ", quand je met Noindex: /feed ça me met " bloqué " même chose avec disalow. Je crois qu'il ne comprend pas les /* ...

    Du coup je laisse bien Noindex: /*/feed ?
    Dois-je également metre disallow: /*/feed ?

    est-ce que cela va me bloqué également les fux rss des commentaires ?

    Mon ficher robot pour le moment :

    Noindex: /feed
    Noindex: /*/feed
    Disallow: /feed
    Disallow: /comments/feed
    Disallow: /feed/
    Disallow: /*/feed/$
    Disallow: /*/feed/rss/$
    Disallow: /*/*/feed/$
    Disallow: /*/*/feed/rss/$
    Disallow: /*/*/*/feed/$
    Disallow: /*/*/*/feed/rss/$
    Disallow: /comments
    Disallow: /*/comments

    Pensez-vous qu'il y a des lignes à supprimer, d'autres à ajouter ou à modifier ?
    Merci :)
     
  15. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 138
    J'aime reçus:
    350
    en effet, le * ne semble pas bien être pris en compte (il faut dire qu'il ne fait pas partie officiellement du standard robots.txt)
    il faudrait certainement simplifier ton fichier robots.txt, faut faire des tests !
     
  16. pickupalliance
    pickupalliance Nouveau WRInaute
    Inscrit:
    17 Mai 2013
    Messages:
    29
    J'aime reçus:
    0
    Ok :) Mais de toute façon c'est pas préjudiciable de mettre trop de lignes que pas assez, si ?
    Je ne m'y connais pas trop en écriture de fichier robots. Tous se contredisent sur le net alors c'est un peu compliqué de discerner le vrai du faux.
     
  17. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 138
    J'aime reçus:
    350
    si jamais ça bloque des pages qui ne devraient pas l'être, c'est préjudiciable ! sinon pas de pb à part rendre compliqué quelque chose qui devrait rester simpler
     
Chargement...
Similar Threads - Nombre indexés élevé Forum Date
Désindexation régulière et baisse du nombre de pages indéxés dans google Problèmes de référencement spécifiques à vos sites 13 Octobre 2015
Nombre de topics indexés sur mon forum Crawl et indexation Google, sitemaps 10 Août 2010
Nouveau nom de domaine, mais nombreux liens indexés sur l'ancien. Netlinking, backlinks, liens et redirections 29 Août 2009
Désindexation régulière - Baisse du nombre de pages indéxés Problèmes de référencement spécifiques à vos sites 15 Mai 2009
Format milliers nombre en javascript Développement d'un site Web ou d'une appli mobile 5 Décembre 2019
Le nombre d'annonces que vous êtes autorisé à diffuser a été limité AdSense 29 Novembre 2019
Nombre de publication d'articles par jour Rédaction web et référencement 23 Novembre 2019
Un site en première position sur de nombreux mots-clés depuis 1 an et demi Crawl et indexation Google, sitemaps 22 Septembre 2019
Rich Snippet Breadcrumbs et nombre de produits Techniques avancées de référencement 16 Septembre 2019
trop nombreux liens internes en bas de page Débuter en référencement 26 Août 2019
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice