fichier robots.txt

  1. P

    Exception htaccess robots.txt

    Bonjour, voici mon htaccess : RewriteEngine On RewriteRule ^(.+)$ /? [R=301,L] RewriteCond %{HTTP_HOST} !www\.monsite.fr$ RewriteRule ^(.*) http://www.monsite.fr/$1 [QSA,L,R=301] RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{THE_REQUEST} ^(GET|POST|HEAD)\ (/.*)?/index.(htm|html|php|asp)...
  2. P

    Page de liens spécifiées disallow dans le robots.txt

    Bonjour Mon client a conservé à la racine de son serveur, des anciennes pages de liens, comme on en faisait à l’époque avec des dizaines de liens vers des annuaires avec leur gif animé… Il y a une douzaine de pages comme ceci mais ces pages sont spécifiées disallow dans le robots.txt...
  3. I

    Redirection 301 et robots.txt

    Bonjour, j'ai une question: voilà que un client me dit que ses url malgré qu'elles soient interdites à l'indexation par les robots.txt sont toujours prises en compte par Google. Je lui ai dit de mettre en place un "noindex" dans le code source... là il lance..."même s'il y a une redirection...
  4. S

    ?cmsPreview=1 robots.txt

    Bonjour, dans mes outils Webmasters-Tools je constate du duplicate à "Améliorations HTML" - Balises META description en double - Balises title en double la cause : /Mon-titre.URL /Mon-titre-URL?cmsPreview=1 je ne sais pas du tout par quoi est généré cette extension "?cmsPreview=1" en fin...
  5. L

    Robots.txt : bloquer un seul répertoire

    Bonjour Suite à des avis, je veux tester Wordpress... Mais je ne veux pas que mes essais soient indexés... Actuellement, j'ai ce robot.txt qui permet aux moteurs de visiter tout mon site : User-agent: * Allow: / Mon répertoire wordpress est wp Le code ci-dessous laissera-t il les...
  6. M

    [PB Indexation] Robots.txt et sitemap.xml

    Bonjour à tous, J'ai donc mis en ligne un nouveau site la semaine dernière. http://pandadub.fr/ Problème classique, lorsque j'envoie mon sitemap.xml à google, j'obtiens cette erreur : Le sitemap contient des URL qui sont bloquées par le fichier robots.txt Et ce pour l'intégralité de mes pages...
  7. S

    Bug Google robots.txt sitemaps

    Google ne traite pas bien les fichiers robots.txt qui renseignent les sitemaps. Cela fait quelques semaines ( ou mois ) que je lui ai renseigné l existence de sitemaps. Je me suis basé sur la documentation officielle: http://www.sitemaps.org/fr/protocol.html Mon fichier robots.txt...
  8. UsagiYojimbo

    Forcer mise à jour du robots.txt en cache

    Bonjour à tous, Sur un site sur lequel je travaille, l'agence qui s'occupe du développement à mis en ligne la nouvelle version jeudi. Au moment de la mise en ligne, le robots.txt était en disallow: /. Ils ont fait la modification en 1h00 mais le souci c'est que le robots a crawlé le site avant...
  9. C

    Problème avec robots.txt

    Bonjour Dans les résultats Google j'ai ce problème : J'utilise wordpress :cry:
  10. B

    Photos bloquées par le fichier robots.txt selon GWT

    Bonjour, en lançant la fonction "voir comme google" sur GWT, parmi les erreur sont indiquées toutes les photos, j'aimerai comprendre comment ça ce fait. voici ce que j'ai dans le fichier robots.txt : User-agent : * Crawl-delay: 1 User-Agent: Googlebot Disallow : /*? Disallow : /*=...
  11. P

    Robots.txt user-agent: *

    Bonjour! Je viens de voir un post et dans mon fic hier robots.txt j'avais seulement qu'une ligne... User-agent: * Je viens de la remplacer par User-agent: * Allow: / Est-ce la bonne choses à faire? ou les 2 reviens au même? MErci! Pascal
  12. L

    Robots.txt ok à 100% mais lu comme disallow dans GWT et Bing ?

    Bonjour à tous. J'ai eu le bonheur de me faire hacker il y a quelques jours, mon fichier robots avait un beau disallow all. Depuis mon fichier robots.txt est mal interprété par GWT ! Mon fichier robots que j'ai pris directement sur wp-referencement : http://www.tohom.fr/robots.txt Les...
  13. N

    Robots.txt et indexation

    Bonjour, Lors d'une chute du référencement de mon site (un ecommerce tournant sous prestashop), et en creusant avec mon webmaster (qui me supporte :D), on a remarqué que Google avait indexé la partie /en/ (traduction anglaise du site) alors que celle-ci n'est remplie : pas de contenu. On a...
  14. D

    Robots.txt pour 2 sites sur un même serveur

    bonjour, j'ai depuis peu mis en ligne un second site sur l'hébergement utilisé pour mon premier site. Sans modifier le fichier robots.txt du premier site, je me rend compte que Google indexe mon second site de la façon suivante : www.site1.com/site2 (le deuxième site est dans un dossier) au...
  15. C

    Désindexation de la pagination via le robots.txt

    Bonjour tout le monde, Depuis un petit moment, Google indexe mes différentes pages (Home, pages "catégorie", etc.). Ce qui pose quelques soucis de balises dupliquées comme la title. Toutes les URL liées à des pages "paginées" comportent une structure en commun : mondomaine.fr/page/2 ou encore...
  16. S

    GWT - erreurs d'exploration qui explosent - robots.txt

    Bonjour, Voilà j'ai un problème dont je n'arrive pas à me dépêtrer ! Nous avons lancé notre nouveau site le 15 mai, à la suite de quoi, j'ai demandé une réindexation via GWT. Et là explosion des pages introuvables (plus de 334000 à ce jour !) et ça ne cesse de monter. Pour info, cela a fait...
  17. WebRankInfo

    Crawl, indexation, robots.txt : les mystères de Google expliqués

    J'ai regroupé dans un même dossier les résultats de plusieurs tests que j'ai effectués ces dernières semaines, sur le crawl, l'indexation et les interdictions de crawl et d'indexation. Google ne réagit plus de la même façon qu'il y a plusieurs années... J'ai également testé et validé...
  18. R

    Robots.txt canonical et noindex

    Bonjour à tous, Un petit point de précision m'intéresse : Si je souhaite désindexer des pages avec des paramètre du type: http://www.example.com/page.html?order=prix pour ne garder que: http://www.example.com/page.html Sachant que les deux sont déjà en canonical ...
  19. J

    Exploration par le fichier robots.txt impossible

    Bonjour, j'avais un site sous Magento et je l'ai migrer vers Prestashop. Je suis en mode "remplissage" de la boutique de lingerie sous Prestashop 1.5. Mais j'ai un souci, malgré le fait d'avoir envoyer un sitemap via webmaster tools de Google, j'ai un triangle jaune et le message suivant...
  20. S

    Cette syntaxe de robots.txt est-elle correcte ?

    Bonjour, J'ai plusieurs erreurs qui sortent dans les GWT et qui concernent les dossier d'un forum, à savoir des url de type : forums/shared_files/uploaded/1194/ forums/shared_files/uploaded/1340/ forums/shared_files/uploaded/1029/ forums/shared_files/uploaded/992/...
Haut