fichier robots.txt

  1. Y

    Référencement aléatoire et robots.txt

    Bonjour à tous, J'ai effectué il y a quelques jours une migration de mon site en souscrivant à un hébergement chez gandi. J'ai reconstruit l'intégralité de mon site sur wordpress grâce à une url de test allouée par gandi et j'ai ensuite récupéré mon nom de domaine. Un symlink a été mis en...
  2. S

    [Robots.txt] Réindéxer un site suite à une erreur dans le fichier robots.txt

    Bonjour, J'ai récemment fait une grossière erreur en manipulant les robots.txt qui m'a coûté la désindexation totale de mon site http://www.allingaming.org -> La description de ce résultat n'est pas accessible à cause du fichier robots.txt de ce site. Mon souhait initial était que seulement...
  3. T

    Moteur qui ne tient pas compte du fichier Robots.txt

    Bonjour à tous, Ma question est dans le titre ! :) En fait j'ai cherché sur le forum et il me semble avoir trouvé de vieux post qui parlent de moteurs de recherche (par exemple Pompos) qui ne prennent pas en compte le fichier robots.txt. Mais ces moteurs n'existent plus ou sont rentrés dans le...
  4. C

    Durée de blocage d'un robots.txt

    Bonjour, suite à la mise en ligne d'un nouveau site fait un peu trop vite, le fichier robots.txt qui empêchait l'indexation du site en dévellopement à été laissé par erreur lors du transfert. Depuis le site n'est plus du tout référencé. Et cela fait déjà 3 jours que cela dure. J'ai indiqué via...
  5. C

    Balisage des informations relatives à l'auteur non validé et problème avec robots.txt

    Bonjour, Je viens vers vous aujourd'hui car je suis un peu désespérée. :cry: J'ai créé un blog via bloggeur il y a 10 jours, j'ai installé "Webmaster tools". Quand je vais dans "outil des données structurées" j'ai l'indication : "Ce balisage des informations relatives à l'auteur n'a pas été...
  6. V

    Google ne lit-il pas mon fichier robots.txt ?

    Bonjour à tous, J'ai crée un site sur Wordpress. A sa mise en ligne, je n'avais pas supprimé les pages natives de mon thème, que Google a crawlé et indexé. J'ai de suite modifié mon fichier robots.txt et demandé via GWT la suppression des pages indésirables. Dans mon interface GWT, la ligne...
  7. D

    Au secours ! Robots.txt

    Bonsoir, Voici mon robots.txt : User-agent: * Sitemap: http://www.aair-parachutisme.fr/sitemap.xml Est-il bon de proposer directement mon sitemap dans mon fichier robots comme ci-dessus aux robots ou vaut-il mieux ne rien mettre soit unique : User-agent: * Merci pour votre avis
  8. W

    Problème fichier robots.txt

    Bonjour, Mon prestataire a ajouté un fichier robots.txt à mon site et depuis je n'ai plus de visites sur mon site. Voici le contenu du fichier : - - - - - - - - Il me semble qu'il manque deux points devant le premier "user agent". Pouvez-vous m'aider car j'ai un besoin urgent de retrouver...
  9. A

    Empêcher l'indexation des fichier .pdf et du robots.txt

    bonjour à tous, à ma grande surprise google m'a indexé une url (/123.pdf) contenant un fichier pdf. quelle est la bonne méthode pour que cette url soit considérée comme noindex par les robots ? il m'a aussi indexé l'url du robots.txt (/robots.txt). là encore quelle est la bonne méthode pour que...
  10. L

    Robots.txt comment bloquer une URL précise (pas tout ce qui y ressemble)

    Bonjour, Comment bloquer un type d'url précise via le robots.txt. Par exemple : Disallow: /Forum/post bloque -http://www.site.com/Forum/poste-en-greve-t1196.html Merci
  11. M

    Disallow * sauf pour GoogleBot

    Bonjour, J'aimerai protéger des fichier avec un document.htaccess pour que les internautes n'arrivent pas a tous les télécharger. J'utilise pour le moment un Disallow * ... Mais par contre j'aimerai que Google aie accès a ces document pour référencer son contenu... Mais comment faire...
  12. Peroliv

    Noindex dans le fichier robots.txt ?

    Vu dans le fichier robots.txt d'une grosse société de formations en web : User-agent: * Allow: / Disallow: /prive/ Noindex: /prive/ J'ai raté un truc, ou ils font n'importe quoi ? :D
  13. L

    Le sitemap contient des URL bloquées par le robots.txt

    Bonjour, Il se passe une chose que j'ai du mal à saisir dans les GWT. Google trouve 1372 URL bloquées par le robots.txt que voici pour vous éviter d'aller le chercher : User-agent: Mediapartners-Google Disallow: User-agent: * Disallow: /Forum/viewtopic.php Disallow: /Forum/viewforum.php...
  14. M

    Robots.txt + sous domaine disallow

    Bonjour Par avance je m'excuse si ma question peut paraître stupide ou si elle a déjà été résolue, j'ai cherché mais je n'ai rien trouvé ! Voilà j'ai un site : www.site.com (./) Et un sous domaine truc.site.com (./Truc) Le sous domaine est à la racine du site dans /Truc Si dans le...
  15. E

    Problème Robots.txt et sitemap

    Bonjour, Je viens de mettre mon nouveau site en ligne (date de mise en ligne Lundi 7 juillet en fin de journée). Je rencontre actuellement un problème avec webmaster tool de google qui dit que Google ne parvient pas à lire mon Robots.txt, j'ai même un triangle jaune. J'ai également un problème...
  16. yule

    Extraire un fichier robots.txt et comparer le résultat

    Hello, Je cherche a extraire des informations du fichier robots.txt s'il existe.. plus précisément, j'aimerais savoir si cette ligne "Disallow: /" est présente sur robots.txt des urls qu'on me soumet.. si tel est le cas, retourne un message d'alerte indiquant par exemple " Attention la page...
  17. WebRankInfo

    Astuces et conseils sur le fichier robots.txt

    A l'occasion des 20 ans du standard, je vous propose des astuces et conseils sur le fichier robots.txt
  18. K

    Petit problème avec robots.txt et outil des webmasters

    Bonjour, J'ai un petit soucis avec mon robots.txt. Il se trouve en effet que j'ai certaines balises title manquantes, en double, etc. du fait que Prestashop (que j'utilise, donc), présente certaines limites en la matière. Par exemple, ma page "informations" n'a pas de title. J'ai donc mis...
  19. C

    Robots.txt et liens follow

    Bonjour, Je me pose actuellement une question sur le fonctionnement de google et de l'impact potentiel sur le SEO. Voilà ma question : Si j'indique dans le fichier robots.txt à google ne pas aller crawler ma page http://www.example.fr/femme/maillot-de-bain/rougeX251454548787777788.html >...
  20. J

    La solution pour désindexer le fichier robots.txt

    Bonjour à tous, J'ai eu la surprise de découvrir que mon fichier robots.txt était indexé? Surprenant? non? Est ce normal, ou il y a t il un moyen d'empecher l'indexation?
Haut