Robots.txt pour phpbb : Disallow de certaines urls

Discussion dans 'Problèmes de référencement spécifiques à vos sites' créé par sdamain, 30 Août 2004.

  1. sdamain
    sdamain WRInaute passionné
    Inscrit:
    14 Octobre 2003
    Messages:
    1 055
    J'aime reçus:
    0
  2. ybet
    ybet WRInaute accro
    Inscrit:
    22 Novembre 2003
    Messages:
    7 419
    J'aime reçus:
    1
    M'intéresse aussi

    J'ai idem en bloquant via le robot.txt certaines parties de mon forum, notamment versions imprimables, ... avec un forum oxygen. Ca vient donc directement de robot.txt
     
  3. sdamain
    sdamain WRInaute passionné
    Inscrit:
    14 Octobre 2003
    Messages:
    1 055
    J'aime reçus:
    0
    Apparement ce sujet n'attire pas les foules :wink:
     
  4. milkiway
    milkiway WRInaute accro
    Inscrit:
    3 Février 2004
    Messages:
    4 196
    J'aime reçus:
    0
    pourtant il devrait !
    Quelqu'un peut m'aider j'ai le mm problème :(
    Voici mon robots.txt
    j'ai fait ça par ce que j'ai mis l'url rewriting comme indiqué sur le post de référence dans WRI ici https://www.webrankinfo.com/forum/t/phpbb-et-url-rewriting-les-solutions.6801/
    Mais depuis une semaine GG indexe mes pages comme si l'url rewriting n'était pas en place !
    Genre https://www.google.fr/search?hl=fr&ie=UT ... ogle&meta= la page indexée ici :?
    Comment faire ?
    MERCI !
     
  5. GAMING ZONE
    GAMING ZONE WRInaute impliqué
    Inscrit:
    13 Août 2004
    Messages:
    507
    J'aime reçus:
    0
    Vous etes trop drôle !
    N'oublier pas que google est capable de trouver toutes les pages de votre site, c'est un pur hacker robotisé , ahahaha
    bon pour le dernier qui nous montre son robot.txt
    tu ne veux pas que ton forum soit referencé ? si c'est bien cela, ton robot.txt devrait ressembler simplement a cela :

    User-agent: *
    Disallow: /forum

    Et dire que tu as un forum d'entraide informatique, je rigole moi, qui n'est pas un pro et qui n'a jamais utilisé un robot.txt

    Excuse moi de ceci, ne le prend pas mal, mais reflechis un petit peu ...
     
  6. GAMING ZONE
    GAMING ZONE WRInaute impliqué
    Inscrit:
    13 Août 2004
    Messages:
    507
    J'aime reçus:
    0
    Ah excuse moi, mais j'avais oubliez un detail tres important !
    et ce detail me permet de te dire que ton robot.txt ne sert strictement à rien !
    tu as du changer l'url de ton forum qui etait d'apres ton robot.txt -www.tonsite.com/forum/
    mais n'as tu pas recemment changé l'adresse de ton forum, en la pointant sur
    forum.tonsite.com ?
    dans ce cas, IL FAUDRAIT CREER UN ROBOT.TXT DANS LE REPERTOIRE OU SE SITUE FORUM.TONSITE.COM

    User-agent: *
    Disallow: /

    serait ce bon ?
     
  7. milkiway
    milkiway WRInaute accro
    Inscrit:
    3 Février 2004
    Messages:
    4 196
    J'aime reçus:
    0
    Quelqu'un doté d'un niveau intellectuel plus élevé pourrait il m'aider svp ?
     
  8. GAMING ZONE
    GAMING ZONE WRInaute impliqué
    Inscrit:
    13 Août 2004
    Messages:
    507
    J'aime reçus:
    0
    Je ne suis pas plus elevé intellectuellement que toi !
    Il est vrai que je n'y etais pas allé mollo avec toi d'ou les excuse par avance ...
    Cependant, je n'ai pas regarder la config d'un robot.txt, donc peut etre la derniere config est mauvaise.

    Mais avec plus de detail, c'est beaucoup plus facile !

    Peut etre c'est juste pour diverger sur ton joli site sur les standarts, et la je me dis qu'il est capable de faire un site sur les standarts,agreable et de ne pas pouvoir debugger une erreur comme cela...

    Il est vrai que c'est plus facile de detecter une erreur par un autre, c'est le theoreme de la re-lecture.

    Mais peut etre tu n'as pas de probleme, et que tu voulais montrer aux precedents posteurs d'afficher leurs codes , et plus de renseignements, car chaque site est different ...

    En ce qui concerne ton sujet de site, j'ai ma façon de coder, et tant que les standarts ne seront pas respecter par les navigateur, je coderais pour les navigateurs, et non pour les standarts ! (ce qui rejoint l'idée un site pour les visiteurs, et non pour les robots ! )
    Les standarts evite l'optimisation de taille, pourquoi fermer une balise div se situant dans la cellule d'unn tableau, alors que le simple fait de fermer la cellule annule la balise div, et tous les navigateur reagisse ainsi, alors que le standart de dis que tu as fais une erreur, vous n'avez pas refermer votre balise a la ligne 42 !
    autre exemple, prendre en consideration d'un navigateur avec sript activéé ou non avec une balise lien,
    <script><a href="#null" onclick=window.open(blabla.htm','nam','les option que l'on veut'></script>
    <noscript><a href=blabla.htm target="_new"></noscript>
    texte du lien sur blabla</a>
    la le standart ne comprendra pas a quoi correspond </a>, pourtant cela evite de repeter deux la meme chose , et ne genera d'auncune maniere le navigateur !
    Désolé , je suis de l'ancienne generation, où un byte est un byte !
    c'est un point de vu ... et rien contre toi, et comme je l'ai dis plus cela evite d'etre relu correctement par un robot, genre pour dupliquer du contenu, car les standarts permette ce genre de chose, il code standart, je le decode standart, je l'affice a ma maniere ...

    Sinon, ton probleme ne viendrait pas par rapport a ce que je t'ai indiqué a ton post precedent ? Merci de l'indiqué
     
  9. Mojy
    Mojy WRInaute occasionnel
    Inscrit:
    22 Août 2004
    Messages:
    347
    J'aime reçus:
    0
    Comme dit GAMING ZONE
    Code:
    User-agent: * 
    Disallow: /forum 
    dans ton robot.txt à la racine du forum.
    Ton forum ne sera plus indexé.
    @+ Mojy
     
  10. GAMING ZONE
    GAMING ZONE WRInaute impliqué
    Inscrit:
    13 Août 2004
    Messages:
    507
    J'aime reçus:
    0
    mojy
    cette reponse est completement fausse
    le forum est situé a l'adresse forum.lesite.com
    et non pas -www.lesite.com/forum
    donc completement different
     
  11. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 839
    J'aime reçus:
    0
    ben non il a dit " a la racine du forum " donc sur formu.site.oo par contre faut faire un disallow global
     
  12. Mojy
    Mojy WRInaute occasionnel
    Inscrit:
    22 Août 2004
    Messages:
    347
    J'aime reçus:
    0
    Merci Erazor :wink: .
    Ben l'autre y m'engueule alors que je l'approuve. :lol:

    milkiway tu rajoutes dans le header de ton forum
    Code:
    <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
    ça aide aussi. 8)
    @+ Mojy
     
  13. GAMING ZONE
    GAMING ZONE WRInaute impliqué
    Inscrit:
    13 Août 2004
    Messages:
    507
    J'aime reçus:
    0
    justement, si c'est a la racine forum.tonsite.com

    User-agent: *
    Disallow: /forum

    alors google ne reference pas tous ce qui ce trouve /forum
    mais il reference index.php
    ou mieux l'url a chercher a savoir forum.lesite.com/viewtopic.php?t=311

    alors, c'est toujours juste ?
     
  14. milkiway
    milkiway WRInaute accro
    Inscrit:
    3 Février 2004
    Messages:
    4 196
    J'aime reçus:
    0
    Non non jeme suis drolement mal exprimé :ce que je veux dire c'est que mes pages sous forme /index.php?monzob=estgros sont indexées alors que je ne veux indéxer QUE les pages avec url réécrite, donc sous fome /monzob_estgros.html
    Exactement comme indiqué sur le guide URL Rewriting.
    Je VEUX indexer mon forum !

    Que dois je mettre dans mon robots.txt

    Pour le forum il est accessible en sous domaine donc sous la forme http://forum.en1heure.com/ mais c''est en fait un dossier de en1heure.com
     
  15. GAMING ZONE
    GAMING ZONE WRInaute impliqué
    Inscrit:
    13 Août 2004
    Messages:
    507
    J'aime reçus:
    0
  16. a.nonyme4ever
    a.nonyme4ever WRInaute occasionnel
    Inscrit:
    20 Février 2004
    Messages:
    371
    J'aime reçus:
    0
    Je crois qu'on est pas pret d'avoir une reponse correcte...
     
  17. Kounte
    Kounte WRInaute impliqué
    Inscrit:
    16 Septembre 2003
    Messages:
    626
    J'aime reçus:
    0
    Je ne suis pas un pro, mais il me semble que ton robot txt devrait ressembler à cela ? :

    Code:
    Disallow: posting.php?mode=reply&t=*$
    Disallow: posting.php?mode=quote&p=*$
     
  18. milkiway
    milkiway WRInaute accro
    Inscrit:
    3 Février 2004
    Messages:
    4 196
    J'aime reçus:
    0
  19. Kounte
    Kounte WRInaute impliqué
    Inscrit:
    16 Septembre 2003
    Messages:
    626
    J'aime reçus:
    0
  20. milkiway
    milkiway WRInaute accro
    Inscrit:
    3 Février 2004
    Messages:
    4 196
    J'aime reçus:
    0
    Pourtant tout a fonctionné, tu penses donc que ça
    Code:
    Disallow: posting.php?mode=reply&t=*$
    Disallow: posting.php?mode=quote&p=*$
    suffirait ?
     
  21. GAMING ZONE
    GAMING ZONE WRInaute impliqué
    Inscrit:
    13 Août 2004
    Messages:
    507
    J'aime reçus:
    0
    oui, cela devrait etre mieux !
     
  22. bjp
    bjp WRInaute occasionnel
    Inscrit:
    12 Mai 2003
    Messages:
    442
    J'aime reçus:
    0
    J'ai le même problème, je me demande si ces lignes marcheront ?
    Tiens nous informé.
     
Chargement...
Similar Threads - Robots phpbb Disallow Forum Date
Membres robots sur phpBB3 Développement d'un site Web ou d'une appli mobile 28 Avril 2009
Les robots qui surfent phpBB Débuter en référencement 14 Mai 2007
Fichier robots.txt pour forum phpbb Référencement Google 25 Octobre 2006
[PHPBB] Marre des inscriptions de robots, que faire ? Demandes d'avis et de conseils sur vos sites 13 Septembre 2006
Fichier robots.txt dans un forum phpbb? Débuter en référencement 24 Avril 2006
Afficher les robots dans le whoisonline de phpbb Développement d'un site Web ou d'une appli mobile 26 Mars 2006
Phpbb + url rewriting + robots.txt Débuter en référencement 5 Mars 2006
Robots.txt et url rewriting sur phpbb interdire profil URL Rewriting et .htaccess 15 Mars 2004
Phpbb, urlrw et robots.txt URL Rewriting et .htaccess 8 Janvier 2004
Pourquoi ne pas utiliser le robots.txt pour interdire l'indexation ? Débuter en référencement 14 Avril 2022
canonical et robots=index sur une même page Débuter en référencement 7 Décembre 2021
le noindex dans le robots.txt Débuter en référencement 19 Novembre 2021
suppression des pages bloquées par robots.txt Débuter en référencement 18 Octobre 2021
Faut-il déclarer le sitemap dans le robots.txt ou search console ? Crawl et indexation Google, sitemaps 14 Juillet 2021
Les mots-clés de mon site ne sont pas détectés par les robots de référencement Problèmes de référencement spécifiques à vos sites 7 Juillet 2021
Wordpress et le robots.txt Débuter en référencement 21 Juin 2021
Search Console noindex détecté dans la balise Meta robots Débuter en référencement 21 Mai 2021
Urls filtrées indexées et crawl robots.txt Crawl et indexation Google, sitemaps 19 Mai 2021
Robots : n'autoriser que les 4 ou 5 moteurs de recherche principaux Crawl et indexation Google, sitemaps 15 Janvier 2021
erreurs robots.txt Crawl et indexation Google, sitemaps 23 Décembre 2020