Google est bien ridicule sur le référencement des pages

Discussion dans 'Crawl et indexation Google, sitemaps' créé par @Rano, 11 Février 2005.

  1. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    Vraiment, ils sont de moins en moins crédible. C'est bien gentil d'être le numéro 1 des moteurs de recherche, mais ils sont bien ridicule sur certains points. Passons le classement incompréhensible, rien que le fait de marquer 8 milliards de pages "recencés" et d'en avoir les trois quarts où il n'y a que l'url, je trouve ca complétement con. Ils ferraient mieux de mettre les pages "référencées", car c'est bien gentil d'enregistrer toutes les urls qu'il trouve, mais le problème c'est que maintenant il s'amuse même à enregistrer les urls, sans le contenu, des pages terdites par robots.txt

    Toutes les pages de cet exemple sans contenu ni titre sont des pages interdites par un robots.txt. Et il les a enregistrés alors même que le robots.txt était déjà en place. Ferraient bien de respecter les normes au lieu de faire les cons à dire "on est le premier". (Les vraies pages autorisées)
     
  2. yanhl
    yanhl WRInaute impliqué
    Inscrit:
    4 Décembre 2003
    Messages:
    659
    J'aime reçus:
    0
    C'est surtout ton commentaire qui est ridicule.
    Fais des recherches sur le forum pour comprendre pourquoi tu vois des pages avec seulement une URL quand tu tapes site:...
    Comme dirais billou : "it's not a bug, it's a feature" :p
     
  3. Sébastien Billard
    Sébastien Billard WRInaute passionné
    Inscrit:
    7 Mai 2003
    Messages:
    1 700
    J'aime reçus:
    1
    C'est une feature mais c'est aussi un demi-mensonge. Il serait plus honnete de dire "nous recensons 8 milliards d'url dont 6 milliards indexée en full text". Mais c'est moins vendeur ;)
     
  4. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    Ce qui est ridicule c'est de croire qu'en déployant le 1000 eme site sur une BDD ou affiliation comme 3000 autres GG va etre dupe et avaler la supercherie sans broncher.. excuse moi je pouffe la :p
    Va falloir vous casser un peu plus le Q les gars pour vendre du voyage et autres ..
    lol :
    https://www.google.com/search?num=20&hl= ... ge.com&lr=
     
  5. macjee
    macjee WRInaute occasionnel
    Inscrit:
    29 Avril 2003
    Messages:
    311
    J'aime reçus:
    0
    Tu devrais t'abstenir de faire des commentaires sur les sites des autres monsieur l'ane...
     
  6. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    Le quidam a posté ici en prenant cet exemple et je commente . C'est le but d'un forum il me semble.
    Si ça te pose un pb ne lis pas ...
     
  7. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    Je suis tout à fait d'accord, c'est pour ca que j'ai mis un robots.txt pour qu'il n'indexe qu'une dizaine de page. Mon sujet n'a pas été créé dans le but de vendre ma cam, simplement pour montrer que Google fait de plus en plus n'importe quoi...

    Depuis quand un moteur de recherche se permet d'indexer des urls qu'on lui interdit ? La moindre des choses pour un moteur qui se veut de cette qualité, c'est de respecter les règles élémentaires.

    L'exemple choisi, n'est pas un exemple montrant une similitude des pages. Ca on s'en fout, ya trois milles topics sur ce sujet sur wri. Les pages sans titres ne sont pas là pour la raison qu'il y a de la similitude, mais si elles sont vides, c'est parceque je lui demande de ne pas les indexer. Mais ce con ne devrait meme pas indexer l'url. Là c'est simplement pour montrer que Google n'est plus ce qu'il était.

    C'est bien beau d'utiliser le mot "quidam" pour faire style, ou d'idolatrer Google, mais y a pas à dire, ce moteur devient n'importe quoi.
     
  8. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    ben regarde ton site : tes pages sont bourrées de liens vers ces fichiers . Je te signale que tu lui a intedit **/hotels/ville.php mais pas
    **/hotels/ville.fr.php?i=4432&b[]=10&b[]=50 par exemple
    Au cas ou tu saurai pas c'est pas la même chose ...
    D'ailleurs Google a fait exactement ça regarde : https://www.google.fr/search?sourceid=na ... 2Efr%2Ephp
    Donc avant d'écrire que GG est ridicule regarde un peu ton usine a gaz :wink:
    Voila mon quidam .. a qui la faute ?

    non moi je sais comment ça fonctionne un robots.txt contrairement a toi ..aucune idolatrerie : de la technique only
     
  9. yanhl
    yanhl WRInaute impliqué
    Inscrit:
    4 Décembre 2003
    Messages:
    659
    J'aime reçus:
    0
    @rano > utilise une meta avec noindex pour que la page ne figure pas dans google, même sous forme de lien simple.
    je ne sais plus d'où je sors cette info mais je crois que je l'avais vérifiée. si tu peux faire des recherches à ce sujet et indiquer dans ce topic si je me plante où si j'ai bonne mémoire...
     
  10. yanhl
    yanhl WRInaute impliqué
    Inscrit:
    4 Décembre 2003
    Messages:
    659
    J'aime reçus:
    0
    edit : je crois que c'est pour la raison donnée par erazor qu'il faut mettre des noindex :)
     
  11. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    Dans le passé, c'était la meme chose pour lui. Simplement depuis que les autres moteurs sont arrivés, il a voulu faire grossir le nombre de la home et pour cela il est obligé de ne respecter les règles qu'à moitié. Regarde Yhaoo ou MSN, aucun n'a enregistrés les pages interdites.

    C'est pas contre toi que j'en ai erazor, t'es tout à fait respectable, et t'as montré dans d'autres posts que t'es loin d'etre con, mais juste contre Google. Ca a été un des meilleurs moteurs, c'est incontestable, mais ca évolue quoi...

    Sortez vous de la tête que Google est le roi franchement, ca devient ridicule :) Vous avez le droit de lui faire des reproches vous savez :eek:
     
  12. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    tu as bien lu mon explication ? tu as fait une énormité dans ton robots txt !
    est que c'est clair ?
    Arretes de dire que GG "ne respecte qu'a moitié" c'est TOI qui t'est gourré
    et toi sors toi de la tete que ton site est sans reproches ..ça vire a l'aveuglement la ..
     
  13. Blini
    Blini WRInaute occasionnel
    Inscrit:
    29 Novembre 2004
    Messages:
    439
    J'aime reçus:
    0
    Je comprends pas, Erazor, moi je vois bien un
    Disallow: /hotels/ville.fr.php
    dans son robots.txt. 8O ??
     
  14. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    ma page /divers/

    Mon robots.txt qui existe depuis le début :
    Code:
    User-agent: *
    Disallow: /sejours/pays.php
    Disallow: /sejours/ville.php
    Disallow: /sejours/search.php
    Disallow: /hotels/pays.php
    Disallow: /hotels/ville.php
    Disallow: /hotels/ville.fr.php
    Disallow: /hotels/search.php
    Disallow: /locations/ville.fr.php
    Disallow: /locations/search.php
    Disallow: /locations/departement.php
    Disallow: /divers/
    Tu trouves ca normal qu'il indique au monde entier que cette page existe alors que je lui interdit d'en parler ?
     
  15. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    ... et GG ne l'a pas indexé ton ville.php : normal ...gentil Google
    par contre ville.php?nimportequoiderrière c'est pas disallow ET CE N'EST PAS LE MÊME FICHIER donc GG indexe.. Gentil Google ..
    mais webmaster maladroit :wink:
    J'ai mis en grand vous allez comprendre quand je gueule ?
     
  16. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    Oui, normal qu'il ne l'ait pas "indexé"... mais ca te gène pas toi qu'il indique qu'elle existe ?

    On peut avoir une discussion normal, t'excite pas :eek:
     
  17. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    Maintenant si tu veux, on peut aller voir la norme, ca me semble pas mal pour savoir comment ca marche :

    Ca veut dire quoi "that starts" ? j'ai pas bien compris...
     
  18. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    je renonce la ..relis la page précedente et cherche de la littérature sur internet .
     
  19. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    ba non, c'est nul si tu renonces...

    Google ne respecte PLUS (il l'a fait à une époque, je suis d'accord) totalement cette norme, contrairement aux autres moteurs...
    Mais bon, c'est compréhensible. Un gros nombre sur la home, c'est toujours sympa
     
  20. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    ben GG ne l'a pas indéxé . gentil google .. :lol:
    les autres ville.phpXXXXX sont indéxés ? ben normal sont pas disallow ceux la .. gentil google l'a tout fait bien comme y faut
     
  21. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    bon, c'est pas grave :eek:
    je sens que tu t'énerves, c'était pas le but du topic, désolé
     
  22. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    c'est surtout que tu est complètement ignorant du fonctionnement d'un site : tu as un disallow sur UN FICHIER et pas sur les autres qui en découlent donc ils sont indéxés ..
     
  23. Blini
    Blini WRInaute occasionnel
    Inscrit:
    29 Novembre 2004
    Messages:
    439
    J'aime reçus:
    0
    Erazor > je dois être mal embouché aujourd'hui. Comprends pas: son robots.txt a bien un pattern sur ville.php et sur ville.fr.php. Donc, je pensais que les pages "ville.phpXXX" et les pages "ville.fr.phpXXX" ne seraient pas indexées... Pff...
     
  24. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    Si tu suis la norme oui... apparemment on n'est pas obligé :eek:
     
  25. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    au lieu de répéter betement cinq fois de suite que GG ne respecte pas le protocole robots essaie de comprendre et vérifier ailleurs que (exemple ) ville.fr.php?i=4432&b[]=10&b[]=50 ce n'est pas égal a ville.fr.php
    donc c'est indexé car c'est pas disallow par ton robots.txt simpliste ..
     
  26. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    ... oui, je dois etre un boulay, je vois que ca comme argument valable
     
  27. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    Admettons... si tu veux, c'est pas grave.
    Maintenant, juste répond moi par oui ou non, si tu trouves normal ne serait-ce que le fais qu'il indique dans son index que ma page /divers/ existe ?
     
  28. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
  29. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    Bon d'accord...

    Je vais juste aller prévenir Google alors qu'ils ont la meme erreur dans leur robots.txt
    Je vais essayer d'ajouter des ? à la fin pour voir tiens... mais bon "ville.php?" c'est différent de "ville.php?a" :eek:
     
  30. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    pas du tout ex la première ligne c'est ça Disallow: /search
    il n'a pas de slash apres search c'est pas un hasard
     
  31. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    C'est un fichier search, c'est pas un dossier.

    Prend un dossier, par exemple /u/
    C'est pour interdire tous les résultats fournis par :
    https://www.google.com/u/search
     
  32. Blini
    Blini WRInaute occasionnel
    Inscrit:
    29 Novembre 2004
    Messages:
    439
    J'aime reçus:
    0
    Erazor > Mes plus plates excuses par avance, mais j'ai cherché rapidement en vain:
    Disallow: /search
    va-t'il interdire
    /searchtoto.php
    /search.php
    /search.php?toto
    ?
    Si tu as une adresse de doc plus complète que la norme qui m'a l'air un peu vague, je suis aussi preneur...
     
  33. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    c'est un fichier avec des myards de pages derrières style search?hl=fr&q=voyages&btnG=Recherche+Google&meta=
    exactement comme ton ville.php ..
    sauf que google a le bon robots txt

    Disallow: /search
    va-t'il interdire
    /searchtoto.php
    /search.php
    /search.php?toto
    oui tout
     
  34. e-kiwi
    e-kiwi WRInaute accro
    Inscrit:
    23 Décembre 2003
    Messages:
    13 257
    J'aime reçus:
    1
    mais... GG ne respecte pas le protocole robots
     
  35. Blini
    Blini WRInaute occasionnel
    Inscrit:
    29 Novembre 2004
    Messages:
    439
    J'aime reçus:
    0
    OK. mais donc d'après ce que tu sembles dire, un:
    Disallow: /search.php
    Ne va pas interdire
    /search.php?toto

    C'est ça ?

    (blini, confus)
     
  36. e-kiwi
    e-kiwi WRInaute accro
    Inscrit:
    23 Décembre 2003
    Messages:
    13 257
    J'aime reçus:
    1
    Blini, peux tu relire tout le post ? Erazor explique clairement le problème. si tu n arrive pas a comprendre ce qu'il ecrit, t es mal barré, désolé de te le dire comme ca ^^ sans dec relis tout bien
     
  37. Blini
    Blini WRInaute occasionnel
    Inscrit:
    29 Novembre 2004
    Messages:
    439
    J'aime reçus:
    0
    Désolé, je trouve pas le post clair du tout. Tant pis, je vais chercher des réponses ailleurs.
     
  38. takeiteasy
    takeiteasy WRInaute discret
    Inscrit:
    9 Juillet 2003
    Messages:
    76
    J'aime reçus:
    0
    Un petit commentaire sur le sujet du post...

    Depuis quelques jours les vistes sur mon site ont doublé. Normal, je repasse en tête sur un nombre important de requêtes et l'effet Google se fait ressentir.

    En fait mon site revient à sa situation de juin 04 juste avant de changer de nom de domaine, malgré une redirection permanente.

    Le changement de nom de domaine l'avait fait plonger dans les profondeurs du classement, contrairement à Yahoo et AOL qui avait "correctement" géré le changement de NDD.

    Pourtant moi aussi j'ai craché dans la soupe en accusant Google de tous les maux.

    J'ai au moins appris qu'avec Google, c'est une affaire de contenu, de backlinks et de patience. On me l'avait pourtant dit plusieurs fois... mais il y souvent des choses que l'on ne veut pas entendre! Human nature...
     
  39. rituel
    rituel WRInaute impliqué
    Inscrit:
    15 Mars 2003
    Messages:
    900
    J'aime reçus:
    0
    Je ne suis pas expert en robots.txt, mais je pense que l'âne a raison, d'ailleurs moi j'aurais mis une * à la fin de chaque ligne du robots.txt pour être sûr que tout ce qui commence par ce qui précède l'étoile ne soit jamais indexé, mais je ne sais pas si c'est dans la norme ...
     
  40. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    Donc
    Code:
    Disallow: /search
    va interdire
    Code:
    /search?toto
    Mais
    Code:
    Disallow: /ville.php
    N'interdit pas
    Code:
    /ville.php?toto
    c'est ca ?
    C'est quand meme ce que t'es en train de m'expliquer entre tes premiers messages et les derniers...
     
  41. squawk
    squawk WRInaute accro
    Inscrit:
    22 Mars 2004
    Messages:
    4 792
    J'aime reçus:
    0
    Moi j'ai pas compris pourquoi il voulait pas faire indexer les pages.... moi j'aurais url rewrité le tout... je vois pas l'interet de ce genre de site si c'est pour pas faire de traffic.... :)
    Supprime le robots.txt ça ira plus vite :D
     
  42. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    Là n'est pas la question. Je m'en fou de ce site, c'est pour tester les différents filtres de google. Savoir plus ou moins à quel moment il va blacklister. Je lache les pages au fur et à mesure. J'en ai d'autres des sites de bourins, comme tout le monde, seulement moi aussi, j'aime bien essayer de comprendre comment fonctionne ce mastodonte du web. Alors je fais des essais
     
  43. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    sauf que t'as construit une f 1 et pas gonflé les pneus = premier virage sortie de route et couinements ici en accusant le bitume :lol:
     
  44. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    J'accuse pas le fait qu'il ne m'ait pas indexé mes pages :roll:
    Juste, tu peux me dire par rapport à mon poste précédent ? Pas celui auquel tu viens de répondre, mais l'autre avant...

    Je demande qu'à comprendre :eek:
     
  45. pipologue
    pipologue WRInaute occasionnel
    Inscrit:
    27 Mai 2004
    Messages:
    477
    J'aime reçus:
    0
    On appelle ça un troll si je ne me trompe pas... ?
     
  46. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
  47. pippo
    pippo Nouveau WRInaute
    Inscrit:
    16 Octobre 2004
    Messages:
    36
    J'aime reçus:
    0
    ville.php interdit tout ce qui commence par ville.php, donc aussi ville.php?toto

    Tu n'as qu'à vérifier à l'aide du W3CLinkChecker: http://validator.w3.org/checklink
     
  48. tonguide
    tonguide WRInaute passionné
    Inscrit:
    28 Novembre 2003
    Messages:
    1 169
    J'aime reçus:
    0
    c'est fort ce post, tout le monde fait semblant de pas voir le post de l'autre lol tous des tétus lol
    Rano, WRI c'est pas trop le bon forum pour critiquer Google :) (me tapé pas siouplé lol)
     
  49. tonguide
    tonguide WRInaute passionné
    Inscrit:
    28 Novembre 2003
    Messages:
    1 169
    J'aime reçus:
    0
    c'est justement la question que pose Rano à Erazor, si j'ai tout suivis ;)
     
  50. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    Oui c'est bien ca... mais apparemment Erazor a un peu de mal :eek:

    Niveau Fichier :
    En reprenant le topic du début, erazor nous apprend que :
    En bloquant "ville.php" on ne bloque pas "ville.php?toto"...
    En revanche, sur la dernière page, il nous apprend que :
    En bloquant "search", on bloque "search?toto"...

    Bon très bien, c'est pas pareil pour vous ? Les deux sont des fichiers, c'est pas le fait qu'il y ait un . qui va changer quelque chose :eek:

    Niveau Répertoire :
    Deuxième point, les répertoires, avec mon exemple du /divers/ est exactement la meme chose que /u/ de google... mais bon apparemment, Erazor a de nouveau quelques difficultés...

    J'ai séparé Fichier et répertoire pour montrer les deux points sur lesquels on était en désaccord avec erazor dans ce topic... Mais les deux sont les mêmes. La norme dit bien que quoi qu'on mette, si l'url commence par ca, c'est interdit... La norme le dit, et Google la suit... mais à moitié.


    Mais mon topic n'était pour polémiquer la dessus au départ :eek:. C'était simplement pour montrer que Google respecte cette norme, dans le sens ou il n'a pas indexé les pages effectivements interdites. Mais ne la respecte plus totalement, car il n'a même pas à indiquer que ces pages existent. Autrement dit, pour utiliser les termes de Google :
    "J'indexe pas" ok, encore heureux, je lui interdis
    "Mais je recense quand meme" ba là non, t'as pas à le faire...

    Voilà où est mon petit carton rouge depuis le départ du topic :D

    ... bon, maintenant j'attends l'argument du "T'es un boulay" :lol:
     
  51. Brain Earser
    Brain Earser WRInaute discret
    Inscrit:
    22 Septembre 2004
    Messages:
    57
    J'aime reçus:
    0
    Surement que t'es roux, canadien et que tu chantes mal...qui sait...
    Ué je sais, la sortie... :D
     
  52. pippo
    pippo Nouveau WRInaute
    Inscrit:
    16 Octobre 2004
    Messages:
    36
    J'aime reçus:
    0
    C'est juste. Chez moi aussi, google n'indexe pas les pages interdites par le robots-txt, mais il les recense quand même.
     
  53. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    T'est modeste je dirai super boulay dans le sens ou GG n'a pas indexé tes pages interdites et il n'indique aucunement qu'elles existent la preuve :
    https://www.google.fr/search?hl=fr&c2cof ... .php&meta=
    idem avec vacances.kalifage.com/hotels/search.php et toutes celles de ton robots txt . Elles sont invisibles dans GG Mr Boulay 1er roi des boulays :wink: . Tu nous fait une démo que GG merde avec un truc qui ne tient pas la route désolé.
     
  54. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    Mais t'es stupide ou quoi ?
    Tu ne fais que te contredire depuis le début et tu n'apportes aucune preuve valable. Juste des contre exemples qui ne contredisent en rien ce que je raconte.

    Depuis le début tu me sors des trucs, sans preuve, sans rien, simplement sur tes "connaissances" qui se révèlent etre foireuses... Je t'ai apporté une norme, je t'ai apporté une expérimentation, qqun a donné un validateur du W3C, une personne indique les mêmes résultats que moi... Et les seuls gens qui disent comme toi depuis le début, c'est pour dire "que je suis con"... Franchement, trouvez mieux comme argument :eek:

    Regarde ce qui est en gris :
    Validateur de lien

    Si tu veux je te le traduit :
    "Le lien n'a pas été vérifié car une règle du fichier robots.txt l'interdit"...

    T'abuses sérieux :eek:
    Je pensais qu'avec 3000 posts, tu ne racontais pas que des conneries. Je commence à en douter fortement là.
     
  55. XoSt
    XoSt WRInaute passionné
    Inscrit:
    6 Octobre 2003
    Messages:
    2 231
    J'aime reçus:
    0
    Je commence à préférer msn...
     
  56. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    pas plus que toi qui ne connait pas la différence entre un fichier et un répertoire.
    Le 3 WC qui valide ? libre a toi d'y croire ..d'ailleurs beaucoup en parlent très peu le maitrise ( et pour cause ) tiens un exemple :
    http://validator.w3.org/check?uri=http% ... lifage.com
    ca t'empeches pas d'etre référencé a outrance :p
     
  57. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    looooool, t'es à l'ouest, y a aucun rapport
     
  58. tonguide
    tonguide WRInaute passionné
    Inscrit:
    28 Novembre 2003
    Messages:
    1 169
    J'aime reçus:
    0
    Erazor, désolé, mais je trouve qu'il a pas tout a fait tord ...
     
  59. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    ben si tu sort un outil 3WC pour me monter que tu as raison.
    si tu veux ..mais va voir de pres ses pages..il disallow un fichier mais fait pointer des centaines de liens sur des fichiers qui en découlent ( donc différents )
    regarde cette page : http://vacances.kalifage.com/hotels/ t'as , entre autre, un lien qui pointe vers ça http://vacances.kalifage.com/hotels/vil ... ?i=25533&b[]=10&b[]=50
    ben c'est indéxé pas de quoi sortir un 3 WC pour hurler au scandale et de prendre ile bourricot pour un demeuré. Parce que dans l'affaire qui est le ... ?
     
  60. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    Et pour des cas concrets .;comment sont faits les robots.txt de ceux qui les utilisent cad les moteurs eux mêmes ?
    comme ça :
    http://www.alltheweb.com/robots.txt
    http://fr.altavista.com/robots.txt
    https://www.google.fr/robots.txt
    et pour hotbot qui veut inexer ses résultas dans google comme ça
    http://www.hotbot.com/robots.txt
    et kesse ki se passe si un moteur trouve des liens bien gras a suivre sur une page pas disallow ? Voir la faq GG chapitre 3 :

    3. Googlebot essaie de télécharger des informations confidentielles de mon serveur Web. Que dois-je faire pour l'en empêcher ?

    Si je comprends bien, il est quasiment impossible de garder secret un serveur Web en ne publiant aucun lien vers ce serveur ? C'est exact -- Dès qu'un utilisateur suit un lien établi entre votre serveur « secret » et un autre serveur Web, il est plus que probable que votre adresse URL « secrète » sera enregistrée dans la balise de référencement et qu'elle sera stockée, ou même publiée, par l'autre serveur Web dans son journal de référencement. Par conséquent, s'il existe un lien entre votre serveur Web « secret » (ou entre une de vos pages) et un autre serveur Web, il est plus que probable que Googlebot et les autres robots-explorateurs et « araignées » se feront un plaisir de le recenser...
     
  61. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    C'est la que tu coinces...
     
  62. iconso
    iconso WRInaute occasionnel
    Inscrit:
    8 Avril 2003
    Messages:
    358
    J'aime reçus:
    0
    Erazor, désolé mais tu as tort à 100% ;-)
    Voila la norme en anglais : http://www.robotstxt.org/wc/norobots.html

    Il y est bien précisé pour la documentation du disallow : "This can be a full path, or a partial path; any URL that starts with this value will not be retrieved." Soit en traduction : "[...]; toute URL qui commence par cette valeur ne sera pas crawlée"

    J'ai eu l'occasion de tester cela, Google ne crawlera JAMAIS une page de type /mapage.php?param=xxx avec un disallow: /mapage.php dans le robots.txt.
    <EDIT>Petite note au passage : par contre ces URLs seront de manière presque certaine ajoutées à l'index mais sans aucune description, et viendront donc gonfler les chiffres, alors que Google sait très bien qu'il ne pourra jamais indexer ces URLs" </EDIT>

    Si pour toi "/mapage.php?XXX" ne commence pas par "/mapage.php", alors ca sera difficile de te convaincre ;-)

    Fred
     
  63. jobetudiant
    jobetudiant WRInaute discret
    Inscrit:
    24 Mai 2004
    Messages:
    248
    J'aime reçus:
    0
    Je trouve dommage d'arriver à la 5eme page pour se rendre compte qu'un des "pontes" qui participe à toutes les conversations ou presque donne parfois des réponses incorrectes (pas grave en soi), mais surtout, les maintiens pendant 4 pages, en ridiculisant son interlocuteur (beaucoup moins joli)
     
  64. pippo
    pippo Nouveau WRInaute
    Inscrit:
    16 Octobre 2004
    Messages:
    36
    J'aime reçus:
    0
    Il ne s'agissait pas du du validator.w3.org, mais du validator.w3.org/checklink, ce qui n'est pas tout à fait la même chose :wink:
     
  65. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    tiens une hyène de passage ..couché sale bête

    Rano va voir dans MSN lui aussi a commencé a indexé tes répertoires interdits par ton robots.txt
    http://search.msn.fr/results.aspx?q=htt ... &FORM=QBRE
    ?
     
  66. iconso
    iconso WRInaute occasionnel
    Inscrit:
    8 Avril 2003
    Messages:
    358
    J'aime reçus:
    0
    Il ne les "indexe" pas, il en connait l'existence (tout dépend de la définition de "indexer", ici pour moi indexer = présent dans la base avec le contenu de la page). Par contre même s'il les connait il ne les indexera jamais intégralement : donc franchement que ce soit Google, MSN ou tout autre moteur, a part gonfler les stats du nombre de pages je n'en vois pas l'intérêt, puisque pour eux elles n'ont aucun contenu...

    Fred
     
  67. pippo
    pippo Nouveau WRInaute
    Inscrit:
    16 Octobre 2004
    Messages:
    36
    J'aime reçus:
    0
    Si tu nous disais plutôt pourquoi tu te bats contre l'évidence avec tant d'acharnement?
     
  68. jobetudiant
    jobetudiant WRInaute discret
    Inscrit:
    24 Mai 2004
    Messages:
    248
    J'aime reçus:
    0
    Ca continue?
     
  69. Steph82
    Steph82 Nouveau WRInaute
    Inscrit:
    12 Juin 2004
    Messages:
    48
    J'aime reçus:
    0
  70. cccm62
    cccm62 WRInaute discret
    Inscrit:
    11 Août 2004
    Messages:
    89
    J'aime reçus:
    0
    Je ne connais pas Erazor, je ne vais donc pas me permettre de porter un jugement... mais je trouve que l'avatar est bien choisi :wink: .
    Merci pour cette petite distraction ...

    Je n'ai rien à ajouter sur le robot.txt, je pense que tout a déjà été dit, mais je me permets juste une remarque : google a du mal (enfin à ce que j'ai lu c'est volontaire) à référencer certaines pages dynamiques sans url rewriting (qui ont pourtant un PR de 3 ou 4)...

    ... et là j'apprends qu'il indexe quand même les URL des pages dynamiques - avec un PR à 0 - qui plus est avec un disallow.

    Bref je n'ai rien contre Google mais je trouve que leur méthode d'indexation n'est pas très claire ! C'est peut-être moi qui comprends pas ou mal, mais entre l'histoire du PR (alors que certains sites à PR 0 apparaissent en première position dans les résultats), des pages dynamiques (parfois référencées, parfois pas)... et j'en passe

    Y'a de quoi être perdu :lol:
     
  71. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    oui ici :
    http://www.webmasterclub.fr/topic_1282.html
    au passage je remercie aK pour son appéciation ..
     
  72. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    T'as pas un minimum honte de tes réactions ? Tu deviens pathétique là...
     
  73. Erazor
    Erazor WRInaute accro
    Inscrit:
    14 Février 2004
    Messages:
    3 858
    J'aime reçus:
    0
    Non quand un blaireau viens ici avec cette arrière pensée que l'on voit dans cet autre forum et signé de ta main :

    Je m'y suis donc pris à google après tout, pourquoi pas. Je me suis dit : "ba tiens, tant qu'à faire, autant le faire sur un site qui idolatre google", c'est plus marrant

    C'est qui le pathétique ? Tu te prends pour qui pour porter un tel jugement de valeur sur WRI "forum idolatre" ?
    Tu as vu que tu ne sais même pas écrire en français ?

    Je m'y suis donc pris à google


    :lol: :lol:
     
  74. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    Ca te dérange qu'on dise que Google n'est plus ce qu'il était et gonfle plus ou moins artificiellement ces infos ? :eek:

    Je comprends pas où est le problème... Pourquoi tu réagis comme ça ?
     
  75. MagiX
    MagiX WRInaute impliqué
    Inscrit:
    10 Janvier 2003
    Messages:
    545
    J'aime reçus:
    0
    Ca devient chaud ici ... 8)

    En tous cas : @Rano est un grand malin ; avec ce topic, son site aura été pas mal visité. Pardon de ne pas avoir été du nombre : le fond du problème ne m'interesse pas. :roll:

    A topic gâché 1/2, je poste juste pour voir mon "grade" avec les nouvelles normes du Maître des lieux :lol:
     
  76. @Rano
    @Rano WRInaute discret
    Inscrit:
    10 Janvier 2003
    Messages:
    93
    J'aime reçus:
    0
    du visiteur webmaster, ca sert pas à grand chose :eek:
     
  77. tonguide
    tonguide WRInaute passionné
    Inscrit:
    28 Novembre 2003
    Messages:
    1 169
    J'aime reçus:
    0
    c'est ce que j'allais dire, un site de voyages avec des webmaster, super cool, mais l'intéret j'le vois pas lol t'aurai du faire tes tests ac un site ciblé référencement lol
     
Chargement...
Similar Threads - Google ridicule référencement Forum Date
Officiel : Google va tenir compte (2021) de l'expérience utilisateur Référencement Google Hier à 09:55
Google Analytics : Utilisateurs > différence entre Sommes Graphique /normale Débuter en référencement Lundi à 20:30
Search Console URL canonique déclarée pas la même que celle de Google Crawl et indexation Google, sitemaps Lundi à 16:03
Clic frauduleux sur Google Ads AdWords 19 Mai 2020
Déréférencer les archives des pages dans Google ? Référencement Google 19 Mai 2020
Google ne revient pas sur mon site Problèmes de référencement spécifiques à vos sites 16 Mai 2020
Connexion via comptes Google et Facebook Développement d'un site Web ou d'une appli mobile 15 Mai 2020
Suffixe "Ajouté par" dans les résultats Google Référencement Google 12 Mai 2020
GoogleMyMap Avertissement de redirection YouTube, Google Images et Google Maps 6 Mai 2020
Mise à jour Google Mai 2020 Core Update [officiel] Référencement Google 5 Mai 2020
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice