FullFlash + Robots.txt + PHP = Cloaking ?

Discussion dans 'Référencement Google' créé par chugulu, 18 Octobre 2006.

  1. chugulu
    chugulu Nouveau WRInaute
    Inscrit:
    25 Mars 2006
    Messages:
    2
    J'aime reçus:
    0
    Bonjour,

    Je travaille actuellement sur un projet de site qui doit être en Full-Flash et qui utiliserait une base MySQL.
    Afin d'optimiser son référencement, je pensais pouvoir utiliser la combine Robots.txt pour orienter le Googlebot vers une 2eme version du site en PHP qui reprendrait l'intrégralité du contenu proposé dans le Flash. Ce 2eme site ne serait accessible que pour le Googlebot.

    On m'a dit que cette technique pourrait être apparentée à du cloaking.
    Est-ce que vous confirmez ?

    Merci d'avance pour votre aide.

    G!
     
  2. effisk
    effisk WRInaute occasionnel
    Inscrit:
    18 Juin 2004
    Messages:
    488
    J'aime reçus:
    0
    Comment cette version ne serait-elle accessible qu'à googlebot ? Si c'est en mettant un lien un peu caché sur ta page, ce n'est pas du cloaking. Si c'est en présentant une page à gogolebot contenant ce lien, et un page ne contenant pas le lien au visiteur lambda, c'est effectivement du cloaking.

    Deuxième question, une fois les pages du site en php indexées dans gogole, qu'arrive-t-il à l'internaute qui clique sur un lien vers ton site ?
    est-il redirigé vers la version flash, ou voit-il la version présentée à googlebot ? réponse 1: c'est du cloaking, réponse 2, ce n'est pas du cloaking.

    Il n'y a pas de combine "robots.txt".

    Je ne comprends pas qu'on choississe une techno non indexable et qu'on ne l'assume pas.

    Si tu veux absolument que le site soit indexé, tu fais un site indexable.

    Le flash c'est bien pour tout ce qui est graphique, mais il est possible de faire des pages au contenu mixte, qui leur permettrait d'être très correctement indexées par les moteurs.

    Coller du contenu de valeur dans du flash, c'est une erreur. Faire un doublon de ton site en php, c'est également une erreur. Après, je comprends qu'on doive parfois se plier aux demandes du client quand celui-ci refuse de comprendre que full flash et indexation ne vont pas de pair... dans ce cas, la moins mauvaise solution est de faire un site en flash, et un autre en php, tout en sachant que la grande majorité des visiteurs ne verront que le site en php car ils viendront des moteurs, et qu'ils seront très frustrés lors de leur deuxième visite (après avoir retenu le nom de domaine) de ne pas rertouver les pages qu'ils auront vu lors de leur première visite...

    En tout état de cause, le cloaking n'est pas recommandé.
     
  3. Seb42
    Seb42 Nouveau WRInaute
    Inscrit:
    14 Mai 2006
    Messages:
    35
    J'aime reçus:
    0
    Ah bon ? Pourquoi dans ce cas ton robots.txt n'est accessible qu'au UA Googlebot ?

    Edit: L'idéal est de faire une alternative à flash dans ta page html ou de faire carrement un version html du site.
     
  4. effisk
    effisk WRInaute occasionnel
    Inscrit:
    18 Juin 2004
    Messages:
    488
    J'aime reçus:
    0
    super.
    Quel est l'intérêt exactement de rendre son robots.txt accessible uniquement à googlebot ?

    Quand je me balade sur un site, je me fous pas mal de savoir ce qu'il y a dans le robots.txt, alors si google a indexé une page dont l'url n'est "trouvable" que via le robots.txt, quand je clique sur le lien de la page de résultats google, je tombe sur le résultat, et donc sur la page en question, basta.

    Le robots.txt est à l'attention des... robots, quand on veut autoriser google et pas msn par exemple.
    chugulu parle de google, mais ce qu'il dit est fort probablement applicable à tous les moteurs, puisqu'il cherche clairement à ce que son site soit visible sur le net, pourquoi se limiter à google ? aucun intérêt.

    D'autre part, google n'a aucun intérêt à indexer une page qui n'est accessible qu'en allant visiter le robots.txt ; je doute fort qu'on tombe une des ces pages lors d'une recherche.

    Bref, il n'y a pas de combine "robots.txt", le cloaking c'est mal, et dupliquer un site flash en php est une bidouille.
     
  5. Seb42
    Seb42 Nouveau WRInaute
    Inscrit:
    14 Mai 2006
    Messages:
    35
    J'aime reçus:
    0
    Oui mais tu dois néanmoins reconnaitre que tu cloak ton robots.txt sur l'ua et que c'est faisable ...

    maintenant l'intéret n'est pas si grand dans le cas présent de faire du cloaking...

    Edit: ton robots.txt n'est plus cloaker dsl j'viens de regarder
     
  6. spationaute-troglodyte
    spationaute-troglodyte WRInaute occasionnel
    Inscrit:
    11 Juin 2006
    Messages:
    286
    J'aime reçus:
    0
    Peux tu un peu plus préciser?
    je ne comprends pas trop pourquoi tu veux lui présenter un robots.txt différent?

    Tu veux cloacker msn et yahoo mais pas google, ou bien? :?
     
  7. effisk
    effisk WRInaute occasionnel
    Inscrit:
    18 Juin 2004
    Messages:
    488
    J'aime reçus:
    0
    Seb42, le robots.txt du site que j'ai en signature n'a jamais été cloaké.

    Spationaute, il n'y a aucun intérêt à présenter un robots.txt différent ici.

    Je suppose que l'intervenant initial ne savait pas trop de quoi il parlait, et il allait juste à la pêche...
     
  8. spationaute-troglodyte
    spationaute-troglodyte WRInaute occasionnel
    Inscrit:
    11 Juin 2006
    Messages:
    286
    J'aime reçus:
    0
    entre faire un robots.txt avec une spécification du useragent pour chaque moteur à qui on veut faire un "chemin" différent, je prefere cloacker, c'est moins louche

    http://www.exalead.fr/robots.txt ca c'est trop flag par exemple
     
  9. effisk
    effisk WRInaute occasionnel
    Inscrit:
    18 Juin 2004
    Messages:
    488
    J'aime reçus:
    0
    bof.

    Suffit de changer de user agent pour repérer la supercherie. En plus, qui te dit que le bot chargé de checker le robots.txt chez google s'appelle aussi googlebot ? :lol:

    Après tout, ils peuvent très bien utiliser un bot qui se fasse passer pour IE, ça ne pose pas de problème tant qu'il ne fait que checker le fichier robots.txt...

    Tiens, le dernier bot qui est passé sur mes page, c'est justement "Mediapartners-Google"... depuis qu'on ne sait plus trop qui fait quoi chez google, c'est peut-être lui qui est venu récupérer mon robots.txt, et si j'ai cloaké sur du "googlebot", c'est mort... :wink:
     
  10. spationaute-troglodyte
    spationaute-troglodyte WRInaute occasionnel
    Inscrit:
    11 Juin 2006
    Messages:
    286
    J'aime reçus:
    0
    enfin cloacker sur le useragent c'est bidon aussi
    Et oui, pour auditer mes robots.txt, c'est bien mélangé chez google, le caching proxy c'est en route
     
  11. pocketmofo
    pocketmofo Nouveau WRInaute
    Inscrit:
    7 Septembre 2006
    Messages:
    6
    J'aime reçus:
    0
    Salut fait gaffe quand meme, google blackliste directement le domaine et les sous domaines.


    Dans tous les cas il ne faut pas te fier au robots.txt pour detecter google.


    Ensuite si tes pages cloakées contiennent du texte optimisé et qu'un utilisateur tape ce texte. Les textes de descriptions de google contiendront ce texte et non pas tes meta descriptions.


    La regle de base étant de ne pas laisser l'utilisateur sur ta page cloakée => redirection immédiate.



    Dans ton cas il y a des méthodes SIMPLES qui permettent de ne pas tomber dans la catégorie "cloaker" : il s'agit du Javascript.


    Tu charges une version texte de ta page propre qui est remplacé dynamiquement par tes appli flash.

    Je crois que ca s'appelle le "cifr" ou un truc comme ca et ca existe depuis très longtemps.

    A chaque fois que je passe sur ce forum, je m'apercois que les utilisateurs ont bien 10 ans de retard sur le reste des webmasters.
     
  12. effisk
    effisk WRInaute occasionnel
    Inscrit:
    18 Juin 2004
    Messages:
    488
    J'aime reçus:
    0
    lol.

    Y'en a qui ont internet ici ?
     
Chargement...
Similar Threads - FullFlash Robots PHP Forum Date
Audit SEO : questions techniques sur robots.txt Demandes d'avis et de conseils sur vos sites 19 Septembre 2022
Page de Login et fichier Robots.Txt Débuter en référencement 11 Septembre 2022
Duplicate content "?p=..." et robots.txt Crawl et indexation Google, sitemaps 7 Septembre 2022
Meta robots noindex WordPress Problèmes de référencement spécifiques à vos sites 9 Août 2022
robots.txt bloque l'accès à mon site par Google Débuter en référencement 7 Juillet 2022
Pourquoi ne pas utiliser le robots.txt pour interdire l'indexation ? Débuter en référencement 14 Avril 2022
canonical et robots=index sur une même page Débuter en référencement 7 Décembre 2021
le noindex dans le robots.txt Débuter en référencement 19 Novembre 2021
suppression des pages bloquées par robots.txt Débuter en référencement 18 Octobre 2021
Faut-il déclarer le sitemap dans le robots.txt ou search console ? Crawl et indexation Google, sitemaps 14 Juillet 2021
Les mots-clés de mon site ne sont pas détectés par les robots de référencement Problèmes de référencement spécifiques à vos sites 7 Juillet 2021
Wordpress et le robots.txt Débuter en référencement 21 Juin 2021
Search Console noindex détecté dans la balise Meta robots Débuter en référencement 21 Mai 2021
Urls filtrées indexées et crawl robots.txt Crawl et indexation Google, sitemaps 19 Mai 2021
Robots : n'autoriser que les 4 ou 5 moteurs de recherche principaux Crawl et indexation Google, sitemaps 15 Janvier 2021
erreurs robots.txt Crawl et indexation Google, sitemaps 23 Décembre 2020
Google me dit que ma page est bien indexée mais bloquée par robots.txt Crawl et indexation Google, sitemaps 25 Novembre 2020
Faut-il déclarer le sitemap dans le robots.txt ou search console ? Crawl et indexation Google, sitemaps 17 Octobre 2020
Urls orphelines crawlées par Google + Robots.txt ? Crawl et indexation Google, sitemaps 3 Avril 2020
Robots.txt du site Kayak Débuter en référencement 11 Mars 2020