Distinguer un robot d'un utilisateur

Discussion dans 'Développement d'un site Web ou d'une appli mobile' créé par druidev, 28 Décembre 2006.

  1. druidev
    druidev Nouveau WRInaute
    Inscrit:
    16 Août 2006
    Messages:
    5
    J'aime reçus:
    0
    Bonjour à tous !

    Je recherche un moyen efficace de distinguer les robots de moteurs de recherche des utilisateurs. Tout ca sans intervention du visiteur (du style captcha), donc avec du code. J'ai essayé avec le user_agent, mais il me renvoit pour certains robots la meme chose que certains navigateurs (cf liste des user_agents).
    Connaissez-vous une méthode, la plus efficace possible ?

    Merci
     
  2. Szarah
    Szarah WRInaute accro
    Inscrit:
    22 Février 2006
    Messages:
    5 997
    J'aime reçus:
    1
    Il faudrait demander à un spécialiste du cloaking sur IP, par exemple.
    C'est pour quoi faire ?
     
  3. druidev
    druidev Nouveau WRInaute
    Inscrit:
    16 Août 2006
    Messages:
    5
    J'aime reçus:
    0
    C'est pour un site en Flash. En fait dans un souci de référencement, j'ai créé un plan du site similaire à l'organisation du flash. En arrivant sur ce plan, l'utilisateur doit être redirigé vers le site flash, alors que les moteurs doivent rester sur ce plan pour le parcourir via les liens hypertextes.
    D'où l'obligation de différencier efficacement les utilisateurs et les robots.
     
  4. hiha
    hiha WRInaute discret
    Inscrit:
    8 Mai 2006
    Messages:
    114
    J'aime reçus:
    0
    oui c'est tres utile, par exemple pour enlever les parametres de sessions pour les robots...
     
  5. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 274
    J'aime reçus:
    0
    sauf que les paramètres de sessions, il est aussi préférable de ne pas les avoir même pour les internautes.
    Déjà c'est pas bô et en plus pour bookmarker une url, c'est pas top vu que l'id de session n'existera plus lors du l'utilisation du bookmark
     
  6. Szarah
    Szarah WRInaute accro
    Inscrit:
    22 Février 2006
    Messages:
    5 997
    J'aime reçus:
    1
    Moui ...
    Si je comprends bien : cette page Plan du site sera donc référencée, elle apparaîtra dans les SERPs et l'internaute sera déçu s'il croyait se poser sur une bonne vieille page html/php ...
    Les moteurs n'aiment pas trop ça, je crois bien.
    Mais peut-être que je n'ai pas bien compris.
     
  7. hiha
    hiha WRInaute discret
    Inscrit:
    8 Mai 2006
    Messages:
    114
    J'aime reçus:
    0
    et pour tracer les visiteurs en cas de besoin, t'as une autre maniere de le faire sans recourir au parametres de sessions et au cookies (surtout quant ils sont obligatoires) ?
     
  8. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 274
    J'aime reçus:
    0
    il y a, heureusement, d'autres moyens de garder les paramètres de session que dans l'url :D
     
  9. hiha
    hiha WRInaute discret
    Inscrit:
    8 Mai 2006
    Messages:
    114
    J'aime reçus:
    0
    ton trucs risque d'etre consideré comme du spamindexing, je te conseille de mettre des liens (vers les pages en flash) en evidence sur le site au lieu de gerer les clients...
     
  10. hiha
    hiha WRInaute discret
    Inscrit:
    8 Mai 2006
    Messages:
    114
    J'aime reçus:
    0
    tu peux nous lancer un lien ou nous donner un des "autres moyens" pour le faire ? :wink:
     
  11. druidev
    druidev Nouveau WRInaute
    Inscrit:
    16 Août 2006
    Messages:
    5
    J'aime reçus:
    0
    Oui tu as raison, je ne me fais pas beaucoup d'illusions, mais bon j'ai voulu poser la question au cas où.
     
  12. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 274
    J'aime reçus:
    0
    http://www.phpsecure.info/v2/zone/pComment?d=1057322922
     
  13. rottman
    rottman WRInaute passionné
    Inscrit:
    6 Janvier 2004
    Messages:
    1 804
    J'aime reçus:
    0
    Tu peux cloaker en PHP via l'IP (si tu as une liste d'IP de bots à jour), sinon un cloak du type gethostbyaddr() fera l'affaire.
     
Chargement...
Similar Threads - Distinguer robot utilisateur Forum Date
Comment distinguer les robots des visiteurs ? Développement d'un site Web ou d'une appli mobile 24 Avril 2008
Distinguer le trafic Google News dans Analytics Débuter en référencement 21 Novembre 2018
► Une façon bien originale de se distinguer... ส็็็็็็็็ Référencement Google 5 Mai 2012
Distinguer l'internaute du GoogleBot Référencement Google 17 Décembre 2011
Distinguer répertoires virtuels et réels URL Rewriting et .htaccess 17 Décembre 2006
Distinguer un lien http:// dans une variable Développement d'un site Web ou d'une appli mobile 8 Juin 2006
quel outil permet de distinguer entre nouveaux et anciens? Problèmes de référencement spécifiques à vos sites 18 Septembre 2004
Audit SEO : questions techniques sur robots.txt Demandes d'avis et de conseils sur vos sites 19 Septembre 2022
Page de Login et fichier Robots.Txt Débuter en référencement 11 Septembre 2022
Duplicate content "?p=..." et robots.txt Crawl et indexation Google, sitemaps 7 Septembre 2022
Meta robots noindex WordPress Problèmes de référencement spécifiques à vos sites 9 Août 2022
robots.txt bloque l'accès à mon site par Google Débuter en référencement 7 Juillet 2022
Problème : Google Crawl et Index des pages en No Index et bloqué par le robot.txt Crawl et indexation Google, sitemaps 26 Avril 2022
Pourquoi ne pas utiliser le robots.txt pour interdire l'indexation ? Débuter en référencement 14 Avril 2022
canonical et robots=index sur une même page Débuter en référencement 7 Décembre 2021
le noindex dans le robots.txt Débuter en référencement 19 Novembre 2021
suppression des pages bloquées par robots.txt Débuter en référencement 18 Octobre 2021
Faut-il déclarer le sitemap dans le robots.txt ou search console ? Crawl et indexation Google, sitemaps 14 Juillet 2021
Les mots-clés de mon site ne sont pas détectés par les robots de référencement Problèmes de référencement spécifiques à vos sites 7 Juillet 2021
Wordpress et le robots.txt Débuter en référencement 21 Juin 2021