Visites suspectes ? Jakarta Commons-HttpClient/3.0-rc3

Discussion dans 'Autres moteurs de recherche connus' créé par jlauriol, 9 Octobre 2005.

  1. jlauriol
    jlauriol Nouveau WRInaute
    Inscrit:
    6 Octobre 2004
    Messages:
    27
    J'aime reçus:
    0
    Bonjour,
    J'ai depuis quelques jours, des visites d'un robot (je pense) qui proviennent d'une tranche d'adresses. Seules les pages php sont visités (pas de hit sur les images ). Et les paramètres dans les URI semble être recomposés avec des erreurs sur l'interprétation des caractères spéciaux ( & transformé en amp ). La même URI peut être demandée plusieurs fois à quelques minutes d'intervalle.

    Code:
    Info DNS des visteurs :
    Meaningful Machines INAP-NYM-MEANMACHINE-0652 (NET-64-94-163-128-1) 
                                      64.94.163.128 - 64.94.163.159
    
    Agent : "Jakarta Commons-HttpClient/3.0-rc3"
    
    Dans les info DNS, j'ai donné la tranche IP, car j'ai effectivement la visite de chaque adresse de cette tranche !

    Avez vous une idée sur ce qui se cache derrrière tout ça ?
     
  2. hardmicro
    hardmicro WRInaute impliqué
    Inscrit:
    5 Octobre 2004
    Messages:
    966
    J'aime reçus:
    0
  3. jlauriol
    jlauriol Nouveau WRInaute
    Inscrit:
    6 Octobre 2004
    Messages:
    27
    J'aime reçus:
    0
    En effet la signature du robot présumé indique qu'il utilise un developpement employant l'API common-HttpClient de Jakarta. Et sans vouloir troller, il ne doit pas être developpé sous Windows (c'est déjà ça).
    Mais à part l'indication de la technologie utilisé et les traces dans les log assez discrètes, je ne sais rien d'autre sur ce visiteur, ni sur son but.
    N'avez vous pas remarqué sa précence sur vos sites ?
     
  4. hardmicro
    hardmicro WRInaute impliqué
    Inscrit:
    5 Octobre 2004
    Messages:
    966
    J'aime reçus:
    0
    non je n'ai jamaisvus ce truc la sur un de mes sites
     
  5. jlauriol
    jlauriol Nouveau WRInaute
    Inscrit:
    6 Octobre 2004
    Messages:
    27
    J'aime reçus:
    0
    Bon en suivant la piste j'arrive à : http://www.meaningfulmachines.com/index.htm

    Une boîte qui developpe des moteurs de recherche en langage naturel, et des outils de traduction :
    Pour info ils semblent utiliser xcat sur solaris x86, un outil de gestion de cluster.

    Mais rien sur l'utilisation des données, leur méthode de collecte, leur exploitation...

    Apparament mon site leur plait bien, avec plus de 8Mo de texte chaque jour, il auront de quoi chercher !
     
  6. afrolatino.net
    afrolatino.net WRInaute discret
    Inscrit:
    27 Mai 2004
    Messages:
    62
    J'aime reçus:
    0
    il tourne aussi regulierement sur mon site depuis quelque jour
    64.94.163.133
    Jakarta Commons-HttpClient/3.0-rc3
     
Chargement...
Similar Threads - Visites suspectes Jakarta Forum Date
Visites abondantes et suspectes Google Analytics 19 Mars 2015
IP 0.0.0.0 en visites sur le site Crawl et indexation Google, sitemaps 30 Janvier 2020
GG Analytics. Incohérence sur les visites des 30 derniers jours. Google Analytics 21 Novembre 2019
Testeur Neilpatel : nb de visites TRES différent de Google Analytics Référencement Google 18 Novembre 2019
Visites directes via OVH Google Analytics 3 Octobre 2019
Nouveaux utilisateurs + visites directes Google Analytics 30 Septembre 2019
C'est quoi ces visites ? Administration d'un site Web 27 Juillet 2019
pour des visites guidées animées Tests et études de cas 21 Juin 2019
Chute brutale de visites Débuter en référencement 25 Février 2019
Impact du nb de visites sur le référencement Référencement Google 16 Octobre 2018
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice