QuepasaCreep : un robot bugué ?

Discussion dans 'Autres moteurs de recherche connus' créé par WebRankInfo, 29 Mai 2003.

  1. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 133
    J'aime reçus:
    350
    QuepasaCreep génère tout un tas d'erreurs 404 en venant indexer des pages dont l'URL est tronquée : il manque le 'm' de 'htm'.
    Exemple parmi tant d'autres :
    Code:
    forums/viewpost_9093.ht
    Je vais finir par l'interdire...
    Le voyez-vous sur vos sites ?
     
  2. Nitou
    Nitou WRInaute impliqué
    Inscrit:
    1 Décembre 2002
    Messages:
    696
    J'aime reçus:
    0
    Non et tant mieux :p
     
  3. Gautier_Girard
    Gautier_Girard Nouveau WRInaute
    Inscrit:
    24 Mai 2003
    Messages:
    46
    J'aime reçus:
    0
    Bonjour,

    Oui il a fait plusieurs apparitions cette semaine et la semaine dernière. Nous allons également le bannir : il n'est pas très poli en pompant bien comme il faut, et il génère les erreurs que tu évoques.

    De plus, personne ne sait précisément à quoi il va vraiment servir.
     
  4. cariboo
    cariboo WRInaute impliqué
    Inscrit:
    8 Février 2003
    Messages:
    600
    J'aime reçus:
    0
    Oui, nous sommes victimes aussi :
    3 IP différentes
    QuepasaCreep v0.9.13 69.28.130.229 2003/05/27 05:01 69.28.130.229
    QuepasaCreep v0.9.13 69.28.130.230 2003/05/27 02:58 69.28.130.230
    QuepasaCreep v0.9.13 69.28.130.231 2003/04/29 21:12 69.28.130.231

    Pas d'erreurs 404... il doit préférer les pages avec extension .php... Par contre il crawle de manière anarchique...

    QuepasaCreep est un nouvel avatar du moteur de recherche de Quepasa.com, le site leader aux USA pour les hispaniques. Le moteur avait été abandonné, mais visiblement,ils ont relancé l'idée récemment.

    Il semble que cela soit une suite du rachat du moteur vayala.com par QuePasa. Une acquisition mal digérée ?

    Le truc bizarre, c'est que nos sites ne sont pas en español ? Que pasa, hombre ?
     
  5. Jocelyn
    Jocelyn WRInaute occasionnel
    Inscrit:
    6 Novembre 2002
    Messages:
    382
    J'aime reçus:
    0
    Ca me rappelle Scooter qui avait fait la même chose sur mon site il n'y a pas très longtemps...
    Je viens de voir QuePasaCreep dans mes logs : il est passé hier matin et n'a demandé que le fichier robots.txt et la page d'accueil.
    Pas d'erreur dans les requêtes :lol:

    Jocelyn
     
  6. Kmacleod
    Kmacleod WRInaute passionné
    Inscrit:
    28 Novembre 2002
    Messages:
    2 467
    J'aime reçus:
    0
    Voila Quepasa sur mon site, il vient d'indexer deux pages
    Je ne sais pas d'où il arrive ni ce qu'il vient voir, je ne parle pas espagnol.

    Y a t'il des retours interessants avec ce moteur ou faut il l'arreter ?

    kmacleod
     
  7. BadProcESs
    BadProcESs WRInaute passionné
    Inscrit:
    28 Juillet 2003
    Messages:
    1 841
    J'aime reçus:
    0
    C'est vrai qu'il a un comportement plus que bizarre ce robot, 6 lecture de default.asp + 4 de robots.txt en 1/4h, c'est étrange...
     
  8. Remi L.
    Remi L. WRInaute impliqué
    Inscrit:
    6 Septembre 2003
    Messages:
    909
    J'aime reçus:
    0
    Pas vraiment étrange, en ce qui me concerne.
    Il est passé dans la journée du 17, m'a lu presque tout le site.

    A part le fait qu'il relise robots.txt tous les 3 fichiers, il me paraît très bien élevé ce garçon.
    Je ne pense pas qu'il y ait lieu de le bloquer.
     
  9. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 133
    J'aime reçus:
    350
    il vient de me générer plus de 700 erreurs 404 en quelques heures...
    il vient voir des pages en oubliant les répertoires (il cherche tout à la racine) ou alors même des pages qui n'ont jamais existé sur mon site...

    ce qui est bizarre c'est que même avec ça dans mon .htaccess :
    Code:
    RewriteCond %{REMOTE_ADDR} ^63\.148\.99\.233$ [OR]
    RewriteCond %{REMOTE_ADDR} ^81\.56\.23\.23$ [OR]
    RewriteCond %{REMOTE_ADDR} ^69\.28\.130\.230$ [OR]
    RewriteCond %{REMOTE_ADDR} ^213\.244\.29\.170$
    RewriteRule .* - [F,L] 
    
    il passe quand même avec l'adresse 69.28.130.230. J'ai mal écrit ma condition RewriteCond ?
     
  10. Remi L.
    Remi L. WRInaute impliqué
    Inscrit:
    6 Septembre 2003
    Messages:
    909
    J'aime reçus:
    0
    C'est vrai que je retire ce que j'ai dit à son sujet : il n'arrête pas de générer des erreurs depuis 3 mois, il oublie les répertoires, il éclate les url et se met à chercher /& par exemple ou encore /mailto:...

    Pour le bloquer, tu peux peut-être utiliser 'deny' qui est toujours plus rapide à exécuter que le rewriting.
    Par contre, c'est vrai que ta condition devrait marcher.
     
  11. Americas
    Americas WRInaute accro
    Inscrit:
    24 Septembre 2003
    Messages:
    2 586
    J'aime reçus:
    0
    Pero qué pasa ? :roll: quepasa pasa sobre mi sitio y de manera intensiva esos últimos días... debe ser porque hablamos el mismo idioma :lol:

    Bon... trêve de plaisanterie... il passe beaucoup chez moi... on dirait qu'il a la fringale... mais pas autant que msnbot qui semble vouloir avaler tout ce qu'il trouve 8O
     
Chargement...
Similar Threads - QuepasaCreep robot bugué Forum Date
Search Console Prestashop | Robot.txt bloque des URL mais Outil de test du fichier robots.txt l'Authorise... Crawl et indexation Google, sitemaps 21 Novembre 2019
Search Console Site FR en attente de Multilangue + syntaxe Robot.txt Référencement international (langues, pays) 5 Novembre 2019
Search Console Images bloquées ... malgré absence de robots.txt Crawl et indexation Google, sitemaps 31 Octobre 2019
Aide sur le format de mon fichier robots.txt Crawl et indexation Google, sitemaps 25 Octobre 2019
Problèmes d'indexation et robots.txt Crawl et indexation Google, sitemaps 14 Octobre 2019
Réécriture et robots.txt Débuter en référencement 10 Octobre 2019
Page de test et fichier Robots.txt Crawl et indexation Google, sitemaps 9 Octobre 2019
Robots.txt et test url Crawl et indexation Google, sitemaps 9 Octobre 2019
Page d'accueil non indexée ? Conflit avec robots.txt Crawl et indexation Google, sitemaps 2 Octobre 2019
robots.txt pour site multilangue Crawl et indexation Google, sitemaps 1 Octobre 2019
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice