Qwant : une étude du crawl

Discussion dans 'Autres moteurs de recherche connus' créé par emualliug, 7 Juillet 2020.

  1. emualliug
    emualliug WRInaute discret
    Inscrit:
    1 Février 2020
    Messages:
    167
    J'aime reçus:
    32
    Afin de bien suivre la manière dont un site est indexé, j'ai ajouté quelques lignes de code pour détecter le passage des crawler et les enregistrer. Rien de bien sorcier, filtrage suivant le useragent, et si ça répond à un motif, sauvegarde dans une base de donnée.

    Je me suis particulièrement intéressé à googlebot, bingbot, yandexbot, qwantify/bleriot, et plus récemment petalbot. Ce qui m'a surpris, c'est que, entre le 1er janvier et le 30 juin 2020, je n'ai pas détecté sur ce site un seul passage de Qwantify / Bleriot.

    L'hypothèse est que Qwant n'a effectué aucune indexation sur au moins six mois.

    Plusieurs contre-hypothèses :

    1/ Il est possible que j'identifie mal les crawlers par une erreur quelconque dans le script.
    C'est toutefois peu probable (en utilisant un useragent switcher, le script fonctionne bien), et l'examen aléatoire des logs ne me laisse pas voir un passage du robot d'indexation de Qwant que le script aurait omis. En outre, et par un autre mécanisme, j'enregistre les useragent accédant à robots.txt ; sur la même période "Mozilla/5.0 (compatible; Qwantify/Bleriot/1.1; +https://help.qwant.com/bot)" n'a consulté qu'une seule fois robots.txt.

    2/ J'aurais, par inadvertance, bloqué Bleriot dans robots.txt.
    C'est également peu probable, robots.txt est très simple, ni Qwantify ni Bleriot n'y sont mentionnés.

    3/ Qwant ignore l'existence de ce site.
    C'est une hypothèse que j'écarte également. Qwant m'apporte quelques visites (0,2 % sur la période considérée, ce qui est toutefois sensiblement inférieur à la moyenne française qui est aux alentours de 0,8 % d'après StatCounter). En outre, je l'indiquais sur un autre fil, Qwant vient régulièrement récupérer une favicon (au cours d'un procédé étonnant d'ailleurs) et finit par récupérer celle dont l'adresse figure dans le <head> (il a donc indexé certaines pages, avant la mise en place de la surveillance).

    J'en reviens donc à l'hypothèse de base : Qwant n'a effectué aucune indexation du site pendant au moins six mois.
    Il est à noter que Qwant a renvoyé des internautes vers le site en question, sur des pages qu'il n'avait pas indexé (ce qui me laisse supposer qu'il a utilisé le contenu de l'index de Bing).

    La pertinence des résultats de Qwant fait parfois l'objet de vives critiques. Le crawl seul ne fait pas la qualité d'un moteur de recherche, mais à défaut de crawl efficace, je ne vois pas comment le résultats pourraient être justes. Pour avoir une idée, en comparaison, PetalBot, sur le seul mois de juin a crawlé 423 pages sur le même site. Sur l'ensemble de la période de six mois, Bingbot et GoogleBot ont chacun crawlé environ 3300 pages.

    Il faut toutefois relativiser la portée de ce test. Il n'a été conduit que sur un seul site, d'une audience modérée (environ 8000 visites sur la période considérée).
     
  2. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 691
    J'aime reçus:
    439
    conclusion : comme en 2013 (sic), on se demande comment Qwant peut être considéré comme un moteur de recherche.

    Les SEO demandent d'abord à voir le crawler.
    Ensuite, à comprendre les critères de l'algo.
    Enfin, à optimiser leurs pages.

    on n'a pas avancé de l'étape 1...
     
  3. Furtif
    Furtif WRInaute accro
    Inscrit:
    9 Août 2005
    Messages:
    2 749
    J'aime reçus:
    218
    Qwant ? c'est quoi ?
     
    yule apprécie ceci.
  4. yule
    yule WRInaute occasionnel
    Inscrit:
    24 Juillet 2004
    Messages:
    364
    J'aime reçus:
    18
    Copperfield ne faisait pas des tours aussi long !!!!
     
  5. sypsyp
    sypsyp WRInaute occasionnel
    Inscrit:
    10 Juillet 2009
    Messages:
    270
    J'aime reçus:
    2
  6. emualliug
    emualliug WRInaute discret
    Inscrit:
    1 Février 2020
    Messages:
    167
    J'aime reçus:
    32
  7. sypsyp
    sypsyp WRInaute occasionnel
    Inscrit:
    10 Juillet 2009
    Messages:
    270
    J'aime reçus:
    2
    je veux bien en DM l'url alors, on a crawlé 1,5 milliards de sites c'est bizarre de ne pas l'avoir du tout.
     
Chargement...
Similar Threads - Qwant étude crawl Forum Date
Qwant, l'agonie.... Annuaires et moteurs 25 Mai 2020
Favicon dans Qwant Autres moteurs de recherche connus 13 Mai 2020
Qwant ads ? Débuter en référencement 10 Avril 2020
QWANT mars 2020 : index à nouveau périmé, liens 404, manipulation des résultats... Autres moteurs de recherche connus 5 Mars 2020
Une noble cause sur Qwanturank Le café de WebRankInfo 18 Février 2020
Résolu Indexation : Erreur 503 et Qwant Autres moteurs de recherche connus 16 Février 2020
Nouveau Forum Qwanturank Annuaires et moteurs 28 Décembre 2019
Concours Qwanturank sur Qwant Annuaires et moteurs 2 Décembre 2019
Qwant... fausses promesses... Autres moteurs de recherche connus 12 Juin 2019
Qwant Image Autres moteurs de recherche connus 6 Juin 2019
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice