Requêtes suspectes Safari / Desktop

WRInaute occasionnel
Salut,

Ce n'est pas un problème, mais j'aurais voulu savoir si quelqu'un avait une idée de ce que ça peut être.

Depuis hier, j'ai noté un nombre anormalement élevé de visites qui s'identifient comme Safari sur ordinateur de bureau.

J'ai donc mis mon captcha maison sur ce genre de requêtes, et absolument aucun de ces "visiteurs" n'a répondu au captcha ou même essayé.

Ce ne sont donc pas de "vrais" visiteurs.

Ce sont des requêtes qui proviennent exclusivement d'adresses IP résidentielles. Il y en a des centaines différentes, jamais deux fois la même en 24 heures.

Les requêtes sont fréquentes, mais pas tant que cela, 2 ou 3 par minute.

Les UA sont correctement formatés, avec du Safari 18 et 26, et s'identifiant exclusivement comme provenant d'ordinateurs de bureau (pas de mobile). Je trouve cela curieux, car c'est encore plus suspect que si ça prétendait venir d'un iPhone (usage beaucoup plus populaire), par exemple.

Les seules choses qui peuvent être incohérentes, ce sont que ces requêtes sont faites en HTTP/2 alors qu'un visiteur "normal" utilisant Safari accède à mon site en HTTP/3, et annoncent supporter zstd alors qu'à ma connaissance, c'est uniquement expérimental sur Safari.

Code:
HTTP_ACCEPT_ENCODING : zstd,gzip,deflate,br
HTTP_PRIORITY        : u=0, i
HTTP_ACCEPT_LANGUAGE : en-US,en;q=0.9
HTTP_SEC_FETCH_MODE  : navigate
HTTP_SEC_FETCH_SITE  : none
HTTP_ACCEPT          : text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
HTTP_USER_AGENT      : Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/26.0 Safari/605.1.15
HTTP_SEC_FETCH_DEST  : document

Je n'ai pas identifié d'autres requêtes suspectes qui utiliseraient d'autres UA.

Maintenant, j'essaie de comprendre ce que ça peut être.
 
Dernière édition:
WRInaute passionné
Ce sont des requêtes qui proviennent exclusivement d'adresses IP résidentielles. Il y en a des centaines différentes, jamais deux fois la même en 24 heures.
Les requêtes sont fréquentes, mais pas tant que cela, 2 ou 3 par minute.
J'ai le cas aussi, mais les "pièges" mis ne révèlent pas grand chose, comme toi. Les IP semblent légitimes de réseaux résidentiels, mais évidemment, aucune française. Le Language est bien indiqué, pas détecté comme Robot, etc. Bref, difficile à traquer.

Il est possible que ce soit un générateur IA intégré dans le navigateur.
 
WRInaute occasionnel
Une fonctionnalité IA, un pré-chargement, un aperçu, etc. C'est pour ça que je demandais, au cas où quelqu'un serait au courant d'une nouvelle fonctionnalité de Safari.

Cependant, ce qui m'intrigue, c'est l'annonce du accept_encoding de zstd, alors que Safari ne le supporte pas (encore). Sauf si une version très récente de Safari l'a activé.
 
WRInaute accro
J'ai eu le cas il n'y a pas si longtemps avec une flopée d'IP "résidentielles" du Brésil :) et du coup, j'ai terminé par bloquer directement le code du pays. Et ensuite, ça a basculé sur les autres pays d'Amérique du Sud. Bref, au final, j'ai taillé à la hache du code ISO.
 
WRInaute occasionnel
Pour ma part, c'était bien des IPs résidentielles UK/UK (le cœur de cible de mon site). Des IPs de fournisseurs d'accès classiques dans ces pays.
 
WRInaute impliqué
Pour ma part, c'était bien des IPs résidentielles UK/UK (le cœur de cible de mon site). Des IPs de fournisseurs d'accès classiques dans ces pays.
Ok, mais les bots peuvent aussi avoir des IP de FAI.
Comme tu ne parles pas d'attaque, c'est possiblement du scrapping.
Des sociétés proposent des API avec des IP résidentielles pour éviter d'être bloquées, par exemple ScrapAPI... c'est même le titre principal de leur page d'accueil : "Residential Proxies For Web Scraping".
 
WRInaute discret
Avec l’IA et l’automatisation, est-ce qu’on ne voit pas émerger un nouveau modèle hybride pour le scraping et l’alimentation de datasets ? Comme c'est encore le cas de fermes à clics ou de faux avis google?
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut