Visite de Wget sur mon site : risques ? moyen de se défendre ?

Discussion dans 'Demandes d'avis et de conseils sur vos sites' créé par WebmasterCommunity, 3 Décembre 2008.

  1. WebmasterCommunity
    WebmasterCommunity Nouveau WRInaute
    Inscrit:
    30 Août 2006
    Messages:
    45
    J'aime reçus:
    0
    Visite de Wget sur mon site : risques ? moyen de se défendre

    Bonjour,

    je regarde mes stats ce matin et je découvre qu'un robot nommé Wget a rendu une petite visite (1 hit) à mon site, OVH (mon hébergeur) m'indique qu'il s'agit d'un aspirateur 8O :evil:

    J'ai donc recherché un peu le net et effectivement il s'agit bien d'un aspirateur de site RE 8O :evil:

    J'ai deux questions :

    - c'est grave docteur ? est ce que cela veut dire : DANGER :!: mon site va se retrouver totalement copié, piraté, vandalisé, massacré.... en bref : quels sont les risques réels face à une telle visite ?

    - S'il existe de réels risques, quels sont les moyens pour remonter à la source, détecter la mise en ligne du contenu aspiré, retrouver le type qui a fait ça pour lui... (je vous laisse imaginer :twisted: )

    Merci pour votre aide.
     
  2. Greendog
    Greendog WRInaute occasionnel
    Inscrit:
    18 Mars 2008
    Messages:
    437
    J'aime reçus:
    0
    Si les robots qui accèdent à mes pages ne sont pas dans ma 'liste verte' ils sont bloqués.
    Pas de question à ce poser comme ça. :wink:
     
  3. WebmasterCommunity
    WebmasterCommunity Nouveau WRInaute
    Inscrit:
    30 Août 2006
    Messages:
    45
    J'aime reçus:
    0
    Merci pour ta réponse mais cela ne m'aide pas beaucoup.
    Es-tu chez OVH ? si oui, il faut aller où dans le manager pour créer cette fameuse "liste verte", j'ai beau chercher, je trouve rien qui correspond.

    Sinon, c'est grave ? il faut vraiment que je m'inquiète ?
     
  4. BadProcESs
    BadProcESs WRInaute passionné
    Inscrit:
    28 Juillet 2003
    Messages:
    1 821
    J'aime reçus:
    0
    Attention, Wget est certe un robot, mais il est souvent utilisé par l'équivalent de la CRONTABLE Unix sur les serveurs Windows pour les tâches récurrentes (c'est le cas sur mon mutu).
     
  5. webmaster93
    webmaster93 Nouveau WRInaute
    Inscrit:
    3 Octobre 2008
    Messages:
    1
    J'aime reçus:
    0
    :!: Moi aussi j'ai eu la surprise (désagréable) de constater le passage de 2 aspirateurs de site : Wget et Curl.

    Les solutions anti-aspirateurs sont contraignantes et j'ai peur que Google soit bloqué...

    Mais quels sont les réels dangers ? A l'heure de l'adsl illimité, pourquoi aspirer un site ? La copie, télécharger des fichiers d'un coup, récupérer les codes sources ?

    Que pensent les webmasters expérimentés de ces visites "peu courtoises" ?
     
  6. ecocentric
    ecocentric WRInaute accro
    Inscrit:
    10 Février 2004
    Messages:
    2 653
    J'aime reçus:
    0
    Tout dépend de l'usage. Si c'est à dose raisonnable, pour faire de la veille et RSSiser des contenus partiels, why not...
     
  7. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 274
    J'aime reçus:
    0
    faire un mfa sans travailler...
    et après, ton site disparait dans les profondeurs du classement pour duplicate content :twisted:
     
  8. CristianPF
    CristianPF Nouveau WRInaute
    Inscrit:
    12 Septembre 2009
    Messages:
    1
    J'aime reçus:
    0
    Salut,

    Rien de bien grave, surtout si ce n'est qu'une seul requête.
    J'utilise regulièrement wget pour télécharger les images d'un site, sans passer par un intrminable "Enregister sous".

    L'user agent peut-être modifier dans wget exemple :
    wget --user-agent="Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.1.4322)" http://www.SiteATelecharger.com

    Dans ce cas du côté serveur, il sera détecté en tant que Internet Explorer 6 et passera inaperçue.


    Il n'y a pas vraiment de parade pour bloquer un aspirateur de site. Chaque d'entre eux proposent beaucoup d'option pour justement passer inaperçue. Pour l'instant aucun site que j'ai voulu télécharger n'a posé de problème.
    Je pense que créer un scripte pour bloquer ce genre de logiciel est une perte de temps, et ne pourra, dans le meilleur des cas, que dissuader un débutant.
     
  9. Anto1982
    Anto1982 WRInaute passionné
    Inscrit:
    7 Mai 2009
    Messages:
    1 113
    J'aime reçus:
    0
    ça peut tout aussi bien être un aspirateur.... du type qui aspire ton site pour pouvoir simplement le regarder en local... Si si... certains ont encore des connections à 28Kb/s...
     
Chargement...
Similar Threads - Visite Wget risques Forum Date
Avis d'hébergeur web pour 15.000 visites/jour Administration d'un site Web 4 Juin 2022
Problème avec GA4 : nb de visiteurs temps réel et par jour Google Analytics 19 Avril 2022
Plus aucune visite depuis Bing Référencement Bing 12 Avril 2022
Pages de mon site indexées mais très peu de visites Problèmes de référencement spécifiques à vos sites 15 Janvier 2022
Connaitre le nombre de visiteurs uniques Google Analytics 11 Décembre 2021
google renvoie mes visiteurs sur un autre site Problèmes de référencement spécifiques à vos sites 10 Octobre 2021
Beaucoup d'articles et seulement 12 visites/jour Problèmes de référencement spécifiques à vos sites 25 Juin 2021
Google Analytics : avec quels mots-clés les visiteurs sont-ils arrivés ? Débuter en référencement 8 Avril 2021
Regrouper dans Analytics les visites de pages AMP/Non-AMP Google Analytics 14 Mars 2021
Astuce [PHP] Récolter ville, pays du visiteur Développement d'un site Web ou d'une appli mobile 9 Mars 2021
Site pour obtenir des visites humaines Annuaires et moteurs 6 Février 2021
Blocage d'un visiteur via le fichier .htaccess URL Rewriting et .htaccess 5 Janvier 2021
Analyser les visites sur un article par heures sur la journée ? Google Analytics 20 Octobre 2020
Explosion visites via Google Référencement Google 10 Octobre 2020
Exclure le trafic des visiteurs qui viennent pour se connecter à "Mon Compte" Google Analytics 25 Mai 2020
Visites sur mon site Demandes d'avis et de conseils sur vos sites 23 Mars 2020
Quel Id de visiteur sans adresse ip ? Développement d'un site Web ou d'une appli mobile 17 Mars 2020
Récurvisité et arguments. Développement d'un site Web ou d'une appli mobile 8 Février 2020
IP 0.0.0.0 en visites sur le site Crawl et indexation Google, sitemaps 30 Janvier 2020
Google image et visite sur son site YouTube, Google Images et Google Maps 2 Janvier 2020