Augmentation du trafic

WRInaute discret
Oui, j'ai vu ça aussi, sur différents sites, il y a pas mal de changement dans les serps. J'ai l'impression que ca ressemble a du penguin !
Il y a sur certains mots clés conccurentiels plus de diversité, forum, site, annuaire, etc... depuis ce matin.
 
WRInaute passionné
Vous avez bien de la chance de noter de telles différences sur une demi journée, espérons que cela durera pour vous, moi j'ai regardé du coup et je ne vois rien de spectaculaire, la routine :-)
 
Olivier Duffez (admin)
Membre du personnel
il s'agit de % de quoi ? carottes ? pages vues ? visites ? visites SEO ? visites SEO Google ?
tu parles d'"aujourd'hui" mais la journée n'est pas finie. donc c'est noté aujourd'hui mais c'est sur hier que c'est calculé ? par rapport à quand ?

bref, ça ne ferait pas de mal d'être un peu plus rigoureux, non ?
 
WRInaute passionné
Outre le fait que çà manque de précisions (c'est le moins qu'on puisse dire), étonnant de faire un bilan de la journée...à 11 heures du matin.
 
WRInaute discret
Peut-être parce que je connais suffisament bien mon projet pour savoir si à 11h du matin mes stats journées seront bonnes. Et je ne me suis pas trompé. J'pourrais être plus précis et ça aurait été avec plaisir. Mais pas demandé de cette façon.
 
Nouveau WRInaute
Bonjour,

Moi aussi, je constate depuis dimanche un net gain de trafic sur un de mes sites. D'après GA, je fais quasiment du x2 (de 500, je passe à 900 visites / jour).

Dans les sources de trafic, c'est mon trafic de recherche qui est bien boosté. Et quand je regarde aux visites par mot-clés, les chiffres ont doublé voire triplé sur les principaux.

N'ayant pas fait d'intervention particulière récemment, j'en conclus que c'est que je suis plus visible sur ces mots-clés, donc que certains sites qui étaient mieux placés que moi ont "sauté".
 
WRInaute discret
Tomybe a dit:
Peut-être parce que je connais suffisament bien mon projet pour savoir si à 11h du matin mes stats journées seront bonnes. Et je ne me suis pas trompé. J'pourrais être plus précis et ça aurait été avec plaisir. Mais pas demandé de cette façon.
J'avoue que moi aussi vers 11h/midi je sais généralement déjà à quoi m'attendre pour la fin de la journée (c'est un peu l'effet quota de gg).
J'ai une hausse aussi depuis début janvier, une hausse trop importante qui me fait craindre une chute prochaine, voire même très proche car aujourd'hui ça monte encore d'un bon "cran". Exactement le genre de hausse que j'ai prise quelques semaines avant la chute du 17 novembre. J'en conclus donc qu'il faut se méfier des hausses maintenant ... C'est le monde à l'envers.
 
WRInaute passionné
jolm a dit:
une hausse trop importante qui me fait craindre une chute prochaine
J'ai vécu çà deux fois et j'avoue que je ne me souhaite plus de hausse trop soudaine (sauf pour les sites récents). C'est quand même curieux que beaucoup de webmasters remarquent çà alors qu'il ne doit (devrait) pas y avoir de corrélation entre les deux mouvements (hausse soudaine et baisse brutale)
 
WRInaute discret
Si je me reprends une gamelle je le signalerai, et ptetre même qu'il y aura une compile de toutes les "hausses/chutes" (screenshot analytics) que j'ai vécues. A savoir si j'aurai le moral de venir témoigner ...
 
WRInaute accro
J'avais également eu ce problème de forte hausse avant ma chute du 6 novembre. La hausse avait durée 2 semaines environ
 
Nouveau WRInaute
bonjour tout le monde

et c'est du à quoi ce type de hausse pendant 1 ou 2 semaine et ensuite chute? ya t'il une explication rationnel? ou simple hasard?
 
WRInaute accro
Bonsoir

Hausse relativement légère depuis deux jours : de 770 visites/jour à environ 820/830 visites/jour.

Mais... ;) Problème pour le Google Webmaster Tools.

Tous mes liens ont quasiment disparu, comme si Google faisait un réexamen complet de mon site.

Bon, c'est vrai que j'ai coupé l'accès aux courses datant de plus de 10 jours, pour éviter de aspirations sauvages.

Quelqu'un de bizarroïde, m'a pompé plus de 150.000 courses en trois jours.

Je n'ai pas d'autres solution, je ne peux pas couper l'accès automatiquement, because je ne sais pas distinguer un bot de moteur de recherche d'un visiteur habituel.

Maintenant, toutes ces courses anciennes, ont la même page indiquant que l'accès n'a pas été fait en naviguant sur le site.

Donc... Selon toute probabilité : Problème très grave de Duplicate Content.

Comment faites-vous pour résoudre ce genre de problème de pompage massif de vos sites ?

Si vous avez la solution, merci beaucoup si vous pouviez me le dire.

Bien amicalement.

Jean François Ortolo
 
WRInaute accro
madri2 a dit:
lis le forum on a déjà parlé des liens de gwt disparus


Bonjour Monsieur

Je viens de lire ce problème, comme quoi Google se mettait éventuellement, à cacher les liens entrants même aux utilisateurs de GWT.

En tout cas, même si la punition de Google n'est pas immédiate, n'y a -t-il pas un inconvénient, à présenter une page identique pour toutes les courses datant de plus de 10 jours ?

Google va-t-il comprendre, que je suis obligé de protéger, à la fois ma base de données, et le serveur de mon site contre les surcharges occasionnées par les aspirations ?

Déjà, à la suite de cette aspiration par la même adresse ip, de plus de 150.000 courses de mon site, entre le 4 et le 7 février, mon hébergeur PlanetHoster m'a envoyé une alerte, m'indiquant que mon script tournait en boucle... ;(

Le script ne pouvait pas boucler, vu son type de programmation, mais il a été l'objet d 'une aspiration démentiellement rapide.

Maintenant, si ce genre de problème se reproduit, le copieurs vont tout de suite voir, qu'ils n'ont plus de données exploitables.

Les scripts sen cause sur mon site, ont un système qui enregistre dans une table MySQL, tout ce qu'il me faut pour détecter et identifier ces aspirations.

Je pourrais très facilement automatiser l'interdiction d'accès à ces scripts, mais malheureusement, je ne sais pas distinguer une adresse ip de bot d'une adresse ip réelle.

Comment faire ?

Merci beaucoup de vos réponses.

Amicalement.

Jean François Ortolo
 
WRInaute accro
madri2 a dit:
met en cache tes pages peut être

Bonjour Monsieur

Avec PlanetHoster, j'ai un espace web disponible très grand.

Mais...

J'ai toutes les courses du PMU, depuis le 1er Janvier 2000.

Celà représente : 92.095 courses, ou 92.095 page différentes.

Ce serait une solution fiable, effectivement, mais encore faudrait-il créer ces pages html, et celà signifierait au moins, laisser les aspirateurs fous accéder à ce script des courses anciennes, alors que PlanetHoster était sur le point de m'obliger à prendre un VPS. ;(

J'ai déjà un cache software MySQL, qui met en fichiers temporaires les requêtes MySQL.

N'y a-t-il pas une autre solution, aux aspirations de ce type ?

Merci beaucoup de vos réponses.

Bien amicalement.

Jean François Ortolo
 
WRInaute accro
ortolojf a dit:
Déjà, à la suite de cette aspiration par la même adresse ip, de plus de 150.000 courses de mon site
il me semble qu'il y a la possibilité (sur les dédiés) de paramétrer iptable sur un quota max pour chaque ip, sinon elle est bannie sur un délais défini
 
WRInaute impliqué
vos courses qui datent d'il y a 13 ans ne changeront pas, donc un système qui met en cache la page et il n'y a plus aucune requête mysql ou autre, juste un affichage html
sinon payez vous un serveur plus cher, ça coute pas grand chose ...
 
WRInaute accro
Bonsoir Monsieur

Finalement, dans mon immense inconcsience, j'ai fini par regarder dans le moteur de recherche de Wri ,ce qu'il y avait comme solutions d'anti-aspirateurs.

Je vais installer le logiciel Trace_ip.php sur tous mes scripts, et puis ej vais voi d'abord s'il y a encore des problèmes comme çà.

Si pas de problème du tout, j'augmenterai progressivement la possibilité de visualisation des courses anciennes.

A charger pour moi, de régler le timing maximum de consultations/minute, pour que les bots passent.

Je vais d'abord dégraisser le script trace_ip.php, qui date de 2003, à la norme correcte php5 ou php6, et puis je dois dire, que je suis très heureux d'avoir trouvé ce script. ;)

Merci beaucoup de votre aide.

Amicalement.

Jean François Ortolo
 
WRInaute passionné
Salut, plutot qu'un anti aspirateur, cherche sur wri le script de mise en cache, tu peux le mettre à 1 an, ce qui fait qu'il va générer pleins de fichiers html dans différents répertoires, comme ca pratiquement plus d'accès à la base de données, sauf bien sur quelques pages comme ta page d'accueil que tu ne mettra pas en cache ou bien un cache de 1 jour par exemple.
 
WRInaute accro
FortTrafic a dit:
Salut, plutot qu'un anti aspirateur, cherche sur wri le script de mise en cache
sauf que le problème n'est pas tant que ces appels incessants mettent son serveur à genoux, mais surtout qu'il se fait pomper allègrement son contenu par de vils voleurs :evil:
 
WRInaute passionné
Oui, pour ca il peut toujours tenter de bloquer les aspirateurs, mais tant que c'est sur internet si ils veulent lui prendre ses données ils peuvent, il peut leur rendre la tache plus difficile pour les décourager, mais s'il veut laisser publiques ces pages pour que google puisse les lire et lui envoyer des visites, rien ne peut empecher de les telecharger, en changeant d'ip regulierement et en diminuant la frequence.
Si quelqu'un est determiné il pourra le faire..
Donc oui coupler l'anti aspirateur avec aussi le cache pour que tout ca fonctionne plus vite, pourquoi pas. Car sans parler des aspirateurs il y a aussi les crawlers des moteurs de recherche qui visitent les pages et generent a chaque fois tout le tralala php/mysql pour afficher la page, pour rien, pas pour un vrai visiteur en tous cas. Autant mettre en cache les pages qui ne changent jamais. Et si un élément de la page doit changer (par exemple un menu) alors il suffit de vider le cache et le laisser se reconstruire.
 
WRInaute accro
Bonjour

J'avais oublié de le préciser.

Mon problème, n'est pas du tout que ma base de données soit copiée.

De toute manière, à partir du moment où mon site accepte de laisser visualiser les courses des 10 derniers jours, il n'y a pas besoin de surcharger mon serveur ( mutualisé PlanetHoster Hybride Multi ), pour avoir les résultats des course récentes.

Mon problème, c'est qu'à la suite de ce très gros et rapide "pompage" des résultats anciens, sur plus de 150.000 pages, du 4 au 7 février 2013 ( vous avez bien lu ;( ), PlanetHoster m'a contacté, et lors d'un entretien téléphonique direct, le Monsieur m'a suggéré si je pouvais passer à un VPS.

Je suis Allocataire Handicapé, je n'ai pas d'argent à consacrer à un serveur VPS.

Mon problème n'est pas la copie de mes données, mais la surcharge du serveur de mon site.

Cependant, vous m'avez donné une bonne idée, et je laisserai désormais, cette limitation obligatoire en laissant seulement accès aux résultats des 10 derniers jours.

J'ai informé ce matin ( à 3 heure du matin ) PlanetHoster de mes démarches pour cet antiaspirateur.

Je vais cependant, avant, m'informer sur ce en quoi consiste, la protection "anti leech" que propose PlanetHoster.

Je vais d'abord regarder ce que veut dire ce terme.

Si la protection "anti leech", est l'équivalent d'anti aspirateur, je mettrai en place cette protection, tout simplement.

Sinon, n'y a-t-il pas un script anti-aspirateur équivalent, de version plus récente que cette version de Trace_ip, qui date de 2003 ?

Merci beaucoup de vos réponses.

Bien amicalement.

Jean François Ortolo
 
WRInaute accro
FortTrafic a dit:
Car sans parler des aspirateurs il y a aussi les crawlers des moteurs de recherche qui visitent les pages et generent a chaque fois tout le tralala php/mysql pour afficher la page
mais les (vrais bons) crawlers savent adapter leur vitesse de crawl à la configuration de chaque serveur
 
WRInaute passionné
Si ton probleme est l'utilisation des ressources serveur, donc en effet la mise en cache permet de regler ce probleme, car a ce moment la l'aspirateur ne fera que charger pleins de pages html (et les images) au lieu d'obliger le serveur a faire tourner le code php et les appels a la base de données.
Mais oui fais au mieux, et bloque les aspirateurs en plus d'utiliser le cache.. de toutes facons le serveur mutualisé tu as des problemes des que ton site commence a avoir un peu de succès/trafic.
 
WRInaute accro
Bonjour

Voilà, j'ai installé cet anti-aspirateur trace_ip v3 sur mon site.

J'ai accès à l'interface d'administration, où je peux voir les adresse ip récentes, avec leur user-agent, et gérer la white liste et la black-list facilement.

Quand une adresse ip outrepasse les limites, elle est blacklistée, et je reçois un mel.

Je vais voir çà tout de suite.

Merci beaucoup au Monsieur qui a mis au point cet anti-aspirateur sous sa version récente.

Je lui dois, le fait que mon site puisse continuer à vivre. ;)

Je pense malgré ce que vous dites, que je n'aurais pas eu d'autre solution qu'un anti-aspirateur.

Merci encore.

Bien amicalement.

Jean François Ortolo
 
WRInaute accro
FortTrafic a dit:
Si ton probleme est l'utilisation des ressources serveur, donc en effet la mise en cache permet de regler ce probleme, car a ce moment la l'aspirateur ne fera que charger pleins de pages html (et les images) au lieu d'obliger le serveur a faire tourner le code php et les appels a la base de données.
Mais oui fais au mieux, et bloque les aspirateurs en plus d'utiliser le cache.. de toutes facons le serveur mutualisé tu as des problemes des que ton site commence a avoir un peu de succès/trafic.


Bonjour Monsieur

Je pense surtout qu'il n'y a pas le feu.

D'après Google, j'ai eu 840 visites hier.

D'après Awstats de mon hébergeur, c'est : 1668 visites.

Qui a raison ?

Awstats dit sur son interface, qu'il ne compte pas les visites de bots de moteurs de recherche.

???

A côté de çà, depuis une semaine environ, sur mon interface cPanel, je n'ai plus accès aux données de charge du serveur.

PlanetHoster fait ce qu'il veut.

S'il veut virer un client,il peut.

Merci beaucoup de ta réponse.

Bien amicalement.

Jean Ortolo
 
WRInaute accro
Rebonjour

Il est éventuellement possible, que PlanetHoster ait réagi d'une manière prévisionnelle, en anticipant la progression de mon trafic.

Cependant, même avec 1668 visites ( Awstats ) et 840 visites ( GA ), celà ne me semble pas justifier le passage à un VPS ?

Les aspirations, sont maintenant au passé, sous contrôle par l'anti-aspirateur.

J'ai maintenant, 4 adresses ip bloquées ce soir, dont deux en black-list.

Le Directeur de mon site partenaire, m'a conseillé un dédié Kimsufi, et je serais éventuellement intéressé, par la formule OVH Kimsufi KS R-4G :

- 4 Go RAM,
- 2x500 Go disques dur Raid Soft 1/0,
- Bande passante garantie 100 Mbits/sec jusqu'à 5 To descendant/mois,
- Linux, avec Webmin ( et OVHm je présume ), ou Plesk ou brut.

Ceci, pour 23,91 euros TTC/mois, ou 286,92 euros TTC/an.

Je sais administrer un dédié classique OVH, avec Webmin et OVHm, facile, mais j'ai un peu peur de problèmes type attaques ddos, ou ce genre de choses.

Dans tous les cas j'attendrai que PlanetHoster ne me donne plus le choix, que de migrer vers OVH.

Merci beaucoup de vos suggestions.

Bien amicalement.

Jean François Ortolo
 
WRInaute accro
Finalement...

Depuis le 8 Février ( mise en place de mon anti-aspirateur ), le trafic de mon site sur Awstats, est tombé de 1668 visites il y a quelques jours, à 900 visites/jour en moyenne.

A comparer aux stats de GA, qui n'ont pas changé, à peu près 800 visites/jour et 550 vu/jour environ.

En plus de l'anti-aspirateur, je logue les accès à mes courses passées, et je blackliste les adresses ip qui "pompent" trop, même si leur débit est trop faible pour être détecté.

Enfin, j'ai quelques indications de Awstats.

Copieurs s'abstenir. ;)

Et... PlanetHoster sera encore mon hébergeur longtemps. ;)

Sinon, ce sera un VPS OVH Classic 3, avec cPanel, basé à Strasbourg.

Je tiens à mon site.

Il date de 2002, migré en septembre 2008 sous son nom de domaine actuel.

Je ne sais pas du tout son potentiel de rentabilité, mais depuis 1 an, son trafic a augmenté de 1/3.

Récemment, j'ai autant de visites par Gogole , que que de visite directes. ( 340 environ ).

Total : Je vais progressivement dépasser 900 visites/jour d'après GA, dans quelques temps.

La bonne pente, quoi.

Bien amicalement.

Jean François Ortolo
 
Discussions similaires
Haut