Outils permettant de detecter les sites web malhonnêtes

Nouveau WRInaute
Je suis entrain de mettre au point un outil permettant de detecter les sites qui font du cloacking et autres techniques visant à doper leur référencement.
Pour l'instant, la version beta detecte 90% de mes sites cobaye et 80% des sites "suspect". Le système s'appuie sur une analyse du code source de la page, des pages qui pointent vers celle-ci et d'autres choses ...

Une fonction permet de mettre en évidence les sites qui leurrent spécifiquement google par des techniques occultes en comparant le positionnement sur des mots clés sur plusieurs moteurs de recherche. Avec cette adon, j'ai trouvé des résultats étonnants 8O

Existe-t-il déjà des outils semblables ? car si non, je vais au plus vite déposer une licence ou un brevet 8)
 
WRInaute occasionnel
Ca peut etre assez marrant comme outil, à partir de quoi faudra-t-il se baser ? D'une page suspecte ou de l'url de base ?

La page de beta-test est en ligne ? :)

Curiosité, quand tu nous tiens !
 
Nouveau WRInaute
Je n'en ai pas à ma connaissance (mais loin de moi l'idée d'être une bible) et je pense que c'est un excellente idée ! ;)

Mais si un brevet n'a pas encore été déposé, ce n'était peut être pas la chose la plus judicieuse que de dévoiler tes projets en public...

Bon courage pour la suite en tous cas, nous voulons être tenus au courant de l'avancement de ton projet dans le futur !
 
WRInaute discret
en même temps, à part pour GG, qui a déjà sûrement un outil semblable pour blacklister, je vois pas trop à quoi ça peut nous servir...

si ce n'est de la curiosité...
on va pas s'amuser à dénoncer tt le monde, non ?
 
WRInaute occasionnel
justement, on peut imaginer un systeme de dénonciation automatique si le système a trouvé une suspicion :lol:
 
WRInaute occasionnel
Comment tu détectes le cloaking sur IP ? (le seul cloaking vraiment efficace et sur à mon avis)
 
WRInaute passionné
elisha a dit:
ESCUSez moi.. mais.. a quoi ca sert ?

Si ça marche, cela peut par exemple te permettre de prouver qu'un concurrent utilise des techniques douteuses et te permettre de le dénoncer (je pense au cloaking par ip).

Sinon, je ne vois pas...
 
WRInaute passionné
karak a dit:
Comment tu détectes le cloaking sur IP ? (le seul cloaking vraiment efficace et sur à mon avis)

Lorsque je développais des outils de veille, un des solutions consistait à faire un diff ( à peine plus évolué qu'un diff ), entre la page en cache et la version réelle de la page.
Ce n'était pas spécifique au cloaking.

Au-delà d'un seuil de différence cela déclenchait une alerte.

Un module Perl HTML::TreeBuilder me permettait de mettre en évidence les différences entre 2 versions de page.

Cet outil servait aussi pour mettre en veille les sites des concurrents ( surveillance de prix, opération mktg, etc... )
 
WRInaute occasionnel
spidetra a dit:
Lorsque je développais des outils de veille, un des solutions consistait à faire un diff ( à peine plus évolué qu'un diff ), entre la page en cache et la version réelle de la page.

Tu t'es déjà amusé à cloaker ?

Je ne voudrai pas te décourager mais personne de sérieux cloake sans prendre la peine d'interdire la mise en cache :D
 
WRInaute discret
karak a dit:
Tu t'es déjà amusé à cloaker ?

Je ne voudrai pas te décourager mais personne de sérieux cloake sans prendre la peine d'interdire la mise en cache :D

C'est à dire?
j'en vois tous les jours du cloaking et le cache est toujours visible.
 
WRInaute occasionnel
C'est pas serieux de cloaker sans interdire le cache :? donc si tu vois cela tous les jours tant mieux ton outil sera donc utile.

En revanche si ton outil arrive à detecter le vrai bon cloak ca sera vraiment fort.
 
WRInaute occasionnel
En même temps, tout site qui refuse la mise en cache, ça sent justement le truc à cacher.

Son outil doit probablement en tenir compte
Pas de cache >> indice de fiabilité descend
 
WRInaute occasionnel
Franck D a dit:
Existe-t-il déjà des outils semblables ? car si non, je vais au plus vite déposer une licence ou un brevet 8)
Cours vite déposer un brevet et peut-être pourras-tu revendre des licences : c'est ça la différence entre brevet et licence 8) Je te propose de prospecter pour une licence en premier Googl, yahoo, etc.....
Pour le reste, tout ça me parait hautement suspect voire gagesque ! Du haut de tes 5 posts (????), tu tiendrais la martingale qui va faire trembler le milieu de l'internet. Attends gentiment le 01/04/2007 pour la prochaine annonce du même tonneau :twisted:
 
WRInaute occasionnel
Le jour où le nombre de posts sur WRI sera significatif... avec tous les +1 qui trainent sur le forum (et certains qui disent que les modos sont stricts :D)...
 
WRInaute accro
karak a dit:
Le jour où le nombre de posts sur WRI sera significatif... avec tous les +1 qui trainent sur le forum (et certains qui disent que les modos sont stricts :D)...
Ouep finalement t'as raison, on est pas assez stricts ... on va resserrer les boulons ... vis à vis de ceux qui critiquent le nombres de posts sur wri :D :D (joke)
 
WRInaute passionné
karak a dit:
spidetra a dit:
Lorsque je développais des outils de veille, un des solutions consistait à faire un diff ( à peine plus évolué qu'un diff ), entre la page en cache et la version réelle de la page.

Tu t'es déjà amusé à cloaker ?

Je ne voudrai pas te décourager mais personne de sérieux cloake sans prendre la peine d'interdire la mise en cache :D

non, jamais.
Tu ne me décourage pas. Ma phrase est au passé. c'était il y a 3 ans.
( un diff entre rien et une page, ça donne quoi à ton avis ? )
 
Discussions similaires
Haut