Hello tous,
Depuis le temps que j'entend des personnes utilisant le Spam reporting de Google, je suis en train de me dire qu'un outils de détection automatique de spam serait une bonne idée de développement.
Voila mon idée:
- Effectuer une recherche Google sur un terme donné.
- Garder en mémoire les X premiers résultats
- Pour chaque résultat :
+ Visiter la page et ses dépendances JS et CSS
+ Vérifier la présence de META REFRESH
+ Parser le code JS à la recherche d'une redirection du genre "windows.location=..."
+ Faire ressortir la présence de DIV et de SPAN cachés (visibility:hidden, position négative)
- Puis afficher les résultats, une intervention humaine est alors nécessaire pour vérifier le caractère frauduleux des résultats.
- Ensuite, pour chaque résultat, possibilité de soumettre automatiquement à Google par le biais du formulaire disponible ici: https://www.google.com/contact/spamreport.html
Je ne sais pas si quelqu'un s'est déjà intéressé à ce genre de développement. Si c'est le cas, qu'il n'hésite pas à me faire partager soon expérience surtout en ce qui concerne l'interprétation du JavaScript.
Si vous connaissez d'autre techniques de Spamdexing, si vous avez d'autres idées sur la détection des techniques de Spamdexing ou si cette idée vous intéresse, faites m'en part.
Depuis le temps que j'entend des personnes utilisant le Spam reporting de Google, je suis en train de me dire qu'un outils de détection automatique de spam serait une bonne idée de développement.
Voila mon idée:
- Effectuer une recherche Google sur un terme donné.
- Garder en mémoire les X premiers résultats
- Pour chaque résultat :
+ Visiter la page et ses dépendances JS et CSS
+ Vérifier la présence de META REFRESH
+ Parser le code JS à la recherche d'une redirection du genre "windows.location=..."
+ Faire ressortir la présence de DIV et de SPAN cachés (visibility:hidden, position négative)
- Puis afficher les résultats, une intervention humaine est alors nécessaire pour vérifier le caractère frauduleux des résultats.
- Ensuite, pour chaque résultat, possibilité de soumettre automatiquement à Google par le biais du formulaire disponible ici: https://www.google.com/contact/spamreport.html
Je ne sais pas si quelqu'un s'est déjà intéressé à ce genre de développement. Si c'est le cas, qu'il n'hésite pas à me faire partager soon expérience surtout en ce qui concerne l'interprétation du JavaScript.
Si vous connaissez d'autre techniques de Spamdexing, si vous avez d'autres idées sur la détection des techniques de Spamdexing ou si cette idée vous intéresse, faites m'en part.