Spam reporting automatisé

Discussion dans 'Référencement Google' créé par magicaxe, 24 Octobre 2005.

Tags:
  1. magicaxe
    magicaxe WRInaute discret
    Inscrit:
    18 Octobre 2004
    Messages:
    129
    J'aime reçus:
    0
    Hello tous,

    Depuis le temps que j'entend des personnes utilisant le Spam reporting de Google, je suis en train de me dire qu'un outils de détection automatique de spam serait une bonne idée de développement.

    Voila mon idée:
    - Effectuer une recherche Google sur un terme donné.
    - Garder en mémoire les X premiers résultats
    - Pour chaque résultat :
    + Visiter la page et ses dépendances JS et CSS
    + Vérifier la présence de META REFRESH
    + Parser le code JS à la recherche d'une redirection du genre "windows.location=..."
    + Faire ressortir la présence de DIV et de SPAN cachés (visibility:hidden, position négative)
    - Puis afficher les résultats, une intervention humaine est alors nécessaire pour vérifier le caractère frauduleux des résultats.
    - Ensuite, pour chaque résultat, possibilité de soumettre automatiquement à Google par le biais du formulaire disponible ici: https://www.google.com/contact/spamreport.html

    Je ne sais pas si quelqu'un s'est déjà intéressé à ce genre de développement. Si c'est le cas, qu'il n'hésite pas à me faire partager soon expérience surtout en ce qui concerne l'interprétation du JavaScript.

    Si vous connaissez d'autre techniques de Spamdexing, si vous avez d'autres idées sur la détection des techniques de Spamdexing ou si cette idée vous intéresse, faites m'en part.
     
  2. Røi
    Røi WRInaute occasionnel
    Inscrit:
    8 Août 2005
    Messages:
    464
    J'aime reçus:
    1
    Tu comprendra en y réfléchissant que pour 8 milliard de pages il faudra vérifier à peu près 1 milliard de pages car elles comportent toute une description ou des mots ou un div qq part qui pourrait sembler "répréhensible".

    Le mieux c'est comme fait google actuellement ca ne leur coute rien.

    A partir d'un certain nombre de plaintes distinctes à propos d'un même site un être humain doté d'un cervau analyse le site.

    ./
     
  3. Bat
    Bat Nouveau WRInaute
    Inscrit:
    16 Février 2004
    Messages:
    49
    J'aime reçus:
    0
    En outre, par expérience j'ai pu constater que de nombreux scripts window.location.href sont parfois utiles, sans pour autant faire du spamdexing...

    Idem pour les CSS, les div hidden ou autres display:none ; on les trouve régulièrement dans l'affichage d'éléments de menus, de versions imprimables, etc...

    Alors du coup, le spam report automatisé me semble tout de suite beaucoup plus complexe.
     
  4. magicaxe
    magicaxe WRInaute discret
    Inscrit:
    18 Octobre 2004
    Messages:
    129
    J'aime reçus:
    0
    >>Røi
    Je suis tout à fait d'accord. Je pensait plutôt à un scénario du genre:

    J'essaie de ressortir sur tel ou tel terme de recherche mais je n'y arrive pas car de nombreux sites utilisent le spamdexing. J'effectue une analyse pour le ou les termes de recherche sur les X premières pages de résultats précédant mon apparition.

    Cela resterais pour des applications très ciblées. Je pense bien qu'il est impossible de le faire pour l'essemble de l'index, je laisse d'ailleur Google s'en charger.

    >>Bat

    Je suis aussi d'accord avec toi, j'utilise d'ailleurs cette technique pour les menus de certains de mes sites. C'est pourquoi je pensait laisser à l'utilisateur la possibilité de vérifier manuellement les résultats de l'analyse. Si c'était plus simple, Google l'aurait déjà fait.

    Je ne dit pas qu'un tel soft serait dépourvu d'erreur, mais pour la pluspart des cas, c'est quand-même flagrant et facile à détecter.
     
  5. itsme
    itsme WRInaute impliqué
    Inscrit:
    13 Octobre 2004
    Messages:
    609
    J'aime reçus:
    0
    Røi
    un être humain doté d'un cervau

    Ouf, j'ai eu peur :p
     
Chargement...
Similar Threads - Spam reporting automatisé Forum Date
Proximité d'un lien à coté d'un lien spam, influence? Débuter en référencement 21 Novembre 2022
Mise à jour de l’algorithme Google Spam d’octobre 2022 Référencement Google 22 Octobre 2022
Spam referring domains (grosse chute de trafic) Problèmes de référencement spécifiques à vos sites 6 Juin 2022
WordPress A l'aide ! Mon site est spammé, mon domain rating prend un sacré coup Débuter en référencement 26 Avril 2022
Search Console Negative SEO - SPAM - Page de Recherche - RSS2 - Wordpress Problèmes de référencement spécifiques à vos sites 13 Janvier 2022
Comment est généré le Spam-score de chez Moz ? Netlinking, backlinks, liens et redirections 23 Décembre 2021
Inbound links avec spam score important Netlinking, backlinks, liens et redirections 15 Novembre 2021
WordPress Nettoyage BL spammy NSEO Netlinking, backlinks, liens et redirections 9 Novembre 2021
Plein de backlinks .blogspot.com type spam : que faire ? Référencement Google 28 Septembre 2021
Update Google contre le spam de liens (été 2021) Netlinking, backlinks, liens et redirections 16 Août 2021
Search Console Action manuelle WNC-645700 SPAM AGRESSIF Référencement Google 26 Juin 2021
Dur, dur, pénalité pour spam... Problèmes de référencement spécifiques à vos sites 27 Mai 2021
40 milliards de pages undesirables (spam) par jour Crawl et indexation Google, sitemaps 30 Avril 2021
Les mails de mon domaine considéré comme spam Administration d'un site Web 19 Février 2021
Spam de nouvelles Inscriptions sur Presta e-commerce 30 Décembre 2020
ReCaptcha v2 – depuis 3mois, du spam russe via un formulaire de contact pour un seul de mes sites Google : l'entreprise, les sites web, les services 26 Novembre 2020
Question rachat de domaine, backlinks doublon et spam Problèmes de référencement spécifiques à vos sites 11 Novembre 2020
MOZ Spam Score Demandes d'avis et de conseils sur vos sites 10 Novembre 2020
Comment Google utilise le spam report Référencement Google 4 Juillet 2020
WordPress ancien site sous WP spammé par robot coréen - référencement dans les choux Problèmes de référencement spécifiques à vos sites 27 Juin 2020