Logiciel qui crawl un site et recherche du Duplicate

Discussion dans 'Référencement Google' créé par Niurath, 6 Septembre 2008.

  1. Niurath
    Niurath WRInaute discret
    Inscrit:
    11 Août 2008
    Messages:
    166
    J'aime reçus:
    0
    Bonjour,

    Je recherche un logiciel qui crawl un site à la recherche de duplicate content, en comparant avec les pages ignorées de google, est ce que ça éxiste ?

    Cordialement

    Edit: Existe t'il une commande pour afficher toutes les pages ignorées par google sur un site ?
     
  2. ybet
    ybet WRInaute accro
    Inscrit:
    22 Novembre 2003
    Messages:
    7 419
    J'aime reçus:
    1
    Pas sûr que ca soit que tu cherche mais j'utilise un petit truc qu'on m'a renseigné pour vérifier les pages que GG tient compte (ou plutôt) le nombre de pages vues comme pertinentes.
    Aol utilise la base GG mais semble ne prendre que la partie standard (pas par exemple les pages sanctionnées (PR grisé).
    https://www.google.be/search?sourceid=na ... tique%2ebe 754 résultats

    http://www.recherche.aol.fr/aol/search? ... que.be&rp= 479 résultats. Toutes les pages non reprises sur AOL que j'ai vérifié sont effectvement sanctionnées.
     
  3. larchange
    larchange Nouveau WRInaute
    Inscrit:
    17 Avril 2008
    Messages:
    40
    J'aime reçus:
    0
    Je pensais que cela entrainerait l'exclusion des pages grisées des résultats, mais non... On ne peut donc pas les estimer comme "rejetées" par Google ?

    Par ailleurs, comment définir les URL retenues et les URL non retenues, avec les dizaines et dizaines de pages qui affichent des résultats ?

    Je ne comprends pas bien comment tu utilises ça... :wink: Merci de m'éclairer !

    Cordialement
     
  4. Niurath
    Niurath WRInaute discret
    Inscrit:
    11 Août 2008
    Messages:
    166
    J'aime reçus:
    0
    Merci, mais ça me semble assez fastidieux, en fait google indexe 550 pages sur 1000 de mon site web, je n'ai rien dupliqué mais je soupçonne un site de me pomper régulièrement du contenu avant crawl.

    Il me faudrait vraiment un outil qui puisse me dire quelles pages sont ignorées par google..

    Ça dois exister non ? =)
     
  5. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    31 738
    J'aime reçus:
    336
    Il y a ignorées, pénalisées et autres éléments.
    Pas vu encore ce type d'outil.
     
  6. 5_legs
    5_legs WRInaute passionné
    Inscrit:
    30 Avril 2006
    Messages:
    1 521
    J'aime reçus:
    0
    La piste semblait intéressante.. cependant je n'arrive pas à la même conclusion que toi.
    Même si le résultat entre AOL et Google est conséquent, quelques recherches ont montré des pages non reprise par AOL annoté par Google avec un PR.

    Après : d'où vient cette différence.........................
     
  7. ybet
    ybet WRInaute accro
    Inscrit:
    22 Novembre 2003
    Messages:
    7 419
    J'aime reçus:
    1
    J'avoue pas avoir vérifié celle qui avaient du PR, juste les pages repassées en grisées
    -http://www.materiel-informatique.be/modem.php sanctionnée et http://www.recherche.aol.fr/aol/search? ... +modem&rp= pas trouvé la page. J'ai déjà testé sur une vingtaine de page dans ce cas, idem ... mais ca prouve pas qu'une page avec PR n'est pas sanctionnée non plus.
    J'ai fait la même chose avec quelques sites qui avaient pris une baffe aussi. Parfois c'est assez affolant :? J'utiliserais bien alo pour mes recherches, mais trente pubs avec 3 résultats par pages, c'est plutôt casse pied.
    Mais effectivement c'est une piste pas une réalité à prendre à la lettre. Sur mon WWW 695 pages reprises pour AOL, 15600 pour Google (à part la partie vente et le forum), rien d'anormal sur le site ... :wink:
    juste une petite piste ...

    Maintenant pour le duplicate ... puisque je viens de vérifier en long et en large deux sites (et pas le www), j'ai repris des morceaux de phrases directement sur Google entre "", supprimé en début et en fin les caractères de ponctuation, le, la, ... Certains sont facilement trouvables, d'autres rien trouvé ..
    De toute façon, en cas de duplicate de phrases, trois solutions chez GG:
    1. en garde quelques unes et met les autres en résultat ignorés ... souvent les annuaires où les sites sont inscrits en même temps, ceux qu'il garde sont souvent les mêmes sites
    2. garde la page de référencence et oublie complètement ou presque les copies (souvent des vieux articles).
    3. fait disparaître tout le monde :?

    C'est même encore pire parfois, en essayant un de me sites, suis tombé sur des copieurs du WWW alors que si j'essaye les phrases des pages du WWW, le copieur n'apparaît pas (j'avoue, quelques phrases copiées entre mes deux sites, sauf que le www sert de vieux site et est pris comme référence - surtout quand le copieur laisse mes liens interes :lol: )

    Bref, manuel et long pour rien trouvé parfois.
     
  8. Rv323
    Rv323 WRInaute discret
    Inscrit:
    12 Avril 2007
    Messages:
    130
    J'aime reçus:
    0
  9. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    31 738
    J'aime reçus:
    336
    Il y a aussi un outil sur Webrankinfo pour les pages similaires.
     
Chargement...
Similar Threads - Logiciel crawl recherche Forum Date
Logiciel analyse backlinks => ils crawlent le web Netlinking, backlinks, liens et redirections 15 Avril 2014
Logiciel de gestion des réseaux sociaux Autres réseaux sociaux 29 Mars 2022
Stripe & logiciels certifiés nf525 ? e-commerce 10 Janvier 2022
Achat groupé du logiciel 1.fr Rédaction web et référencement 5 Janvier 2022
H1, h2 et interprétation des logiciels de SEO vs Google Débuter en référencement 18 Octobre 2021
Google ads refusées / Logiciel malveillant AdWords 27 Mai 2021
Problème résolution typo logiciels Le café de WebRankInfo 28 Février 2021
Avis sur le logiciel immobilier Demandes d'avis et de conseils sur vos sites 24 Novembre 2020
Annonces refusées par Google Ads "Logiciel malveillant" AdWords 29 Octobre 2020
1er selon logiciels mais pas dans les faits Débuter en référencement 5 Juin 2020
site/logiciel pour savoir si notre texte est optimisé Rédaction web et référencement 28 Octobre 2019
Quel type de logiciel utiliser pour créer un site web simple et performant ? Demandes d'avis et de conseils sur vos sites 14 Octobre 2019
Loterie SEO : linking, logiciels, domaines Le café de WebRankInfo 16 Septembre 2019
Que pensez vous du logiciel Upseo Référencement Google 25 Août 2019
Logiciel de montage vidéo très simple ? Le café de WebRankInfo 12 Août 2019
Google Adword et logiciel malveillant Administration d'un site Web 5 Avril 2019
Logiciel ou script gratuit ou payant pour récupérer les mots clés !! Rédaction web et référencement 5 Juillet 2018
Un logiciel pour remplacer Google Analytics ? Google Analytics 20 Juin 2018
Logiciel anti-plagiat Rédaction web et référencement 14 Juin 2018
Le logiciel SEO Soft est-il encore d'actualité ? Débuter en référencement 27 Février 2018