Eviter le duplicate content (similarité du contenu)

Discussion dans 'Crawl et indexation Google, sitemaps' créé par Tilt, 11 Juillet 2006.

  1. Tilt
    Tilt WRInaute impliqué
    Inscrit:
    26 Mars 2005
    Messages:
    752
    J'aime reçus:
    0
    Bonjour,

    Croyez-vous que google considère 2 pages identiques si le contenu des 2 pages n'est pas présenté dans le même ordre ?
    Ex.:
    -page 1=
    <p>abc-def-ghi</p>
    - page 2=
    <p>ghi-def-abc</p>
    Et dans ce cas ?:
    -page 3=
    <p>abc</p>
    <p>def</p>
    <p>ghi</p>
    - page 4=
    <p>ghi</p>
    <p>def</p>
    <p>abc</p>
     
  2. e-kiwi
    e-kiwi WRInaute accro
    Inscrit:
    23 Décembre 2003
    Messages:
    13 198
    J'aime reçus:
    1
    t s fait un calcul de taux de similarité entre ces deux pages pour voir ce que disent les outils ?
     
  3. Tilt
    Tilt WRInaute impliqué
    Inscrit:
    26 Mars 2005
    Messages:
    752
    J'aime reçus:
    0
    non, pas encore, mais je vais le faire maintenant.
     
  4. Tilt
    Tilt WRInaute impliqué
    Inscrit:
    26 Mars 2005
    Messages:
    752
    J'aime reçus:
    0
    Voici le résultat du test effectué avec -http://www.webconfs.com/similar-page-checker.php

    page 1-page 2: 50% de similitude
    page 3-page 4: 50%
    page 1-page 3: 83%
    page 2-page 4: 83%
    page 1-page 4: 33%
    page 2-page 3: 33%

    Cet outil ne prend donc pas trop en compte les balises comme délimiteurs d'unités de contenu. L'ordre par contre est important, avec ou sans balises: le même contenu dans le désordre voit son taux de similarité dégringoler.

    Je ne sais pas si gg réagit pareil.

    Ce serait peut-être intéressant de continuer l'expérience... car s'il suffit de rendre aléatoire l'ordre de certaines choses dans le template des pages (liens menu p. ex.) pour baisser le risque de duplicate content, je vais écrire qq fonctions !
     
  5. Borower
    Borower WRInaute passionné
    Inscrit:
    18 Avril 2005
    Messages:
    1 671
    J'aime reçus:
    0
    Il a été dit que google ne prennait pas en compte les balises pour faire son calcul de similitude entre deux pages.
    Je n'ai pas fait de test et n'affirme pas ce que je dit.
     
Chargement...
Similar Threads - Eviter duplicate content Forum Date
Un contenu serait publié deux endroits/URLs différents, comment éviter le duplicated content ? Référencement Google 2 Octobre 2019
Comment éviter le duplicate content entre 2 sites ? Référencement Google 2 Avril 2019
Éviter le duplicate content pour des pages de spectacles et films Référencement Google 18 Janvier 2016
Comment eviter duplicate content avec des recettes de cuisine? Référencement Google 14 Octobre 2013
Modifier l'indexation des PDF pour éviter duplicate content Crawl et indexation Google, sitemaps 2 Septembre 2013
Comment éviter un duplicate content sans ruiner l'expérience utilisateur? Référencement Google 9 Août 2013
Duplicate content sur les méta, à éviter ou pas? Débuter en référencement 18 Juillet 2013
Comment eviter le duplicate content lorsqu'on met un article dans 2 catégories? Référencement Google 21 Juin 2013
Dire a google de ne pas indexer un div en particulier pour éviter le duplicate content. Débuter en référencement 1 Mars 2013
Changement de nom de domaine : comment éviter Duplicate Content ? Débuter en référencement 20 Février 2013
Comment créer 60 descriptions unique pour eviter le duplicate content? Rédaction web et référencement 13 Septembre 2012
Eviter le duplicate content URL Rewriting et .htaccess 13 Août 2012
Comment éviter le "duplicate content" ? Débuter en référencement 30 Juillet 2012
Eviter le duplicate content sur un blog Rédaction web et référencement 14 Février 2012
Comment éviter le duplicate content avec 2 NDD Référencement Google 30 Mars 2011
Plusieurs URL pour une seule page : comment éviter le duplicate content ? Crawl et indexation Google, sitemaps 7 Février 2011
Redirection pour éviter duplicate content URL Rewriting et .htaccess 24 Janvier 2011
Canonical, pour éviter le duplicate content mais si le contenu est semi unique Débuter en référencement 26 Décembre 2010
éviter un duplicate content Débuter en référencement 7 Octobre 2010
[résolu] Eviter le duplicate content sur la page d'accueil URL Rewriting et .htaccess 2 Juillet 2010