[Demande Technique] Similarité entre ces 2 textes : 94% !!!

WRInaute passionné
Bonjour a vous

voila j'ai fait 2 page de test, et en les ayant comparer niveau similitude avec le script de similarité de WRI, il me dit que ces 2 textes son semblable a 94% !!!

les voici (ils on aucune signification humaine je vous prévient) :

1er texte :

le centre de paris, du produit homme de institut de paris. La achat produit, de passion dans marine, le conseil. Les vulgaires, le test de produit corps. La sante, de conseil le orientale, les produit de naturel .
De humide produit corps blanc la masculine humide, les institut de paris quelques dans rapide ongle manucure, la humide prestige international les conseil humide, dans blanc test produit. Dans rapide euro sante, du meilleur recette de, les soin . Les lente euro sante, le blanc test des quelques visage, les plusieurs la d un sein .
Du quelques produit certains la conseil plate, du produit bio meilleur le autre ysl, dans grand orientale la produit homme proche, quelques sante. Du humide ysl, chaque institut a lyon, visage chaude. La plusieurs ile de, les haute ajouter site chaude suggerer lien, les tous sante et .

2eme texte :

les conseil, les conseil de black. Les mode et, la visage la achat produit, les black. Du vente produit naturel, les produit corps femme. Dans test produit, les mode les mode et, de orientale .
Les beau ysl beau des ile de grand, des institut a lyon chaude les doux institut nantes massage, test le conseil pour cheveu plusieurs, les profond passion. La petit salon de, les tranquille sante, les institut a lyon grand. Dans proche la du diable, le tranquille sante plusieurs soin visage, la doux test .
Des mauvais suggerer lien haute test beau, la institut de paris beau dans vide conseil, la haute vente en ligne produit de des magasin proche, la autre maquillage. Le blanc naturel, le proche des pieds, dans nu chaque. La tranquille homme, de rapide test om le tous salon de, la tous institut de luxembourg .

Question :

A vu d'oeil vous trouvez ca logique qu'il y ai autant de similarité textuelle alors que les mots semblent different et positionner différement ? vous appercevez un début d'explication ? (car sinon bonjour le duplicate content)

p.s : je tente de faire different teste pour percer l'algo de duplicate content et aisi savoir les erreurs a ne JAMAIS faire, c'est triste le webmaster qui doit s'adapter a gg et non l'inverse.. mais il fait la loi...

Un gros merci
 
WRInaute occasionnel
Ben à vu d'oeil je dirais que les deux textes se ressemblent car ils ont tous les deux :
1. à peu près QUELQUES MOTS puis une virgule ou un point.
Le tout précédé de "le la les de des"

2. Donc ça les fait se ressembler, sans regarder les mots en particulier, ensuite ce qui les fais se ressembler c'est qu'ils contiennent tous deux un espace avant certains points finaux. Je pense que comme c'est assez rare (à cause des règles typographiques) ça suffit à augmenter la ressemblance de ces deux textes.

3. Enfin ils sont tous deux d'une taille semblables.

Voilà des points communs sans même lire les mots en détails.
 
WRInaute passionné
allinax, j'apprecie GRANDEMENT ton analyse trés perspicace, on pourais difficilement faire mieux

mais en utilisant cet outil :

http://www.webconfs.com/similar-page-checker.php

j'obtien l'inverse, sois 7% de ressemblance (ce qui semble plus logique d'un point de vu analyse de texte pure)

donc je doit en deduire de ne plus jamais utiliser cet outil de WRI (qui doit confondre les mots differents et semblable)
 
WRInaute accro
Il faut surtout en déduire qu il y a plusieurs aspects de similitude et donc plusieurs facon de les mesurer. Et comme on ne sait pas pourquoi la similitude est importante et quelle genre de similitude est prise en compte par les moteurs de recherche......
 
Discussions similaires
Haut