Textes et Images invisibles - optimisation des mots clés

WRInaute occasionnel
Bonjour,

Je souhaite réaliser une étude sur les textes et images invisibles pour l'utilisateur servant à augmenter les backlinks et optimiser une liste de mots clés, le tout de façon invisible.

Il a était retenu que Google à présent était capable de détecter les textes écrit d'une taille illisible ou des textes ayant la même couleur que le fond de la cellule et que les sites utilisant ces procédés sont généralement assez rapidement sanctionné : blacklistage.

Le moteur de recherche Google sait donc analyser les textes invisibles pour les utilisateurs, mais n'est pas capable d'analyser le contenu d'une image.

On sait aussi que Google prend en compte le texte mit en "alt" dans une image, et est donc capable de référencer un site par rapport à un terme compris dans une image.

Donc, à partir de ces hypothèses, je souhaiterais vérifier l'incapacité du moteur de recherche face à des images optimisées.

1 - Images transparente avec mots clés dans le alt
N'ayant trouvé aucun document démontrant si oui ou non Google pouvait repérer la taille d'une image, modifié par les paramètres width et height, je propose deux hypothèses.

  1. Si on admet que Google est capable de "lire" la taille d'une image, ou alors que l'on a modifié la taille d'une image avec du html, le texte masqué est possible mais plus difficile. En effet, puisque Google prend en compte l'attribut alt (ou title) d'une image, théoriquement une image de 1px sur 1px transparente avec une liste de mots clés (en rapport ou non avec le thème de la page) n'est pas forcement repérable. Le contenu de l'image ne peut pas être analysé et Google ne sait pas ce que l'image représente. Seul contrainte, si on utilise une seule et même image de taille 1px sur 1, la triche risque d'être repéré. L'astuce consiste donc à utiliser plusieurs images de tailles différentes et de ne pas rentrer de valeur de taille dans le code html, afin de laisser une ambiguïté.

    Google ne sait ce que l'image représente, et indexe donc le contenu du alt.
  2. Même cas que précédemment mais si Google n'est pas encore capable de démasquer la taille d'une image, il n'est pas utile de changer d'images à chaque fois. On peut donc avoir une centaine de mots clés, ne prenant aucun espace sur le site mais qui apparaît dans le code source, et donc pour Google.

Le problème de cette méthode est le cas où un utilisateur aurait désactivé les images, il aurait donc la longue liste de mots clés assez peu esthétique.

1 - Textes de couleurs identiques au fond image

Si Google est capable d'identifier le fond de la page et la couleur utilisé pour le texte, il est donc capable de repérer un texte qui serait dans une couleur proche du fond.
Mais si on utilisait dans une table une couleur de fond blanche (#FFFFFF) et de texte noir (#000000) pour mettre notre liste de mots clés, aucun problème c'est considéré comme un texte normal.
Par contre, si on recouvrait l'intérieur d'un tableau, avec une image noir de façon répété, on aurait un rendu noir sur noir ! Dans le code source on a une couleur blanche mais qui au final apparaît noir pour un utilisateur "humain".
Utiliser une texture permettrait donc, normalement de tromper Google qui prendrait en compte la couleur de fond comme blanche au lieu de celle de l'image noir.
Même problème, on rend un texte visible si l'image de background est désactivée par l'utilisateur.

L'utilisation d'images permettrait donc en théorie de placer des backlinks ou des mots clés qui ne serrait pas repéré par Google et qui serait invisible à l'utilisateur. Il est certain qu'une liste de mots clés "brut", une simple suite de mots n'aurait pas d'effet car serait détecté, mais à partir du moment ou c'est un texte ou des expressions qui sont incorporés, ce n'est pas détectable par les robots.

Je n'ai pas encore pu pratiquer cette méthode, car je ne dispose d'aucun compte référencé pour lesquels je ne risque pas un blacklistage. Cette méthode assez facilement découvrable par un humain ne l'est pas forcement par un robot, et je souhaiterais le prouver (j'ai pas l'intention d'utiliser mon nom de domaine pour ce genre de test, je suis pas encore assez fou :lol: ).

Une petite question donc pour finir, Google est il donc capable d'analyser le contenu d'une image pour éviter ce genre de cloaking ?

ManiaGames
 
WRInaute accro
Soit c'est du vrai texte mis dans les images et dans ce cas là, pourquoi ne pas le faire afficher pour les visiteurs, sinon, je pense que google utilisera de plus en plus d'algorithmes d'analyse sématiques (il nous donne bien une autre orthographe de certains mots dans une recherche, il y a des règles probabilistes de présence de tel mot après tel autre selon les langues), et là, quand il s'apercevra que c'est du spamming :cry:
La chose qui pourrait faire "tomber" google c'est qu'un autre moteur de recherche arrive avant lui à faire un nettoyage réel des résultats
 
WRInaute occasionnel
Ce genre d'interêt est en général pour de l'optimisation de contenu n'ayant rien à voir. Si le texte est en rapport le webmaster c'est certain l'affichera.

Je pense plutôt aux sites parlant d'un thème et se plaçant sur des requêtes très demandés n'ayant strictement aucun rapport dans le but de ce positionner dessus.
Certes, c'est du pur cloaking, mais à moins que Google soit capable d'analyser les proprietés d'une image, ou qu'il peut remarqué que le contenu n'est pas en rapport avec le reste (peu probable je pense si c'est un véritable texte), alors ces méthodes sont difficilement contrés malheuresement, surtout celle avec la texture qui laisse paraître un texte normalement lisible.

Il serait intéressant de voir qui repere le mieux la tricherie en fonction du moteur de recherche.

Pour un test technique, il ne m'est par contre pas possible de le faire en ligne, aucun backlink poitant sur cette page fantome, il est impossible de déterminer si oui ou non la page ne réussi pas à ce positionner sur le mot ou si Google ne l'a tout simplement pas découvert.
 
WRInaute accro
ManiaGames a dit:
Pour un test technique, il ne m'est par contre pas possible de le faire en ligne, aucun backlink poitant sur cette page fantome, il est impossible de déterminer si oui ou non la page ne réussi pas à ce positionner sur le mot ou si Google ne l'a tout simplement pas découvert.
Pour google, il suffit de le mettre dans le sitemap
 
WRInaute occasionnel
Leonick a dit:
Pour google, il suffit de le mettre dans le sitemap

Un site qui n'aurait strictement aucun backlink, une simple page nullement relié pourrait il exister dans le moteur à travers du sitemap seul ?
Le proprietaire du compte auquel est associé l'arbre du sitemap ne risque t'il pas un blacklistage des deux sites, le fautif et le non fautif ?

WonKa a dit:
qui a dit que Google lisait le texte caché en blanc sur blanc ? :)

Personne, ce fut démontré tout simplement, et il est même capable de reperer des couleurs proches avec une valeur heximal différentes :)
 
WRInaute passionné
Y a juste un problème...

Derrière un robot, il y a des humains.

Si le robots ne voit rien sur tes astuces, que va faire un humain qui reçoit une dénonciation de ton site ?
 
WRInaute discret
Et faut un peu suivre, tu veux des exemples concrets ou quoi ?
Google ne lis pas les feuilles de style, donc via CSS, je te fais une page blanche avec du contenu blanc et une belle frame d'une affiliation banale.
 
WRInaute occasionnel
WonKa a dit:
Et faut un peu suivre, tu veux des exemples concrets ou quoi ?
Google ne lis pas les feuilles de style, donc via CSS, je te fais une page blanche avec du contenu blanc et une belle frame d'une affiliation banale.

Je peux t'affirmer (saus aucunes preuves ou presque c'est vrai :roll: ) que Google lis de mieux en mieux le contenu d'une CSS.

@Grantome

C'est certain, la triche sous n'importe quelle forme est condamné, néamoins le but de mon "étude" est de vérifier si oui ou non les bots sont capables d'eux mêmes de détecter ce genre de tricherie ou si il faut une intervention humaine.
 
WRInaute accro
ManiaGames a dit:
Le proprietaire du compte auquel est associé l'arbre du sitemap ne risque t'il pas un blacklistage des deux sites, le fautif et le non fautif ?
De toutes façons, le sitemap ne peut faire indexer que des pages dans sa sous arborescence, donc les fichiers incriminés doivent obligatoirement être sur son site.
Après quant à savoir s'il risque le blacklistage, ben il y a de grandes "chances", mais bon si on veut tricher il faut en supporter les risques, non ? :lol:
Sinon à quoi ça servirait qu'on essaie de faire des bon sites :wink:
 
Nouveau WRInaute
Je ressors ce post vieux de 3 ans, mais je voudrais juste savoir ou on en est sur la lecture par GG des feuilles de style, non parce que si à l'époque ManiaGames ne pouvait nous apporter aucune preuve (ou presque) cela à peut-etre evolué...?
 
Discussions similaires
Haut