Google détecte-t-il vraiment le cloaking ?

Nouveau WRInaute
Bonsoir à tous,
J'aimerais avoir une réponse claire à cette questin : google détecte-t-il vraiement le cloaking ? C'est vrai çà c'est super simple de modifier sa requête pour se faire passer pour un robot alors si çà se trouve il peut aussi modifier sa requête pour se faire passer pour un utilisateur normal (je suis sur qu'il a des ips cachées).

Est-il risquer de tenter un cloaking ?



Deuxième question :
A partir de quand Google considère-t-il que le contenu est le même pour deux pages ? Se base-t-il uniquement sur le contenu qu'il voit (les textes) ou aussi sur la structure : tables et images ?


Merci beaucoup
 
WRInaute impliqué
Re: Cloaking

clicboutic a dit:
google détecte-t-il vraiement le cloaking ?
Oui il le detecte

clicboutic a dit:
Est-il risquer de tenter un cloaking ?
Je te déconseille d'essayer :wink:

clicboutic a dit:
A partir de quand Google considère-t-il que le contenu est le même pour deux pages ?
Quand le taux de similarité des pages est trop élevé.

clicboutic a dit:
Se base-t-il uniquement sur le contenu qu'il voit (les textes) ou aussi sur la structure : tables et images ?
Sur l'ensemble de la page... Mais étant donné que GoogleBot n'a pas encore d'oeils, je dirais qu'il regarde pas les images mais qu'il prend en compte l'attribut alt :wink:


clicboutic a dit:
Merci beaucoup
De rien :)
 
WRInaute occasionnel
Vu les progrès techniques réalisés et toutes les technologies que gg à racheté, je ne serais pas étonnée que ses bots sachent aussi comparer les images, mais c'est assez difficile à vérifier.
 
WRInaute occasionnel
ah oui !!! et comment il ferait pour comparer deux images de noms différents et url différentes.... en comparent les couleurs, les formes, la définition, les contratses .... avec un truc genre NCIS ???
 
WRInaute occasionnel
Peut être si l'image fait le même poid nan ^^ tout simplement :)
Après si tu la modifie un peu c,'est plus dure ^^
 
WRInaute impliqué
Enormement d'images font le même poid, Google ne peux pas se baser sur ça pour savoir si l'image est la même ou pas.

Par contre, il a peut être des techniques qui compare quelques pixels de chaques images mais je doute fort qu'il s'interesse à ça pour le taux de similarité, sauf pour Google image peut être...
 
WRInaute occasionnel
Ah bah personnelement, sur mes sites j'ai aucune image qui font le même poid à l'octet près et si t en à c'et que tu met les même plusieurs fois de suite alors parce que si t'arrive à créer des images avec le même poid alors que très peu de chose diffère sur l'image je te félicite :)
 
WRInaute accro
On travaille à la fois sur le spectre et sur les formes.
On peut utiliser un FFT (fast fourier transform, transformée de fourier rapide)
et on compare les ratios signal/bruit (SNR, PSNR et MSE) - voir sur Google si vous êtes curieux,
c'est juste un peu technique :)
Si les ratios sont proches, il y a de fortes chances pour que les images soient identiques.

Pour confirmation, on opère une comparaison au niveau des formes, technique déjà archaïque en 2D
et utilisée en 3D jusque dans la très vulgaire robotique des ateliers de montage automobile.

Le processus est rapide et peut être automatisé :)

Enfin, un simple coup d'oeil humain et couic, le copieur est chopé :)

Des robots spécialisés font ça très bien, très cool, sur leur poids, pour les sociétés de droits
d'auteur, les agences de presse et les éditeurs.
 
WRInaute accro
pour répondre à la question initiale, je pense que Google ne s'intéresse qu'au contenu (après avoir extrait le code), aux liens et a la sémantique (qui qualifie le contenu) ... (pour ceux que cela intéresse, nous en avions discuté longuementici)

quant aux images, Szarah a raison, l'analyse spectrale est une des méthodes utilisables ... mais Google, ne le fait pas car ne prenant pas en compte le contenu d'une image (il n'utilise que l'attribut alt des images), il se fiche complètement qu'elles soient identiques ou pas ... :wink:
 
WRInaute impliqué
fra_arf a dit:
Ah bah personnelement, sur mes sites j'ai aucune image qui font le même poid à l'octet

Créer deux images ayant le même poid à l'octet près c'est effectivement assez difficile.
Par contre, mettre la même image sur plusieurs pages c'est facile : Il suffit d'insérer le logo de son site sur toutes les pages et c'est réglé.
(C'est ça que j'ai voulu dire tout à l'heure)

Puis à ce moment là, les images servant pour le design du site serait pris en compte et le taux de similarité serait enorme si Google prend en compte les images dans le taux de similarité.

J'suis tout à fait d'accord avec Cendrillon, et je pense pas que sa interessera Google de comparer les images entre elles...
Surtout pour la similarité des pages.

(Sa aurait été difficile de se positionné pour les phototheque)

Bonne aprem
 
WRInaute impliqué
Pour le cloacking, Google n'est pas infaillible... Je vois certains sites qui font du cloacking depuis plusieurs années sans problème. Et pourtant, il suffirait à Google de lancer un bot anonyme de temps à autres pour verifier les cloackings. Par exemple, si le bot se fait passer pour internet explorer, et si l'IP est nouvelle, le cloacking tombe à l'eau. Pour l'instant je pense que la detection se fait à la main (dénonciations, gros sites connus).
 
WRInaute impliqué
Yvel a dit:
ah oui !!! et comment il ferait pour comparer deux images de noms différents et url différentes.... en comparent les couleurs, les formes, la définition, les contratses .... avec un truc genre NCIS ???

En dernière année d'étude, j'ai du faire un système de vidéosurveillance, avec détection d'intrus (c'est à dire détecter sur une image un intrus).

Croyez moi, c'est pas la partie la plus dure... Et même ca a été peut être la partie la plus simple...
 
Discussions similaires
Haut