Référencement Google des images hébergées sur CDN

Nouveau WRInaute
Bonjour,
Pour le référencement des images par Google, comment fait Googlebot pour rattacher au site principal une image hébergée sur un CDN qui a un autre nom de domaine ? Déclarer dans un sitemap une image ne garantit en rien qu'on soit propriétaire du CDN. Que se passe-t-il si d'autres sites utilisent ces mêmes images sur leur site (sans forcément demander d'accord) ? Google ne va-t-il pas les rattacher à ces sites pirate ?
Savez-vous comment fonctionne Google sur ce point ?
Merci pour vos retours,
Cordialement,
 
WRInaute impliqué
Ce que j'ai remarqué, c'est que Google a bien du mal à trouver la paternité d'une image. J'ai par exemple des sites qui utilisent certaines de mes images (à l'identique) et qui sortent parfois devant moi dans Google Images... (brrr...), les images étant hébergées sur mon domaine.

Il doit y avoir un système de première indexation, autorité du site, pertinence de la page sur la requête... Bref un algo bien obscure comme GG sait en faire.
 
WRInaute discret
Bonjour,

Bonjour,
Pour le référencement des images par Google, comment fait Googlebot pour rattacher au site principal une image hébergée sur un CDN qui a un autre nom de domaine ?

Il y a la possibilité pour le gestionnaire du CDN d'envoyer l'url canonique de l'image par le biais du header de la requête GET.

Par exemple :

```
HTTP/2.0 200 OK
date: Fri, 09 Nov 2018 12:59:59 GMT
server: Apache/2.4.37
link: <https://origin.tld/images/monimage.jpg>; rel="canonical"
expires: Wed, 06 Nov 2019 17:58:40 GMT
cache-control: max-age=31536000
```

Je ne sais pas quels sont les fournisseurs de CDN qui le font.

Un examen des entêtes d'une requête sur une image devrait permettre de vérifier.

Si ce fournisseur utilise pagespeed (Nginx ou Apache), c'est très probable :

https://github.com/apache/incubator-pagespeed-mod/issues/1184

https://github.com/apache/incubator-pagespeed-mod/issues/1222

Codialement,

Eric
 
Discussions similaires
Haut