Google crawl mon site en HTTP alors qu'il est en HTTPS

M
mytamhuyet
Guest
Salut à tous,

Après avoir étudié mes Log, j'ai remarqué que toutes les pages crawler par Google sont redirigés en 301. Oui, car il crawle les URLs en HTTP alors que mon site est en HTTPS.
Du coup, toutes les URLs HTTP sont redirigées en 301 vers la même page en HTTPS.

Savez-vous pourquoi ?
Pourquoi Google ne va-t-il pas crawler directement mon site HTTPS ?

Merci pour votre aide !!
 
WRInaute impliqué
Oui, car il crawle les URLs en HTTP alors que mon site est en HTTPS.
Du coup, toutes les URLs HTTP sont redirigées en 301 vers la même page en HTTPS.

Savez-vous pourquoi ?

Parce qu'il est possible de faire deux sites complètement différents en fonction du protocole. Du coup Google va recrawler toutes les URL qu'il connaissait déjà en http, c'est normal. Ça n'est pas parce qu'il va rencontrer une URL en 301 vers https qu'il va en déduire que tout ton site est passé en https et qu'il peut trouver les mêmes pages mais chiffrées juste en changeant http en https aux URL qu'il connait.
De plus, tu pourrais très bien n'avoir passé en https que quelques pages comme celle de login, ou celle de paiement, comme c'était assez courant il y a quelques années.

Du reste, Google est un peu con et il continue de crawler des URL en http sur mon site, bien que je sois passé au tout https il y a 7 ans, et que mon site est intégré depuis bien longtemps à la liste HSTS preload de Chrome (et reprise pas les autres navigateurs principaux). Malgré ça, il passe toujours faire coucou de temps en temps à des pages via HTTP.
 
Discussions similaires
Haut