Google crawl mon site en HTTP alors qu'il est en HTTPS

Discussion dans 'Crawl et indexation Google, sitemaps' créé par mytamhuyet, 26 Janvier 2019.

  1. mytamhuyet
    mytamhuyet Guest
    Salut à tous,

    Après avoir étudié mes Log, j'ai remarqué que toutes les pages crawler par Google sont redirigés en 301. Oui, car il crawle les URLs en HTTP alors que mon site est en HTTPS.
    Du coup, toutes les URLs HTTP sont redirigées en 301 vers la même page en HTTPS.

    Savez-vous pourquoi ?
    Pourquoi Google ne va-t-il pas crawler directement mon site HTTPS ?

    Merci pour votre aide !!
     
  2. Hudeen
    Hudeen Nouveau WRInaute
    Inscrit:
    26 Janvier 2019
    Messages:
    4
    J'aime reçus:
    0
    Bonjour, as-tu regardé du côté du robot.txt ?
     
  3. Furtif
    Furtif WRInaute passionné
    Inscrit:
    9 Août 2005
    Messages:
    2 489
    J'aime reçus:
    144
  4. Hudeen
    Hudeen Nouveau WRInaute
    Inscrit:
    26 Janvier 2019
    Messages:
    4
    J'aime reçus:
    0
    Dans la racine de ton site sur ton serveur tu as un fichier qui s'appelle robot.txt. Tu peux ouvrir ou fermer les portes aux robots crawler. Je pense qu'il faudrait regarder par là.
     
  5. Furtif
    Furtif WRInaute passionné
    Inscrit:
    9 Août 2005
    Messages:
    2 489
    J'aime reçus:
    144
    bah c'est pas mon site... et comme la boule de cristal de wri est en maintenance, c'est pour ca que je demandais a tout hasard une url...
     
  6. Hudeen
    Hudeen Nouveau WRInaute
    Inscrit:
    26 Janvier 2019
    Messages:
    4
    J'aime reçus:
    0
    Je ne sais pas vers où te guider du coup si tu n'as pas d'accès...
     
  7. colonies
    colonies WRInaute occasionnel
    Inscrit:
    10 Septembre 2006
    Messages:
    473
    J'aime reçus:
    48
    Parce qu'il est possible de faire deux sites complètement différents en fonction du protocole. Du coup Google va recrawler toutes les URL qu'il connaissait déjà en http, c'est normal. Ça n'est pas parce qu'il va rencontrer une URL en 301 vers https qu'il va en déduire que tout ton site est passé en https et qu'il peut trouver les mêmes pages mais chiffrées juste en changeant http en https aux URL qu'il connait.
    De plus, tu pourrais très bien n'avoir passé en https que quelques pages comme celle de login, ou celle de paiement, comme c'était assez courant il y a quelques années.

    Du reste, Google est un peu con et il continue de crawler des URL en http sur mon site, bien que je sois passé au tout https il y a 7 ans, et que mon site est intégré depuis bien longtemps à la liste HSTS preload de Chrome (et reprise pas les autres navigateurs principaux). Malgré ça, il passe toujours faire coucou de temps en temps à des pages via HTTP.
     
Chargement...
Similar Threads - Google crawl HTTPS Forum Date
Google crawl mon site en HTTP alors qu'il est en HTTPS Crawl et indexation Google, sitemaps 24 Mai 2016
googlebot crawle des pages inexistantes Crawl et indexation Google, sitemaps 16 Août 2019
Empêcher Googlebot de crawler/indexer tout un dossier Débuter en référencement 19 Avril 2019
Crawl Google, nombre d'impressions versus position Crawl et indexation Google, sitemaps 5 Avril 2019
Google crawle des pages existant sur d'autres sites Crawl et indexation Google, sitemaps 1 Janvier 2019
Google crawle encore des liens désavoués qui me font des 404 Référencement Google 22 Décembre 2018
En 2018, Google n'utilisera plus la méthode de crawl AJAX basée sur _escaped_fragment_ Référencement Google 5 Décembre 2017
Le budget de crawl de Google : définition et conseils d'optimisation Techniques avancées de référencement 17 Janvier 2017
Google crawle des url inexistantes "mobile" Crawl et indexation Google, sitemaps 8 Janvier 2017
Crawl google reste en statut cours de traitement search console Crawl et indexation Google, sitemaps 22 Décembre 2016
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice