Migration http vers https : reste encore des pages indexées en http

WRInaute passionné
BOnjour,

Cela fait plus d'un an que j'ai migré mon site de HTTP en HTTPS
J'ai fait ce qu'il fallait dans mon htaccess pour faire de belles redirections 301 s'il exsite encore des liens HTTP sur le net (en interne mon site est nickel, que du httpS)

Je remarque ce jour qu'ils me restent encore 500 pages indexées dans "couverture de l'index"
dans "etat de l'indexation" il y a 62 pages
et que Google continue de crawler environ 500 pages aussi par jour (autant que pour mon site HTTPS

est ce normal après tout ce temps ?

pour info j'ai enlevé le sitemap http au bout de quelques mois (+ de 6 mois) après la migration
 
Membre Honoré
Bonjour,

Ce n'est pas normal.

Il y a plusieurs possibilités concernant ce problème :
- Problèmes de crawls du robot de Google (tester avec Search Console)
- Laisser le fichier sitemap tant que tout n'est pas bien indexé en HTTPS
Comme dit @lecouti : "un sitemap pour inciter Google à repasser dessus" (source).
- Problèmes possibles avec les pages qui sont redirigées
- Problèmes lors de la migration des pages en HTTPS
etc. ; vous pouvez indiquer l'URL du site si vous souhaitez que les personnes de la communauté d'entraide puissent vérifier.

Temps de réponse : 10 minutes.
Cordialement.
 
WRInaute passionné
au niveau HTTPS tous est OK

c juste qu'il traine des pages en HTTP, est ce grave ou pas ?

ou dois je les désindexer manuellement ("URL à supprimer")
 
WRInaute accro
De mon expérience, si Google peine à désindexer une page en http alors que tout le site a été basculé, c'est souvent qu'il reste des liens vers ces url. Fais déjà une passe on site, via un outil comme Screaming Frog, et ensuite jettes un oeil à tes liens externes.
 
WRInaute accro
ça fait 2 fois que je te dis que tout es OK en interne. Pourquoi tu insistes ?
Parce que sans url, il peut pas deviner et qu'il veut s'assurer que tu as bien compris ce dont il te parle...

il t'as posé une question et tu n'as pas repondu.... "avec un soft ?"

"Allo Paulo, ma bagnole ne demarre pas, tu peux me dire d'ou ca vient ?"
 
Olivier Duffez (admin)
Membre du personnel
et quand il vous dit plusieurs fois qu'il a déjà vérifié, pourquoi ne le croyez-vous pas ?
dans d'autres discussions il dit qu'il a fait un audit RM Tech ;-)

à mon avis il faut exporter les URL crawlées en http, listées dans "couverture de l'index" et vérifier les redirections vers https.
ensuite, il faudrait vérifier si des backlinks importants pointent vers du http et si possible les faire modifier pour qu'ils pointent directement vers https
 
WRInaute passionné
déjà fait, toutes les pages en http sont rediriger vers https (de plus c'est automatisé)

les pages restantes en http n'ont pas de backlink externes
 
WRInaute accro
Regarder du côté des BL EXTERNES. Et j'insistais parce que vu qu'on a pas l'url, difficile de savoir ce que tu comprends de nos conseils, hein...
 
WRInaute passionné
Regarder du côté des BL EXTERNES
déjà répondu aussi à cette question juste avant
après analyse ce sont toutes des pages orphelines à ce jour (ni lien interne, ni lien externe)

j'ai du enlever l'ancien sitemap http, un peu tot, je vais le remettre voir ce que ça donne avec la liste de ces 500 pages et normalement GG devrait constater qu'elles sont toutes redirigés en 301 vers HTTPS. qu'en pensez-vous ?
par contre au moins les 3/4 des pages n'existent plus en httpS. je vais essayer de les supprimer "à la main" avec l'outil URL à supprimer. Qu'en pensez vous ?
 
WRInaute passionné
oui tout est OK la dessus
je confirme que toutes ces pages n'existent plus (nin en http , ni en https)
le header de ces pages renvoi d'abord un 301 (conversion http vers https) puis code 404 ou 410


et à part une dizaine de pages, la dernière exploration est vieille d'au moins 6 mois voir 1 an pour ces pages

et quand je fais un site: ou un info: sur ces pages dans Google, il n'y a rien du tout
 
WRInaute accro
Ouais mais comme dit plus haut, les commandes Google ne reflètent pas forcément la réalité (notamment site:). J'ai personnellement hâte qu'ils sortent leur outil d'analyse par url de l'indexation.
 
WRInaute passionné
c suroui je sais mais il faut bien se baser sur qqe choses
meme dans la search console les chiffres sont différents
par exemple pour mon site HTTPS (le principal), j'ai 11300 pages d'indexées, alors que lorsque je regarde dans "couverture de l'index" (nouvelle version) j'ai 3770 pages actives indexées !
Comment analyser ou comprendre ces chiffres ?

sinon au bout de combien de temps n'avez vous plus eu de pages indexées sur vos anciens site HTTP ?
 
Olivier Duffez (admin)
Membre du personnel
j'ai le même genre d'écarts et c'est effectivement perturbant. La nouvelle search console n'invente pas des URL je pense, j'ai l'impression qu'elle est plus précise (et complète) pour cette partie.

le temps d'attente pour voir disparaitre http dépend énormément de la taille du site. Pour WRI ce n'est pas fini malgré une migration mi décembre 2017, il en reste encore quelques centaines
 
WRInaute passionné
ok c rassurant, la seule chose qui m'inquiète c qu'il s'agissent de pages qui n'existent plus (code http 301 pui 404/410)

dois je faire le sitemap quand même ?
 
WRInaute passionné
et oui le 301 est du à la redirection http vers httpS dans mon htaccess suite à la migration

je ne peux effectivement pas éviter cela
 
Discussions similaires
Haut