Salut à tous,
1) Dans la GSC, je trouve 3500 pages dans Pages => Indexation des pages => Exclue par la balise "noindex".
Première question : à quoi ça sert de lister des pages qui ont été exclue par une balise noindex ?
Deuxième question : je ne souhaite pas que Google indexe ces pages, j'ai donc mis dans le code html de ces pages une balise meta robot "noindex" et ces pages renvoie un code http 404. Est-ce la bonne manière de procéder pour qu'elles ne soient pas (plus) indéxées ? Si oui, pourquoi Google continue de crawler ces pages depuis des années et pourquoi il continue de les lister dans Exclue par la balise "noindex" ?
Troisième question : dans ces 3500 pages, il y a en beaucoup qui correspondent à un script php qui se trouve dans mon répertoire /scripts/mon_script.php, puis-je interdire via mon fichier robots.txt le crawl de mon répertoire /scripts/ aux crawlers ? Est-ce la bonne méthode pour que Google arrête de crawler toutes ces urls et qu'il les supprime de Pages => Indexation des pages => Exclue par la balise "noindex" ?
2) Dans la GSC, je trouve 2400 pages dans Pages => Indexation des pages => Page avec redirection.
Première question : je trouve dans la section Page avec redirection beaucoup de très ancienne urls en http. J'ai mis en place depuis des années une redirection des pages en http vers les pages en https et toutes les urls en http listées dans Page avec redirection renvoient bien la page en https, que faire de plus pour que Google arrête de crawler ces pages en http et qu'il arrête de les lister dans Pages => Indexation des pages => Page avec redirection ?
Deuxième question : il arrive parfois que des anciennes urls en http est une double redirection 301 du style http://www.mon-site.com/index.php?rub=ma_page a une redirection 301 vers https://www.mon-site.com/index.php?rub=ma_page puis une autre redirection 301 vers https://www.mon-site.com/ma-page.html est-ce gênant ? Si oui, comment solutionner ce problème de double redirection 301 ?
3) Est-ce que toutes urls (3500 exclue par la balise noindex + 2400 pages avec redirection) peuvent nuire au SEO de mon site et donc à son référencement ? Je pense notamment à l'une des dernières updates de Google son Google Helpful Content qui pourrait générer un signal négatif à l'échelle de mon site.
Merci pour vos réponses.
1) Dans la GSC, je trouve 3500 pages dans Pages => Indexation des pages => Exclue par la balise "noindex".
Première question : à quoi ça sert de lister des pages qui ont été exclue par une balise noindex ?
Deuxième question : je ne souhaite pas que Google indexe ces pages, j'ai donc mis dans le code html de ces pages une balise meta robot "noindex" et ces pages renvoie un code http 404. Est-ce la bonne manière de procéder pour qu'elles ne soient pas (plus) indéxées ? Si oui, pourquoi Google continue de crawler ces pages depuis des années et pourquoi il continue de les lister dans Exclue par la balise "noindex" ?
Troisième question : dans ces 3500 pages, il y a en beaucoup qui correspondent à un script php qui se trouve dans mon répertoire /scripts/mon_script.php, puis-je interdire via mon fichier robots.txt le crawl de mon répertoire /scripts/ aux crawlers ? Est-ce la bonne méthode pour que Google arrête de crawler toutes ces urls et qu'il les supprime de Pages => Indexation des pages => Exclue par la balise "noindex" ?
2) Dans la GSC, je trouve 2400 pages dans Pages => Indexation des pages => Page avec redirection.
Première question : je trouve dans la section Page avec redirection beaucoup de très ancienne urls en http. J'ai mis en place depuis des années une redirection des pages en http vers les pages en https et toutes les urls en http listées dans Page avec redirection renvoient bien la page en https, que faire de plus pour que Google arrête de crawler ces pages en http et qu'il arrête de les lister dans Pages => Indexation des pages => Page avec redirection ?
Deuxième question : il arrive parfois que des anciennes urls en http est une double redirection 301 du style http://www.mon-site.com/index.php?rub=ma_page a une redirection 301 vers https://www.mon-site.com/index.php?rub=ma_page puis une autre redirection 301 vers https://www.mon-site.com/ma-page.html est-ce gênant ? Si oui, comment solutionner ce problème de double redirection 301 ?
3) Est-ce que toutes urls (3500 exclue par la balise noindex + 2400 pages avec redirection) peuvent nuire au SEO de mon site et donc à son référencement ? Je pense notamment à l'une des dernières updates de Google son Google Helpful Content qui pourrait générer un signal négatif à l'échelle de mon site.
Merci pour vos réponses.