Problèmes sur la commande "site:URL"

WRInaute discret
Bonjour à tous,

Je viens de remarquer que lorsque que je tape la commande : site:www.maigrir-comment.fr, je n'ai pas toutes les URL de mon site mais une page qui mène vers une erreur de sitemap.

Cependant si je modifie un peu la commande et que je tape : site:http://maigrir-comment.fr/ là j'ai bien toutes les URL de mon site qui apparaissent.

Cela m'inquiète un peu, étant donné que j'ai changé plusieurs fois de plugin sitemap, est ce que j'ai fait une erreur, y'a-t-il un problème dans l'indexation de mon site selon-vous ?

D'avance merci à ceux qui répondront,

Bonne journée
 
WRInaute accro
Sans doute parce que ton site est accessible sans les www et pas avec les www ? Et que tu as du inclure des urls avec www dans le sitemap ? interdis le à l'indexation / crawl via le robots.txt, normalement il ne devrait pas être indexé

(ce n'est pas une erreur 404 qui s'affiche, mais une information sur un problème d'affichage de la feuille de style)
 
WRInaute discret
Bonjour Marie-Aude,

Pourtant mon site est bien accessible avec et sans les "www" je ne comprends pas.

Pourquoi dis-tu que mon site ne devrait pas être indexé, je ne comprends pas ?
 
WRInaute occasionnel
Bonjour,

Il y a effectivement dans ton code un paramètre pour que ton site ne soit pas accessible avec et sans les www (ce qui est bien)
tape la commande site: sans les www et tes url apparaissent bien

par contre tu as déclaré ton sitemap dans ton fichiers robots.txt avec une url qui contient les www; il faut les enlever
 
WRInaute accro
Il y a un problème avec le plugin wordpress :

Code:
Warning: _() expects exactly 1 parameter, 2 given in /homepages/5/d454962684/htdocs/wordpress/wp-content/themes/bueno/404.php on line 11


Warning: _() expects exactly 1 parameter, 2 given in /homepages/5/d454962684/htdocs/wordpress/wp-content/themes/bueno/404.php on line 12
 
WRInaute accro
Marie-Aude a dit:
interdis le à l'indexation / crawl via le robots.txt, normalement il ne devrait pas être indexé

Si on interdit l'accès au sitemap.xml dans robot.txt, comment google peut-il lire le sitemap et l'utiliser ?

La solution est de lui faire retourner un code "noindex" via .htaccess
 
Discussions similaires
Haut