Pages exclues dans le webmaster tools

Nouveau WRInaute
Bonjour,

J'ai de nombreuses erreurs dans le webmaster tools google de mon site et je me demandais si cela peut nuire au référencement et si il y a quelques choses à faire dans ce cas là.

Quand je regarde la couverture des pages du sitemap de mon site j'ai environ 800 pages "Valides" et 1500 pages "Exclues", je trouve le nombre de page exclues un peu énorme. Quand je regarde dans les détails les urls des pages exclues, je trouve beaucoup de page avec la bonne url mails il manque le S dans https://
ou alors des pages avec l'url partielle, ou alors il manque un dossier dans l'url et donc c'est une 404.

Suis-je le seul à avoir ce problème ? Peut-on y remédier ?

Cordialement,
 
Olivier Duffez (admin)
Membre du personnel
Tu es loin d'être le seul, mais oui il faut pour la plupart des cas prendre des mesures pour corriger les problèmes, en tout cas quand le problème vient de ton site (et pas d'un lien issu d'un site externe).
 
Nouveau WRInaute
Mais comment peut-on expliquer que Google ai encore toutes les pages en HTTP alors que j'ai depuis longtemps envoyé les sitemaps en HTTPS ? Dois je demander la suppression de ces pages ? De toutes façons elle ne sont pas dans l'index Google..
 
Olivier Duffez (admin)
Membre du personnel
envoyer un sitemap ne change rien à l'indexation (des pages dans ce sitemap ou d'autres pages). Je veux dire que ça ne va pas désindexer les autres
il faut vérifier que les http sont redirigées vers le https

ensuite il faut poursuivre avec tous les autres problèmes rapportés par Google...
 
Nouveau WRInaute
Merci Admin pour ta réponse très précise une fois de plus d'un point de vue technique.
Franchement j'aurais juré que mes redirections HTTPS étaient bonnes (depuis des années) et aujourd'hui je viens de découvrir un gros bug grâce à toi.

Pour le dossier principal pas de problème je crois, si je rentre http://www.cartograf.fr/la_liste_des_villes.php je suis redirigé sur https://www.cartograf.fr/la_liste_des_villes.php

Par contre... sur tous mes sous-dossiers si je rentre par exemple http://www.cartograf.fr/pays/bhoutan.php
je suis alors redirigé sur https://www.cartograf.fr/bhoutan.php ( erreur 404 : normal, car la page ne se trouve pas à la racine mais dans le dossier "pays" )

Voilà donc un gros problème sur mes redirections HTTPS que je traîne sans doute depuis des années, maintenant que j'ai identifié le problème, est ce que quelqu'un sait comment y remédier ou au moins l'expliquer ?

Merci.
 
Olivier Duffez (admin)
Membre du personnel
il faut nous copier-coller la partie du .htaccess qui gère ces redirections, ou nous expliquer par quel autre moyen tu les gères
 
Nouveau WRInaute
Le fichier .htaccess étant un peu mon point faible, je fais un copier coller de tout le fichier :

Code:
Options +FollowSymlinks
RewriteEngine On
RewriteCond %{SERVER_PORT} 80
RewriteRule ^(.*)$ https://www.cartograf.fr/$1 [R=301,L]
#RewriteEngine on
#RewriteCond %{HTTP_HOST} ^cartograf.fr$
#RewriteRule ^(.*) http://www.cartograf.fr/$1 [QSA,L,R=301]
SetEnv PHP_VER 7_3
SetEnv REGISTER_GLOBALS 0
errorDocument 404 /page404.php
errorDocument 403 /page403.php
Options -Indexes
RedirectPermanent /contact.html https://www.cartograf.fr/contact.php
# Mise cache 10 jours
<FilesMatch ".(flv|gif|jpg|jpeg|png|ico|swf|js|css|pdf|doc)$">
Header set Cache-Control "max-age=2592000"
</FilesMatch>
AddOutputFilterByType DEFLATE text/html text/xml application/xhtml+xml text/plain application/javascript text/css
## contrôle du cache navigateur - Expire headers
<IfModule mod_expires.c>
    ExpiresActive On
    ExpiresDefault "access plus 7200 seconds"
    ExpiresByType image/jpg             "access plus 1 week"
    ExpiresByType image/jpeg             "access plus 1 week"
    ExpiresByType image/png             "access plus 1 week"
    ExpiresByType image/gif             "access plus 1 week"
    AddType image/x-icon .ico
    ExpiresByType image/ico             "access plus 1 week"
    ExpiresByType image/icon             "access plus 1 week"
    ExpiresByType image/x-icon             "access plus 1 week"
    ExpiresByType text/css                 "access plus 1 week"
    ExpiresByType text/javascript         "access plus 1 week"
    ExpiresByType text/html             "access plus 7200 seconds"
    ExpiresByType application/xhtml+xml     "access plus 7200 seconds"
    ExpiresByType application/javascript     "access plus 1 week"
    ExpiresByType application/x-javascript     "access plus 1 week"
    ExpiresByType application/x-shockwave-flash "access plus 1 week"
</IfModule>
<IfModule mod_headers.c>
<FilesMatch "\\.(x?html?|php)$">
Header set Cache-Control "max-age=600, private, must-revalidate"
</FilesMatch>
</IfModule>


De plus je vais aller voir au niveau des DNS chez OVH, car je crois qu'il y a aussi des entrées à ce niveau qu'il faudrait verifier
 
Nouveau WRInaute
la liste des redirections dans les DNS est longue comme le bras, mais rien ne m'a sauté aux yeux. A part peut-être ce doublon :

cartograf.fr. 0 NS dns200.anycast.me.
cartograf.fr. 0 NS ns200.anycast.me.

Est-il vraiment nécessaire ?
 
Nouveau WRInaute
Je viens d'enlever le # sur les lignes 5, 6 et 7... mais cela ne change rien a priori. Personne ne sait pourquoi mes sous-dossier ne fonctionnent que en sécurisé ? J'aimerai vraiment régler ce problème...
 
Nouveau WRInaute
Problème résolu. Je suis fier de pouvoir dire que j'ai résolu ce problème moi même à force de bidouiller. Enfin je crois ( j'ai encore quelques erreurs sur certaines pages mais je crois que c'est dut à la mise en cache )

Je partage l'information au cas où d'autres personnes auraient le même problème :

En fait j'avais bêtement voulu mettre un fichier .htaccess dans tout les dossiers du site, ce qui a probablement créer ce bug, alors qu'un seul fichier .htaccess à la racine est suffisant.

Reste à voir si j'ai moins d'erreur dans le webmaster tool à l'avenir.
 
WRInaute accro
Sur un serveur OVH, voici ce que j'ai, mais attention, c'est pour rediriger le https vers le bon vieux http

Code:
# Le serveur doit suivre les liens symboliques :
Options +FollowSymlinks
RewriteBase /

# Activation du module de réécriture d'URL :
RewriteEngine on

#--------------------------------------------------
# Règles de réécriture d'URL :
#--------------------------------------------------

ErrorDocument 404 /erreur404.php

# forcer le www :
RewriteCond %{HTTP_HOST} ^example.com$
RewriteRule ^(.*)   http://www.example.com/$1  [QSA,R=301]

#redirection définitive de https vers http
RewriteCond %{HTTPS} on
RewriteRule ^(.*)$ http://%{HTTP_HOST}/$1 [R=301,L]

# éliminer les parametres a la fin de l'url
RewriteCond %{QUERY_STRING} ^(.*)&?fbclid=[^&]+&?(.*)$ [NC]
RewriteRule ^(.*)$ /$1?%1%2 [R=302,L]
 
Nouveau WRInaute
Merci pour ton aide et ta participation, mais est il vraiment intéressant de rediriger HTTPS vers HTTP alors que maintenant l'heure est au HTTPS ?
 
WRInaute accro
Ce qui ne serait pas intéressant serait que je redirige le http vers le https alors que j'utilise le http. Il faut toujours rediriger le protocole qu'on n'utilise pas vers celui qu'on utilise, non ? Si toi tu utilise l'autre alors tu fais la redirection dans l'autre sens.
 
Nouveau WRInaute
Oui ce n'est pas faux ce que tu dis. Toutefois, sauf erreur de ma part, il est de plus en plus conseillé d'utiliser le HTTPS, surtout avec les nouvelles mises à jour de Chrome qui vont bientôt sortir ( j'ai lu une news à ce sujet ) je ne peux donc que tu conseiller de faire la transformation sur ton site..
 
Discussions similaires
Haut