Pages exclues dans le webmaster tools

Discussion dans 'Développement d'un site Web ou d'une appli mobile' créé par Topo-cool, 22 Janvier 2020.

  1. Topo-cool
    Topo-cool Nouveau WRInaute
    Inscrit:
    18 Juillet 2011
    Messages:
    35
    J'aime reçus:
    1
    Bonjour,

    J'ai de nombreuses erreurs dans le webmaster tools google de mon site et je me demandais si cela peut nuire au référencement et si il y a quelques choses à faire dans ce cas là.

    Quand je regarde la couverture des pages du sitemap de mon site j'ai environ 800 pages "Valides" et 1500 pages "Exclues", je trouve le nombre de page exclues un peu énorme. Quand je regarde dans les détails les urls des pages exclues, je trouve beaucoup de page avec la bonne url mails il manque le S dans https://
    ou alors des pages avec l'url partielle, ou alors il manque un dossier dans l'url et donc c'est une 404.

    Suis-je le seul à avoir ce problème ? Peut-on y remédier ?

    Cordialement,
     
  2. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 841
    J'aime reçus:
    457
    Tu es loin d'être le seul, mais oui il faut pour la plupart des cas prendre des mesures pour corriger les problèmes, en tout cas quand le problème vient de ton site (et pas d'un lien issu d'un site externe).
     
  3. Topo-cool
    Topo-cool Nouveau WRInaute
    Inscrit:
    18 Juillet 2011
    Messages:
    35
    J'aime reçus:
    1
    Mais comment peut-on expliquer que Google ai encore toutes les pages en HTTP alors que j'ai depuis longtemps envoyé les sitemaps en HTTPS ? Dois je demander la suppression de ces pages ? De toutes façons elle ne sont pas dans l'index Google..
     
  4. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 841
    J'aime reçus:
    457
    envoyer un sitemap ne change rien à l'indexation (des pages dans ce sitemap ou d'autres pages). Je veux dire que ça ne va pas désindexer les autres
    il faut vérifier que les http sont redirigées vers le https

    ensuite il faut poursuivre avec tous les autres problèmes rapportés par Google...
     
    Topo-cool apprécie ceci.
  5. Topo-cool
    Topo-cool Nouveau WRInaute
    Inscrit:
    18 Juillet 2011
    Messages:
    35
    J'aime reçus:
    1
    Merci Admin pour ta réponse très précise une fois de plus d'un point de vue technique.
    Franchement j'aurais juré que mes redirections HTTPS étaient bonnes (depuis des années) et aujourd'hui je viens de découvrir un gros bug grâce à toi.

    Pour le dossier principal pas de problème je crois, si je rentre http://www.cartograf.fr/la_liste_des_villes.php je suis redirigé sur https://www.cartograf.fr/la_liste_des_villes.php

    Par contre... sur tous mes sous-dossiers si je rentre par exemple http://www.cartograf.fr/pays/bhoutan.php
    je suis alors redirigé sur https://www.cartograf.fr/bhoutan.php ( erreur 404 : normal, car la page ne se trouve pas à la racine mais dans le dossier "pays" )

    Voilà donc un gros problème sur mes redirections HTTPS que je traîne sans doute depuis des années, maintenant que j'ai identifié le problème, est ce que quelqu'un sait comment y remédier ou au moins l'expliquer ?

    Merci.
     
  6. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 841
    J'aime reçus:
    457
    il faut nous copier-coller la partie du .htaccess qui gère ces redirections, ou nous expliquer par quel autre moyen tu les gères
     
  7. Topo-cool
    Topo-cool Nouveau WRInaute
    Inscrit:
    18 Juillet 2011
    Messages:
    35
    J'aime reçus:
    1
    Le fichier .htaccess étant un peu mon point faible, je fais un copier coller de tout le fichier :

    Code:
    Options +FollowSymlinks
    RewriteEngine On
    RewriteCond %{SERVER_PORT} 80
    RewriteRule ^(.*)$ https://www.cartograf.fr/$1 [R=301,L]
    #RewriteEngine on
    #RewriteCond %{HTTP_HOST} ^cartograf.fr$
    #RewriteRule ^(.*) http://www.cartograf.fr/$1 [QSA,L,R=301]
    SetEnv PHP_VER 7_3
    SetEnv REGISTER_GLOBALS 0
    errorDocument 404 /page404.php
    errorDocument 403 /page403.php
    Options -Indexes
    RedirectPermanent /contact.html https://www.cartograf.fr/contact.php
    # Mise cache 10 jours
    <FilesMatch ".(flv|gif|jpg|jpeg|png|ico|swf|js|css|pdf|doc)$">
    Header set Cache-Control "max-age=2592000"
    </FilesMatch>
    AddOutputFilterByType DEFLATE text/html text/xml application/xhtml+xml text/plain application/javascript text/css
    ## contrôle du cache navigateur - Expire headers
    <IfModule mod_expires.c>
        ExpiresActive On
        ExpiresDefault "access plus 7200 seconds"
        ExpiresByType image/jpg             "access plus 1 week"
        ExpiresByType image/jpeg             "access plus 1 week"
        ExpiresByType image/png             "access plus 1 week"
        ExpiresByType image/gif             "access plus 1 week"
        AddType image/x-icon .ico
        ExpiresByType image/ico             "access plus 1 week"
        ExpiresByType image/icon             "access plus 1 week"
        ExpiresByType image/x-icon             "access plus 1 week"
        ExpiresByType text/css                 "access plus 1 week"
        ExpiresByType text/javascript         "access plus 1 week"
        ExpiresByType text/html             "access plus 7200 seconds"
        ExpiresByType application/xhtml+xml     "access plus 7200 seconds"
        ExpiresByType application/javascript     "access plus 1 week"
        ExpiresByType application/x-javascript     "access plus 1 week"
        ExpiresByType application/x-shockwave-flash "access plus 1 week"
    </IfModule>
    <IfModule mod_headers.c>
    <FilesMatch "\\.(x?html?|php)$">
    Header set Cache-Control "max-age=600, private, must-revalidate"
    </FilesMatch>
    </IfModule>

    De plus je vais aller voir au niveau des DNS chez OVH, car je crois qu'il y a aussi des entrées à ce niveau qu'il faudrait verifier
     
  8. Topo-cool
    Topo-cool Nouveau WRInaute
    Inscrit:
    18 Juillet 2011
    Messages:
    35
    J'aime reçus:
    1
    la liste des redirections dans les DNS est longue comme le bras, mais rien ne m'a sauté aux yeux. A part peut-être ce doublon :

    cartograf.fr. 0 NS dns200.anycast.me.
    cartograf.fr. 0 NS ns200.anycast.me.

    Est-il vraiment nécessaire ?
     
  9. Topo-cool
    Topo-cool Nouveau WRInaute
    Inscrit:
    18 Juillet 2011
    Messages:
    35
    J'aime reçus:
    1
    Je viens d'enlever le # sur les lignes 5, 6 et 7... mais cela ne change rien a priori. Personne ne sait pourquoi mes sous-dossier ne fonctionnent que en sécurisé ? J'aimerai vraiment régler ce problème...
     
  10. Topo-cool
    Topo-cool Nouveau WRInaute
    Inscrit:
    18 Juillet 2011
    Messages:
    35
    J'aime reçus:
    1
    Problème résolu. Je suis fier de pouvoir dire que j'ai résolu ce problème moi même à force de bidouiller. Enfin je crois ( j'ai encore quelques erreurs sur certaines pages mais je crois que c'est dut à la mise en cache )

    Je partage l'information au cas où d'autres personnes auraient le même problème :

    En fait j'avais bêtement voulu mettre un fichier .htaccess dans tout les dossiers du site, ce qui a probablement créer ce bug, alors qu'un seul fichier .htaccess à la racine est suffisant.

    Reste à voir si j'ai moins d'erreur dans le webmaster tool à l'avenir.
     
  11. indigene
    indigene WRInaute accro
    Inscrit:
    7 Septembre 2003
    Messages:
    4 162
    J'aime reçus:
    174
    Sur un serveur OVH, voici ce que j'ai, mais attention, c'est pour rediriger le https vers le bon vieux http

    Code:
    # Le serveur doit suivre les liens symboliques :
    Options +FollowSymlinks
    RewriteBase /
    
    # Activation du module de réécriture d'URL :
    RewriteEngine on
    
    #--------------------------------------------------
    # Règles de réécriture d'URL :
    #--------------------------------------------------
    
    ErrorDocument 404 /erreur404.php
    
    # forcer le www :
    RewriteCond %{HTTP_HOST} ^example.com$
    RewriteRule ^(.*)   http://www.example.com/$1  [QSA,R=301]
    
    #redirection définitive de https vers http
    RewriteCond %{HTTPS} on
    RewriteRule ^(.*)$ http://%{HTTP_HOST}/$1 [R=301,L]
    
    # éliminer les parametres a la fin de l'url
    RewriteCond %{QUERY_STRING} ^(.*)&?fbclid=[^&]+&?(.*)$ [NC]
    RewriteRule ^(.*)$ /$1?%1%2 [R=302,L]
     
  12. Topo-cool
    Topo-cool Nouveau WRInaute
    Inscrit:
    18 Juillet 2011
    Messages:
    35
    J'aime reçus:
    1
    Merci pour ton aide et ta participation, mais est il vraiment intéressant de rediriger HTTPS vers HTTP alors que maintenant l'heure est au HTTPS ?
     
  13. indigene
    indigene WRInaute accro
    Inscrit:
    7 Septembre 2003
    Messages:
    4 162
    J'aime reçus:
    174
    Ce qui ne serait pas intéressant serait que je redirige le http vers le https alors que j'utilise le http. Il faut toujours rediriger le protocole qu'on n'utilise pas vers celui qu'on utilise, non ? Si toi tu utilise l'autre alors tu fais la redirection dans l'autre sens.
     
  14. Topo-cool
    Topo-cool Nouveau WRInaute
    Inscrit:
    18 Juillet 2011
    Messages:
    35
    J'aime reçus:
    1
    Oui ce n'est pas faux ce que tu dis. Toutefois, sauf erreur de ma part, il est de plus en plus conseillé d'utiliser le HTTPS, surtout avec les nouvelles mises à jour de Chrome qui vont bientôt sortir ( j'ai lu une news à ce sujet ) je ne peux donc que tu conseiller de faire la transformation sur ton site..
     
Chargement...
Similar Threads - exclues webmaster tools Forum Date
Search Console J'ai un problème : 5 pages indexés et 43 exclues Crawl et indexation Google, sitemaps 2 Octobre 2020
Problème de pages exclues Crawl et indexation Google, sitemaps 10 Juin 2020
Mise à jour couverture GSC pages exclues Crawl et indexation Google, sitemaps 9 Avril 2020
URL Exclues Crawl et indexation Google, sitemaps 1 Avril 2020
Search Console Immense quantité de pages exclues qui apparaissent dans la search console Crawl et indexation Google, sitemaps 8 Février 2020
Search Console URL exclues : comment résoudre le problème ? Problèmes de référencement spécifiques à vos sites 15 Novembre 2019
170 K pages de mon site exclues par Google Search Console Débuter en référencement 1 Juillet 2019
WordPress 100% des pages exclues Crawl et indexation Google, sitemaps 15 Mai 2019
Pages exclues avec noindex sur search console Problèmes de référencement spécifiques à vos sites 10 Mai 2019
Pages exclues avec la balise no-index et canonique correcte Problèmes de référencement spécifiques à vos sites 23 Février 2019