Désindexation - Besoin de vos retours !

Discussion dans 'Demandes d'avis et de conseils sur vos sites' créé par Mathématiques-web, 17 Août 2020.

  1. Mathématiques-web
    Mathématiques-web Nouveau WRInaute
    Inscrit:
    7 Octobre 2014
    Messages:
    7
    J'aime reçus:
    0
    Bonjour,

    Je viens de prendre la gestion d'un site vitrine faisant la promotion d'un cabinet comptable basé au Brésil :
    http://www.europartner.com.br/

    Le site existe depuis plusieurs années, avec un positionnement SEO correct (1ère page) sur des requêtes anglo-saxonnes.

    Problème : Ce site a subi une désindexation il y a quelques semaines. Il a désormais disparu des radars Google.

    Search console indique que l'url est bloquée par le Robots.txt, que voici :
    User-agent: *
    Disallow: /wp-admin/
    Allow: /wp-admin/admin-ajax.php

    Avez-vous une idée de la cause de cette désindexation ?
    Puisque le motif évoqué par Search console est erroné, comment faire réindexer ce site ?
    Des idées de pistes ?

    Merci mille fois pour vos retours,

    M.
     
  2. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 832
    J'aime reçus:
    455
    il faudrait mieux s'occuper du passage à HTTPS, c'est pas géré comme il faut pour l'instant.

    quelle URL est indiquée comme bloquée ?
     
  3. Mathématiques-web
    Mathématiques-web Nouveau WRInaute
    Inscrit:
    7 Octobre 2014
    Messages:
    7
    J'aime reçus:
    0
    le passage à https, ok, mais ce n'est pas ça qui conditionne une désindexation, si ?

    L'url : http://www.europartner.com.br/ est indiquée comme bloquée par le robots.txt selon la Search.
     
  4. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 832
    J'aime reçus:
    455
    ici tu te prends la tête avec une URL en HTTP alors que le site est censé être en HTTPS. Je te conseille donc de finaliser la migration vers HTTPS...

    en effet, Google semble considéré être bloqué au crawl
    quelle version du fichier robots.txt Google indique-t-il dans https://www.google.com/webmasters/tools/robots-testing-tool?hl=fr pour cette propriété ?
     
  5. Mathématiques-web
    Mathématiques-web Nouveau WRInaute
    Inscrit:
    7 Octobre 2014
    Messages:
    7
    J'aime reçus:
    0
    ok pour HTTPS.

    dernière version vue le 23/07/2020 14:31 OK (200) O octets
     
  6. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 832
    J'aime reçus:
    455
  7. Mathématiques-web
    Mathématiques-web Nouveau WRInaute
    Inscrit:
    7 Octobre 2014
    Messages:
    7
    J'aime reçus:
    0
    oui on parle bien de ce fichier.
    et il n'a pas été touché depuis des lustres...
     
  8. Mathématiques-web
    Mathématiques-web Nouveau WRInaute
    Inscrit:
    7 Octobre 2014
    Messages:
    7
    J'aime reçus:
    0
  9. eldk
    eldk WRInaute discret
    Inscrit:
    23 Juillet 2003
    Messages:
    154
    J'aime reçus:
    16
    Bonjour,

    https:// .../robots.txt ne redirige pas vers http comme le font les autres pages (accueil ...) . Idem pour les sitemaps qui répondent en http ou https .

    Les en-têtes des sitemaps comportent : X-Robots-Tag: noindex, follow . N'ayant jamais vu, je ne sais pas si cela peut avoir une influence.

    Code:
    HTTP/1.1 200 OK
    Date: Tue, 18 Aug 2020 11:59:37 GMT
    Content-Type: text/xml; charset=UTF-8
    Transfer-Encoding: chunked
    Connection: keep-alive
    Set-Cookie: __cfduid=d0dde8a5b10391541ba67d5a7156ba0361597751976; expires=Thu, 17-Sep-20 11:59:36 GMT; path=/; domain=.europartner.com.br; HttpOnly; SameSite=Lax
    X-Frame-Options: SAMEORIGIN
    X-Robots-Tag: noindex, follow
    CF-Cache-Status: DYNAMIC
    cf-request-id: 04a3097c0e0000e93043033200000001
    Expect-CT: max-age=604800, report-uri="https://report-uri.cloudflare.com/cdn-cgi/beacon/expect-ct"
    Server: cloudflare
    CF-RAY: 5c4b78401acce930-MRS
    Pour le soft 404, c'est peut-être un soucis passager : page envoyée sans contenu avec une réponse 200 à un moment ... Google qui a eu le hoquet . Voir dans les logs du serveur web : page/réponse 200/ taille octets envoyés < taille page en temps normal.

    Voir également au niveau des DNS si les propriétés sont ainsi indiquées à Google (changements ...).

    Est ce que le site n'a pas été basculé en https puis rebasculé en http ...

    Comme O. l'indique, je chercherai de ce côté là. C'est un peu confus ... Il faut mettre d'aplomb.

    Cordialement,

    Eric

    `PS : https://www.ssllabs.com/ssltest/analyze.html?d=www.europartner.com.br&s=104.28.6.27
     
  10. Mathématiques-web
    Mathématiques-web Nouveau WRInaute
    Inscrit:
    7 Octobre 2014
    Messages:
    7
    J'aime reçus:
    0
    Merci beaucoup pour votre retour et votre aide.
    Je vais chercher dans cette direction.
     
  11. eldk
    eldk WRInaute discret
    Inscrit:
    23 Juillet 2003
    Messages:
    154
    J'aime reçus:
    16
    Si tu as accès à la Search Console Google, et que les sitemaps lui sont envoyés, tu peux aller voir également la couverture d'indexation pour chaque sitemap (un bouton en haut à droite : "voir la couverture d'indexation").
     
  12. Mathématiques-web
    Mathématiques-web Nouveau WRInaute
    Inscrit:
    7 Octobre 2014
    Messages:
    7
    J'aime reçus:
    0
    Le problème, c'est que j'ai soumis des Sitemaps via la Search justement. Et que la search détecte une erreur à chaque fois : "sitemap vide".
    Voici les urls soumises :
    http://www.europartner.com.br/sitemap_index.xml
    http://www.europartner.com.br/page-sitemap.xml
    http://www.europartner.com.br/post-sitemap.xml

    C'est quand-même bizarre...
     
  13. eldk
    eldk WRInaute discret
    Inscrit:
    23 Juillet 2003
    Messages:
    154
    J'aime reçus:
    16
Chargement...
Similar Threads - Désindexation Besoin retours Forum Date
Désindexation après erreur technique : besoin de réexamen ? Crawl et indexation Google, sitemaps 23 Février 2011
Search Console Google n'explore pas les liens du sitemap (de desindexation) Crawl et indexation Google, sitemaps 6 Juillet 2020
WordPress Désindexation en masse de mes pages Problèmes de référencement spécifiques à vos sites 1 Juillet 2020
Search Console désindexation url spam Crawl et indexation Google, sitemaps 11 Février 2020
Désindexation des images quasi totales YouTube, Google Images et Google Maps 1 Décembre 2019
WordPress Désindexation / réindexation Débuter en référencement 21 Novembre 2019
Comment accélérer la désindexation de pages en noindex Crawl et indexation Google, sitemaps 17 Novembre 2019
Désindexation Bing Débuter en référencement 27 Août 2019
Désindexation pdf via htaccess Crawl et indexation Google, sitemaps 9 Juillet 2019
Bug Google : désindexation de pages Référencement Google 7 Avril 2019