Site hacké et nombreuses pages à désindexer

WRInaute discret
Bonjour à tous et bonne année !

J'ai un problème assez gênant et j'espère pouvoir trouver une solution avec votre aide :)

En mars/avril, le site que je gère a été hacké. Il était sous Wordpress et un manque de vigilance au niveau des mises à jour a permis à quelqu'un de créer ~7.000 pages forex.
Comme le site est lié à mon activité et que je ne souhaitais pas que cela se reproduise, j'ai migré le site sur une plateforme CMS propriétaire.
Depuis, j'ai également activé le SSL sur le site en question.

Les pages forex créées étaient donc sur la version http du site.
Lors de l'activation du SSL, cela a redirigé toutes les pages vers la version https.

Début décembre, j'ai constaté que le site avait pris une claque au niveau de la visibilité de mes contenus :
C0NoDkNXUAAKwAm.jpg



Il n'y aucune pénalité manuelle. J'ai supposé que cela était dû au fait que les contenus forex étaient encore associés à mon site et celui-ci est sans doute considéré comme spammy.
Lorsque je fais "site:mondomaine.ext", il y a encore des pages forex d'indexées mais elles sont sur la version http du site.
Or la version HTTP n'existe plus puisque je redirige tout vers la version https.

Comment dois-je faire pour faire désindexer les versions HTTP alors que je suis en HTTPS ?
Et selon vous, est-ce que le problème pourrait provenir d'autres choses ?

Merci à vous
 
WRInaute accro
Si tu regardes sur GWT, et que tu es toujours sur la propriété du http, c'est normal. Il faut créer une autre propriété pour le https.
 
WRInaute discret
Merci pour vos retours.

Voici plus de détails :

Les 2 propriétés sont présentes dans GWT. Le graphique représente la propriété HTTPS.

Avril : Hack du WP sur http
Mai : "Migration" du domaine vers la plateforme marketing Hubspot avec un CNAME
Mai : Activation d'un certificat SSL & redirection des URLs http vers https
Décembre : Claque sur GWT
Décembre : Disallow des URLs incriminées dans le robots.txt
 
Membre Honoré
Bonjour,

Il aurait été bien de corriger l'indexation avant la migration.
C'est une accumulation d'erreurs, revoir donc la base et le travail réalisé.

Cordialement.
 
WRInaute accro
Les pages sont-elles toujours accessibles ? Car si tu rediriges tout mais que tu n'as pas supprimé les anciennes pages, elles sont encore actives..
 
WRInaute discret
Elles n'existent plus depuis longtemps mais Google n'a pas vraiment décidé de les supprimer :(
J'ai également eu un retour de Madrileno par mp.

Je vais tenter ce qui suit :
  1. Désactiver le CNAME temporairement car il m'empêche d'avoir la main sur le domaine
  2. Mettre un htaccess en place :
    1. Header 410 pour les pages forex
    2. Header 503 avec page de maintenance pour les autres
  3. Soumettre un sitemap des pages forex dans GWT pour "forcer" le crawl
  4. Attendre qq heures/jours qu'elles ne soient plus indexées. Le sitemap me l'indiquera. J'espère que ce ne sera pas trop long
  5. Repartir d'une indexation propre :mrgreen:

Vous en dites quoi ?
 
WRInaute passionné
adviser a dit:
le site que je gère a été hacké [...] a permis à quelqu'un de créer ~7.000 pages forex [...] il y a encore des pages forex d'indexées [...] Décembre : Disallow des URLs incriminées dans le robots.txt [...] Elles n'existent plus depuis longtemps mais Google n'a pas vraiment décidé de les supprimer
Si vous interdisez à Google de crawler les url's incriminées, impossible pour lui de constater qu'elles ne sont plus d'actualité. Faites le ménage et laissez Google accéder à votre contenu pour qu'il puisse faire le ménage à son tour.
 
WRInaute impliqué
lut:)
- prendre le temps de bien TOUT mettre en ordre ...
- laisser à GG le temps de TOUT remettre en ordre ...
Pas simple ni évident, mais faisable ET très long après un 'piratage' .... WP c'est bien mais laisser des failles avec une ancienne version en ligne, là ... après il faut prendre son mal en patience :)
bon courage !
 
Membre Honoré
Bonjour,

En vrac :
- Vérifier les redirections
- Vérifier le code des pages
- Vérifier GWT (Google)
- Et retirer le disallow

C'est facile et rapide à corriger.

Cordialement.
 
WRInaute discret
Bonjour,

Suite à vos retours et au nettoyage qui a été entrepris, le site semble être revenu "à la normale" :

47da081f-ca15-4e49-79f1-3e962c327d56.png


Merci à tous !
 
Discussions similaires
Haut