Actions pour "nettoyer" un site...votre avis ?

Nouveau WRInaute
Bonjour
j'essaye de "nettoyer" un site a deux niveaux différents. Il s'agit d'un site d'une association nationale d'un corps de métiers dans le monde du chauffage et énergie. Pas de vente en ligne.
Ce site a connu une ancienne version sous Drupal qui fut "hackée" avec création d'environ 150 pages internes sur des sujets comme RayBan Brad Pitt, Oakley, Pregnancy etc.. En plus de cela, plusieurs centaines de bcklink ont été mis en place depuis des sites externes vers ces pages.
Le site dispose d'une nouvelle version depuis 8 mois avec nouveau sitemap déclaré et indexé par GG.
Un fichier de desavoeu des domaines et liens a été envoyé plusieurs fois.

Actuellement, la commande site: remonte tout de même pas mal d'anciennes pages "sales" dans l'index, malgré la demande de "revisite" dans Search Console
La même console continue d'indiquer les liens désavoués ( mais je pense que c'est normal non ?)
Création de nouveaux BL via des blogs spécialisés...

Malgré tout cela, le site reste bloqué au dela du top 100 sauf sur la requête exacte du nom de l'association ( top 1 et 2) sur le nom et l'acronyme du non

Des idées ? des recommandations ?
Je suis ouvert à toutes les discussions et retours d'expérience
merci d'avance
 
Nouveau WRInaute
les anciennes pages encore dans l'index envoient les anciennes balises titles et descriptions
Et bien sur, il s'agit ensuite de 404 quand on les clique depuis Google
 
WRInaute accro
Si ces pages sont dans un dossier (ou des dossiers), il est possible de les désindexer en masse (en désindexant le dossier) via Search Console.
 
Nouveau WRInaute
@UsagiYojimbo ces pages n'existent plus du tout... depuis 7 ou 8 mois.
Ce n'est plus le même CMS, plus le même hébergement, plus les mêmes urls et toutes les pages spammy ont toutes été abandonnée
Mais elles restent dans l'index de GG
Et l'outil de desindex de Search console c'est celui qui est temporaire ?
 
Membre Honoré
Bonjour,
Il s'agit d'un site d'une association nationale d'un corps de métiers dans le monde du chauffage et énergie. Pas de vente en ligne.
Vous pouvez indiquer le lien pour que les membres de la communauté puissent vérifier l'indexation du site.
La même console continue d'indiquer les liens désavoués ( mais je pense que c'est normal non ?)
C'est normal.
Création de nouveaux BL via des blogs spécialisés...
Il faudrait vérifier les liens réalisés.
Malgré tout cela, le site reste bloqué au dela du top 100 sauf sur la requête exacte du nom de l'association ( top 1 et 2) sur le nom et l'acronyme du non
Il semble y avoir une pénalité, il faudra l'URL pour différentes vérifications.
Des idées ? des recommandations ?
Vérifier quelles sont les pages encore indexées qui ne devraient pas l'être.
Vérifier si certaines pages indexées mises à jour (sans 404) sont à jour.
Vérifier les travaux SEO pour savoir s'il y a une influence ou pas.
Vérifier si le site est pénalisé (et si une ou plusieurs pénalités).

Temps de réponse : 10 minutes.
Cordialement.
 
Nouveau WRInaute
Bonjour Madrileño et merci pour la réponse

Il semble y avoir une pénalité,
il faudra l'URL pour différentes vérifications.[/QUOTE]
Oui c'est bien ce que je pense, c'est le premier qui me résiste autant et vu le nombre d'url pourries qui pointent ( pointaient) vers les pages spammy, cela me semble tout à fait normal.
Par contre c'est le temps mis pour sortir qui est long

il faudra l'URL pour différentes vérifications.
https:www.afpac.org
Je suis à votre écoute

Vérifier quelles sont les pages encore indexées qui ne devraient pas l'être.
En passant via la commande site: il en reste encore pas mal oui
Vérifier si certaines pages indexées mises à jour (sans 404) sont à jour.
Les nouvelles pages sont correctement indéxées sauf celle avec des accès restreint par un login (normal). Les pages AMP commencent à remonter aussi.
Vérifier les travaux SEO pour savoir s'il y a une influence ou pas.
Quelques BL propres et classiques pour tester pendant quelques semaines, en parallèle même pratique avec un autre site perso sur la même théma...l'autre site à gagné bcp de positions.
Vérifier si le site est pénalisé (et si une ou plusieurs pénalités).
Ben...euh....
 
Membre Honoré
Bonjour,
Je suis à votre écoute
Site qui semble bien pénalisé, mais pas que pour le problème cité avec ce sujet.
Il faudra donc aussi bien corriger le problème d'indexation, que le SEO du site.
Edit : Ce n'est pas qu'une erreur 404, revoir les bases.
Quelques BL propres et classiques
A vérifier tout de même.
Si vous voulez toutes les faire disparaître, il faut toutes les supprimer, oui.
Elles peuvent revenir quand même après les 90 jours.
Cf. anciens sujets du forum et l'aide de Google :
A successful request lasts only about 90 days. After that, your information can appear on Google search results
.

Temps de réponse : 15 minutes.
Edit vérifications URL : 10 minutes.

Cordialement.
 
Dernière édition:
Membre Honoré
Bonjour,
Si elle est en 404, elle ne va pas à nouveau se retrouver indexé
En théorie (cf. d'anciens sujets).
Mais le problème ici est autre, puisque la gestion des erreurs est mauvaise.
Ce qui explique les problèmes d'indexation des anciennes pages.

Temps de réponse : 5 minutes.
Cordialement.
 
Dernière édition:
Nouveau WRInaute
[QUOTE="Madrileño]

Site qui semble bien pénalisé, mais pas que pour le problème cité avec ce sujet.
Il faudra donc aussi bien corriger le problème d'indexation, que le SEO du site.
Edit : Ce n'est pas qu'une erreur 404, revoir les bases.[/QUOTE]

Bonsoir @Madrileño et merci pour les réponses. Désolé pour ma réactivité....grippée elle aussi.
Quand vous évoqué d'autres problèmes, est ce que vous parlez de problème d'ancres pénalisées par Pingouin ?

[QUOTE="Madrileño]Mais le problème ici est autre, puisque la gestion des erreurs est mauvaise.
Ce qui explique les problèmes d'indexation des anciennes pages.[/QUOTE]
Qu'entendez vous par "la gestion des erreurs est mauvaise" ?

Merci d'avance
 
Membre Honoré
Bonjour,

Quand vous évoqué d'autres problèmes, est ce que vous parlez de problème d'ancres pénalisées par Pingouin ?
Problèmes d'optimisations du site Internet, des liens, etc. l'ensemble à corriger.

Quelques exemples :
- Les répétitions inutiles du mot-clé AFPAC sur le site Internet
- Se méfier de certains mots-clés qui sont par exemple inclus dans :
"Association Française pour les Pompes A Chaleur".
- Les sur-optimisations inutiles (en faire trop pour les moteurs)
- Corriger les erreurs concernant les pénalités actuelles du site
- Vérifier les bases web aussi concernant le site Internet
Qu'entendez vous par "la gestion des erreurs est mauvaise" ?
C'est clair comme phrase en français (il suffit de vérifier la gestion des erreurs du site AFPAC).

Concernant le référencement naturel
Si vous pensez que le référencement naturel est compliqué, c'est normal. Au début, tout est compliqué, mais avec le temps c'est la routine, comme pour beaucoup d'autres métiers. Il faut donc savoir être patient, aussi bien au niveau de l'acquisition du savoir qui peut être long, que l'optimisation et le travail à réaliser avec le site Internet pour être bien positionné face aux concurrents. Motivation, temps et patience sont les meilleurs alliés pour le référencement naturel d'un site Internet.

Questionnaire SEO
Vous pouvez aussi si vous le souhaitez, tester votre niveau en référencement naturel de base avec le sujet suivant : lien vers le sujet via le forum. Pour savoir si vous avez assez vérifié et appris les bases en référencement naturel pour améliorer le site Internet que vous avez et ainsi améliorer vos connaissances concernant le référencement naturel de manière à être devant vos concurrents avec le temps et avoir un meilleur positionnement donc avec les moteurs comme (par exemple) ceux de Google ou Bing.

Temps de réponse : 15 minutes.
Cordialement.
 
Nouveau WRInaute
Merci pour toutes les réponses sur la sur optimisation et lien vers le test (fait)

Mais justement, pour revenir au sujet principal : les pénalités "spammy"
Ma question était de savoir comment faire en sorte de ne plus les faire indexer par Google.
L'outil via Console n'est que temporaire
Les pages concernées donnent des 404, j'ai lu que rien ne servait de déclarer des 410, Google voyait la même chose, est ce exact ?
 
Nouveau WRInaute
1412851785-79673-brad-pitt-spoiler-alert-gif-m9xc.gif
 
Membre Honoré
Bonjour,


Il semble que vous ne compreniez toujours pas l'erreur de base concernant la gestion des erreurs 404 que vous souhaitez utiliser pour le site Internet de l'AFPAC. Donc, voici une explication pour mieux comprendre le problème des pages 404 du site Internet que vous devez travailler.

Quand vous réalisez une page 404 ou que vous faites passer une ancienne page en erreur 404 avec un site Internet (celui-ci ou un autre site Internet de vos clients), vous devez toujours vérifier si la page 404 s'affiche correctement (pour mieux comprendre : vérifier si la page est bien gérée de base par le CMS et que la page s'affiche bien en erreur 404 pour les utilisateurs et pour les moteurs) et vérifier aussi si les pages pour lesquelles vous souhaitez l'affichage du code d'erreur 404 ont le bon code (pour faire simple, sachant que l'exemple du site Internet actuel est l'exemple qu'il ne faut pas faire, c'est expliqué en détail à la suite pour le problème de base, sachant qu'il y a un autre problème similaire qu'il faudra vérifier une fois la correction des pages 404 faite, pour savoir si après tout est OK ou s'il reste encore l'erreur remarquée aujourd'hui en vérifiant les erreurs des codes des anciennes pages).

Donc, pour le site Internet de l'AFPAC vous dites que les anciennes pages qui ne sont plus disponibles sont toutes en erreur 404. Ce qui n'est pas exact, elles présentent un code différent qui n'est pas une erreur 404 (on parle ici du code de la page, donc du code des anciennes pages que vous souhaitez afficher en erreur 404 et non pas du code affiché à la fin de la liste de l'outil gratuit du site du forum indiqué ci-dessous, qui est la page 404 du site Internet ; page qu'il sera aussi utile de vérifier le bon fonctionnement plus tard, mais ce n'est pas le sujet de cette réponse qui concerne les anciennes pages du site à passer en erreur 404 pour ne pas qu'elles soient indexées par le moteur de Google).

Pour comprendre, il suffit comme déjà indiqué précédemment avec les réponses à ce sujet, de vérifier la gestion des erreurs (la gestion des pages 404 et la page 404 du site Internet que vous devez travailler actuellement). Si vous réalisez une vérification avec par exemple l'outil disponible avec le site du forum (les outils sont disponibles avec le menu en haut du forum et du site Internet ; il s'agit de l'outil pour vérifier le code des pages, pour savoir si un page affiche le bon code ; pour l'exemple, ce serait un simple code d'erreur 404 et non plusieurs codes comme actuellement avec les anciennes pages du site Internet).

Donc en vérifiant avec l'outil, vous allez comprendre qu'il y a un problème avec les anciennes pages du site Internet. En effet, il y a bien une page 404 qui s'affiche à un moment, mais ce n'est pas la bonne manière de faire. On remarque qu'avant d'arriver à la page 404, les anciennes pages affichent non pas une, mais plusieurs redirections temporaires proposées par le serveur, avant l'affichage de la page d'erreur 404, qui devrait être la page affichée dès le début. Pourquoi ? Problème concernant la gestion des pages à passer en erreur 404.

Pour mieux comprendre, si vous réalisez un test avec une URL de la liste ci-dessous (ce ne sont que quelques exemples d'anciennes pages mal gérées, si vous souhaitez la liste complète, merci de l'indiquer en réponse pour vous présenter une liste avancée avec le sujet), vous aurez en réponse une double redirection temporaire et après vous aurez la page 404 que vous souhaitez ; et non pas une erreur 404 de base et habituelle comme vous le souhaiteriez, pour que Google prenne en compte correctement l'erreur et désindexe les pages que vous souhaitez pour le site Internet de l'AFPAC. De ce fait (à cause des redirections temporaires qui ne sont pas utiles), Google ne va pas prendre en compte correctement votre souhait de désindexer rapidement les anciennes pages du site Internet et vous aurez un problème d'indexation qui va trainer pendant encore plusieurs semaines ou mois. Il faut maintenant continuer le travail de vérification et faire les corrections de la mauvaise gestion des erreurs au plus vite avec le site Internet que vous devez travailler pour que ce soit OK de base pour le moteur et avoir une gestion du site habituelle pour les erreurs 404 que vous souhaitez.


Exemple de différentes anciennes pages du site de l'AFPAC à corriger :
- /mjxvsrjogi4tkmrxgq
- /orde4lrxgq4tsny
- /mzwdelrrhe4tknq
- /pbmwclrzge2tcmq
- /mrluklrrgq2tgoa
- /ojtfilrwgu3tamy
- /o5utqlryguytena
- /nvstelrugy2dgma
- /mjtfgujogi3damzrha
- /mj3wiubogmzdgmjsgm
.

Ce ne sont que quelques exemples d'anciennes pages mal gérées, si vous souhaitez la liste complète, merci de l'indiquer en réponse pour vous présenter une liste avancée avec le sujet (c'est assez rapide à faire, donc ne pas hésiter à demander la liste si vous le souhaitez pour comparer avec ce que vous avez).

En espérant que vous aurez compris la mauvaise gestion actuelle des erreurs 404 des anciennes pages.


N'hésitez pas à vous présenter au forum : ici et entre deux messages présenter vos avis aussi sur les sujets : ici, pour aider les autres personnes de la communauté d'entraide.


Si vous avez besoin d'aide, vous pouvez aussi créer un sujet via le forum :
https://www.webrankinfo.com/forum/f/demandes-davis-et-de-conseils-sur-vos-sites.36/
pour avoir des avis et conseils pour améliorer le site Internet et son référencement.


Temps de réponse : 1 heure.
Cordialement.
 
Dernière édition:
Discussions similaires
Haut