éliminer les spams des urls qui bloque l'indexation de la racine du site :-(

WRInaute discret
Bonjour
Incroyable, je vois que le nombre de page indexés diminue depuis plusieurs mois et surtout que des urls spams bloquent l'indexation en même temps que des pages fondamentales comme l'accueil du site.
1/ Comment éliminer ces urls spams ? :mad:
2/ faire rédindexer les pages réelles !?
 

Fichiers joints

  • Capture d’écran du 2024-02-21 10-52-02.png
    Capture d’écran du 2024-02-21 10-52-02.png
    27.3 KB · Affichages: 9
  • Capture d’écran du 2024-02-21 10-46-06.png
    Capture d’écran du 2024-02-21 10-46-06.png
    44.3 KB · Affichages: 9
WRInaute impliqué
1) C'est quoi les "URLs spams" ?

2) pourquoi tu demandes l'indexation de pages en HTTP et en HTTPS ? avec www et sans ?
 
WRInaute discret
Bonjour
1/ dans l'image, ce sont les urls avec le terme cialis, generic... (en) mais j'en ai d'autres qui n'existent pas sur le site bien sûr. J'avai déjà entendu cette pratique mais je ne sais pas comment l'éliminer car je peux pas redemander l'indexation tant qu'il y a ces urls :mad:
2/ j'avai effectivement oublié la redirection www, mais cela avait été fait depuis :)
3/ pour le http; je viens de vérifier il n'est pas opérationnel, mais du coup c'est une nouvelle question car je ne l'avais pas vu. Pourquoi GG ne prend pas en compte la redirection automatique https ?
 
WRInaute impliqué
1) Mais ce sont des URL qui ont existé ?

3) Comme relevé par @pomination, la redirection ne fonctionne pas. Après Google peut suivre une URL HTTP, si elle renvoie sur HTTPS de façon correcte, il ne l'indexera pas.
 
WRInaute discret
1/ Si on parle des URLs spams, non elles n'ont pas existés car ce site n'a pas été infecté
Vous n'avez jamias entendu parlé de cela ? Moi je l'ai vu passé sur https://onlinecommunityhub.nl/best-...our-business-seo-and-what-you-can-do-about-it car j'utilise le cms joomla
Comment les éliminer ? pour pouvoir valider la correction demandée et réindexer mes urls correctes ?

3/ ok je vais rechercher car j'ai pourtant forcer l'activation https sur ce site comme plein d'autres sites et je ne comprends pas la différence!
Après est-ce vraiment problématique comme le dit @emualliug et dois y apporter de l'énergie vs autres problèmes à résoudre et notamment le 1/
(comment expliquer que manuellement le hhtp se transforme bien en https ? )
 
WRInaute occasionnel
Si GSC vous affiche des stats pour les mêmes pages en http ET https, alors, oui, c'est important. Ca fausse l'analyse ET ça induit du contenu dupliqué..
 
WRInaute impliqué
Vous n'avez jamias entendu parlé de cela ?
Alors, pas spécifiquement pour Joomla (et du coup je comprends mieux).

Plusieurs CMS ont en effet tendance à reprendre bêtement les URL inexistantes et à intégrer le contenu dans une page "soft 404" (au mieux) indiquant « nous n'avons pas trouvé la page "where-to-buy-generic-cheap-online" ».

C'est un problème, car n'importe qui peut mettre des liens vers le site d'un tiers et entraîner la génération d'autant de page, dans le but de plomber son SEO ou de faire une sorte d'injection.

Il semble que Joomla y fut sensible, ce qui explique que des margoulins ciblent les sites sous Joomla. Mais sauf erreur, aujourd'hui le site renvoi un 404 sur ce type d'URL, ce qui est le résultat attendu. Alors, certes, il reste des URL sur le web qui pointent vers des pages qui n'existent pas sur ton site (tu ne peux rien y faire, et ce n'est pas grave), GSC générera peut être une alerte parce que la page est introuvable, mais vu que c'est le but, ce n'est pas grave.

Après est-ce vraiment problématique comme le dit @emualliug et dois y apporter de l'énergie vs autres problèmes à résoudre et notamment
Nope, je me suis mal exprimé : c'est problématique s'il n'y a pas de redirection mise en place. Si la redirection est correctement mise en place, alors Google n'indexera pas la version HTTP. Mais elle doit être mise en place et le plutôt possible. La multitude des version (avec / sans HTTPS, avec / sans www) multiplie par 3 le nombre de page à indexer. Ce n'est donc pas bon quand, en plus, on a un problème d'indexation.
 
WRInaute discret
Nope, je me suis mal exprimé : c'est problématique s'il n'y a pas de redirection mise en place. Si la redirection est correctement mise en place, alors Google n'indexera pas la version HTTP. Mais elle doit être mise en place et le plutôt possible. La multitude des version (avec / sans HTTPS, avec / sans www) multiplie par 3 le nombre de page à indexer. Ce n'est donc pas bon quand, en plus, on a un problème d'indexation.
3/ http
Ok merci je vais donc investiguer pour comprendre pourquoi sur ce site j'ai cela et pas sur des sites avec le même cms
 
Discussions similaires
Haut