[Wordpress] Google indexe le dossier /wp-includes/

nums38390

WRInaute discret
Bonjour à vous,

Voici mon problème :

J'ai été piraté il y a de cela 2 mois. J'ai sécurisé mon wordpress comme il faut mais j'ai bidouillé pas mal de paramètres au cours de la remise en fonction du blog.

Aujourd'hui, je me retrouve avec 1420 url indexées (mon blog doit comporter 150 pages+articles) incluant le dossier wp-includes.

J'aimerais revenir à une indexation des pages qui existent réellement...

Ca fait 2 semaines que je tente de résoudre le problème, je suis un peu perdu et ne sais pas trop par où reprendre

Merci d'avance
 

Madrileño

Membre Honoré
Bon retour,

Le site du profil affiche simplement 1 page indexée, est-ce un autre site ? Si oui, vous pouvez indiquer l'URL.

L'indexation correcte du site Internet si tout a été corrigé va être progressive, cela peut prendre quelques semaines ou mois suivants le travail réalisé, c'est donc normal et il faut de la patience avec le moteur de Google, comme les autres moteurs qui ont surement une indexation aussi erronée du site Internet actuel que vous avez.

Pour le dossier /wp-includes/ , celui-ci contient souvent des ressources nécessaires pour le rendu de vos pages via les outils de Google et des éléments concernant la compatibilité mobile. Si vous souhaitez ne pas indexer le dossier, il faut vérifier d'abord ces éléments pour ne pas avoir d'erreurs avec le moteur de Google et que cela n'influence pas le SEO du site.

N'hésitez pas à vous présenter au forum : ici et entre deux messages présenter vos avis aussi sur les sujets : ici, pour aider les autres personnes de la communauté d'entraide.

Cordialement.
 

patrick_lejeune

WRInaute occasionnel
Dans ce dossier, tu crée un fichier htaccess (exemple avec Notepad) et l'enregistre sans extension dans le dossier wp-includes. Mon explication est un peu plus complexe.

Code:
RedirectPermanent /hard1ch2/hard1_ch2.htm http://www.example.com/hard1ch2/hard1_ch2.php
## RedirectPermanent /hard1ch2/har1ch2.pdf http://www.example.com/hard1ch2/hard1_ch2.php
Options -Indexes
RewriteEngine On
RewriteCond  %{HTTP_HOST}  !www.example.com
RewriteRule (.*) http://www.example.com/$1 [R=301,L]

RewriteEngine On
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http(s)?://(www\.)?example.com [NC]
RewriteRule \.(jpg|jpeg|png|gif|pdf)$ http://www.example.com/logo-access.gif [NC,R,L]

Le code ci-dessus est probablement trop complexe pour ton site, seules quelques parties sont à utiliser au cas par cas mais quelques explications:

Code:
RedirectPermanent /hard1ch2/hard1_ch2.htm http://www.example.com/hard1ch2/hard1_ch2.php
redirige la page /hard1ch2/hard1_ch2.htm vers la page http://www.example.com/hard1ch2/hard1_ch2.php
Remarque: la page est comprise dans le dossier où est enregistré le fichier .htaccess la deuxième parite reprend la nouvelle page mais aussi le site. Si c'est un simple changement d'extension comme ci-dessus, l'adresse réelle de la page doit quand même être mise.

Code:
Options -Indexes
interdit la visite d'un répertoire s'il n'y a pas de fichier index (l'extension n'a pas d'importance). A mettre dans tous les dossiers de configuration (comme dans ton cas), dans les dossiers où sont rassemblés les images, ...

Code:
RewriteEngine On
RewriteCond  %{HTTP_HOST}  !www.example.com
RewriteRule (.*) http://www.example.com/$1 [R=301,L]
redirige les adresses commencant par http:example.com -> http://www.example.com .normalement, cette ligne de commande doit uniquement être mis dans le dossier principal.

Code:
RewriteEngine On
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http(s)?://(www\.)?example.com [NC]
RewriteRule \.(jpg|jpeg|png|gif|pdf)$ http://www.example.com/logo-access.gif [NC,R,L]
et dernière petite combine. Si un site copie une image en reprenant simplement un lien: l'image qui s'affiche est logo-access.gif (pour certains sites, j'ai même mis une adresse absolue d'une image d'un site adulte :mrgreen: ).
 

nums38390

WRInaute discret
Madrileño a dit:
Bon retour,

Le site du profil affiche simplement 1 page indexée, est-ce un autre site ? Si oui, vous pouvez indiquer l'URL.

Bonjour et merci,

Non, il s'agit de pleinesantenaturelle.com

Madrileño a dit:
Pour le dossier /wp-includes/ , celui-ci contient souvent des ressources nécessaires pour le rendu de vos pages via les outils de Google et des éléments concernant la compatibilité mobile.

Oui, ça c'est bien clair pour moi. Que google en tienne compte pour le rendu lors du crawling d'accord mais je ne comprends pas pourquoi il les indexe.

Madrileño a dit:
Si vous souhaitez ne pas indexer le dossier, il faut vérifier d'abord ces éléments pour ne pas avoir d'erreurs avec le moteur de Google et que cela n'influence pas le SEO du site.

C'est justement ce que je suis en train de faire en ce moment et apparemment la commande "Options All -Indexes" (Désactiver l'affichage du contenu des répertoires => protection contre le piratage) dans le .htaccess à la racine du site semble poser problème : gros dilemme !
 

UsagiYojimbo

WRInaute accro
Au vu de ce que tu as déjà fait, tu n'as pas grand-chose à faire d'autre que demander la désindexation du dossier dans Webmaster Tools.
 

nums38390

WRInaute discret
patrick_lejeune a dit:
Dans ce dossier, tu crée un fichier htaccess (exemple avec Notepad) et l'enregistre sans extension dans le dossier wp-includes. Mon explication est un peu plus complexe.

Bonjour Patrick,

Voici mon .htaccess à la racine du blog

Code:
# Redirection du site sans www vers www
RewriteEngine On
RewriteCond %{HTTP_HOST} ^pleinesantenaturelle.com [NC]
RewriteRule ^(.*)$ http://www.pleinesantenaturelle.com/$1 [L,R=301]


# Wordfence WAF
<Files ".user.ini">
<IfModule mod_authz_core.c>
	Require all denied
</IfModule>
<IfModule !mod_authz_core.c>
	Order deny,allow
	Deny from all
</IfModule>
</Files>

# END Wordfence WAF

# BEGIN WPSuperCache
# END WPSuperCache
# BEGIN WordPress
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /
RewriteRule ^index\.php$ - [L]
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /index.php [L]
</IfModule>

# END WordPress


# Désactiver l'affichage du contenu des répertoires
Options All -Indexes

# Masquer les informations du serveur
ServerSignature Off

# Activation du suivi des liens symboliques
Options +FollowSymLinks

# Désactiver le hotlinking de vos images
RewriteEngine On
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http(s)?://(www\.)?pleinesantenaturelle.com [NC]
RewriteRule \.(jpg|jpeg|png|gif)$ http://fakeimg.pl/400x200/?text=Pas_touche_aux_images [NC,R,L]

# Éviter que l'on découvre l'identifiant d'un auteur
# Merci à Jean-Michel Silone du groupe Facebook WP-Secure https://www.facebook.com/groups/wp.securite/
<IfModule mod_rewrite.c>
RewriteCond %{QUERY_STRING} ^author=([0-9]*)
RewriteRule .* - [F]
</IfModule>

Tu peux constater que ce que tu me proposes est déjà plus ou moins en place.
 

nums38390

WRInaute discret
UsagiYojimbo a dit:
Tu n'as pas grand-chose à faire d'autre que demander la désindexation du dossier dans Webmaster Tools.

Bonjour et merci de ta réponse,

Ahhhhh au secours, je voulais éviter ça. SI je comprends bien, je vais devoir supprimer les url à problèmes (listées par la commande site:) une par une dans la section "url à supprimer" de GWT ? Si oui, n'y a-t-il pas une solution moins contraignante ?
 

UsagiYojimbo

WRInaute accro
Bein tu ajoutes wp-includes/ comme dossier à supprimer dans la console. je ne vois pas ce qui t'en empêche. Et ça n'aura aucun impact négatif côté SEO, ce dossier n'ayant PAS à être indexé.
 

nums38390

WRInaute discret
Oh my god, au temps pour moi...

C'est aussi simple que ça... :D

Merci à toi. Je vais déjà faire ça et reviendrai pour vous tenir au jus
 

patrick_lejeune

WRInaute occasionnel
[quote="nums38390]
Tu peux constater que ce que tu me proposes est déjà plus ou moins en place.[/quote]
sauf que pour bloquer l'accès à un sous dossier, il faut AUSSI créer un htaccess dans les dossiers (nottament le Options -Indexes)
:wink:
Ca me fait penser que je viens de livrer un site et j'ai oublié cette partie dans les dossiers :wink:
La technique d'UsagiYojimbo fonctionne uniquement pour Google: htaccess fonctionne pour TOUS les visiteurs (réels ou robots)
 

elas

WRInaute impliqué
bon
j'essaie d'aider mais comme je n'utilise plus wordpress depuis maintenant plusieurs années pour cause de sécurité.
Je vous donne juste des idées et google fera le reste (je crois avoir reçu en moyenne 20 malversations wordpress par jour sur un site a fort traffic).
wordpress est attaqué par les robots automatiquement sur ses failles.
wordpress est indexé par google sur des quantités d'urls, mais bien pire encore par bing sur son architecture et bien pie encore par yandex ou d'autres moteurs sur toute son architecture....

Il n'y a pas le choix, la seule alternative par rapport a toutes ces indexations, visites malvenues ... sur des url ou doublons d'urls :
1 - code habituel de rewritting pour avoir des url standard qui n’ont pas de chemins ou de module dedans.
2- interdire tout traffic (même visiteur) vers zone admin plugin... seule l'ip ou les ip de l'admin ont droit d'acces a ces zones
3- pour que 2 et 1 ci dessus fonctionne : avec wordpress on s'embrouille parce que par exemple il accepte mal qu'on bloque des zones. Mais si vous creusez sur le web, alors vous trouverez des exemples ou tout cela peut se faire depuis les filtres dans wordpress. les filtres vous permettent de tout regler, m^me renommer des repertoires de wordpress.
par contre le fichier filtre est attache à un template. donc si vous changez de template il faut migrer/adapter votre fichier filtre
Aussi, principe de base simplissime pour éviter que vos 80 regles d'url rewritting finissent par ouvrir a la visite un reperpoire par un robot, toujours placer un bon gros fichier vide index.html dans tous les reperoires

Sinon pour regler tout probleme sur wordpress, indexation et malversations.

On peut travailler en amont, avant meme que la requete arrive au serveur, au niveau dns :
l'incontournable et imbattable : cloudflare.com (ca regle meme les une famill d'attaques ddos et les attaques au dictionnaire sur toutes façons de loguer wordpress)
 

Discussions similaires

Haut