Google indexe des faux fichiers warez sur mon site

Nouveau WRInaute
Bonjour,

je suis webmaster du site www.corneilleonline.com, un site que j'ai créé il y a 3 ans à peu près et ça fait super longtemps que je ne l'ai pas mis à jour (à part le contenu).

Et ça doit faire des mois que mon hébergeur me rouspète car mon site demande trop de processus apache au serveur ce qui ralentit la globalité du serveur, alors qu'en fait c'est impossible car je n'ai vraiment pas beaucoup de visiteurs (faut l'avouer, Corneille n'a pas plus aucune actualité en ce moment).

Et en regardant les log apache et les log erreurs, j'ai remarqué que Google indexe comme un malade depuis des mois des fichiers warez qui n'existent même pas sur mon site.

Et maintenant ça apparaît sur Google :

https://www.google.com/search?hl=en&safe ... tnG=Search

Comment arrêter ce problème ?

Je ne veux pas bloquer Googlebot, car je voudrais toujours qu'il indexe mes vrais pages.

D'ailleurs, il n'y a pas que Google, mais Yahoo aussi indexe ses mauvaises pages.

Suis-je victime d'un virus ?

Merci de bien vouloir m'aider!! :oops:
 
WRInaute accro
Tu as regardé sur le serveur pour voir si on ne t'a pas mis des fichiers à ton insu. =>forum_old semble avoir pas mal de monde dedans.
 
Nouveau WRInaute
cthierry a dit:
Tu as regardé sur le serveur pour voir si on ne t'a pas mis des fichiers à ton insu. =>forum_old semble avoir pas mal de monde dedans.
Non justement, il n'y a rien, c'était un répertoire où il y avait l'ancienne config de mon forum, mais je l'ai effacé il y a 3-4 mois. Ce répertoire n'existe plus sur mon serveur.
J'ai vérifié, aucun de ces fichiers n'a pu être mis dans mon serveur.
 
Nouveau WRInaute
Je me permets de remonter ce topic car je suis toujours bloqué avec mon problème.

N'y a-t-il personne d'autre qui pourrait m'aider ?

Est-ce un cas qui n'a jamais été vu avant ?

Si vous n'avez pas de solution à ce problème, connaissez-vous des sites dans lesquelles je pourrais trouver d'autres informations qui pourraient m'aider ?

Merci d'avance.
 
Nouveau WRInaute
Justement, c'est impossible qu'il y ait ce genre de contenu car j'en ai pas mis. Donc je me demande s'il n'existe pas un robot qui fait croire qu'il y a du contenu pour indexer des pages de spam ?

Le redirection vers 127.0.0.1, c'est moi qui l'ai ajouté pour empêcher les robots de revenir sur ces pages (en espérant que ça fonctionne avec l'option "permanent").
J'ai ajouté ça dans mon htaccess :

Code:
RedirectMatch permanent /forum_old/(.*)$ http://127.0.0.1

Ca leur envoie une erreur 301.

Mais bon, j'ai ajouté ça la semaine dernière, et ça les empêche pas de toujours continuer à visiter ces "fausses" pages. :(
 
WRInaute accro
301 n'est pas une erreur.
Désindexe proprement ces pages à la limite, avec un robots.txt + 404 (il y a peut-être une erreur plus appropriée).
 
WRInaute accro
wullon a dit:
301 n'est pas une erreur.
...c'est un "code d'état" ;)

</geek>

Plus sérieusement:

Fichier robots.txt à la racine du site...

Code:
User-agent: *
Disallow: /forum_old/

Au niveau de .htaccess:

Code:
RewriteRule ^forum_old/(.*).html$ err410.php [L]

Dans err410.php:

Code:
<?php header("HTTP/1.1 410 Gone"); ?>

--> la désindexation devrait être rapide.

PS: Si ça traîne, repère les pages qui restent indexées et fais des liens vers ces pages (parceque si Google n'a pas de liens vers ces pages, il n'ira pas les visiter, donc ne verra pas qu'il y'a un code 410 ;) ).

@++
 
Nouveau WRInaute
Merci pour ces conseils, je vais essayer tout ceci et vous dirai dans quelques jours si ça a fonctionné. :)
 
WRInaute discret
Très intéressant tout ca...
je comprend mieux des erreurs 404 que j'ai souvent;
si j'ai bien compris, google continu de chercher des pages qui n'existent plus MEME si il n'y a pas de liens vers ces pages !

Je comprend bien le truc du dissalow /repertoire/,
mais que faire si c'est des fichiers par-ci par-là ?
Faire du rewrite pour chacun d'entre eux ?

Je vais essayer pour voir...
 
Discussions similaires
Haut