Google indexe des faux fichiers warez sur mon site

Discussion dans 'Crawl et indexation Google, sitemaps' créé par ly, 9 Avril 2007.

  1. ly
    ly Nouveau WRInaute
    Inscrit:
    9 Avril 2007
    Messages:
    5
    J'aime reçus:
    0
    Bonjour,

    je suis webmaster du site www.corneilleonline.com, un site que j'ai créé il y a 3 ans à peu près et ça fait super longtemps que je ne l'ai pas mis à jour (à part le contenu).

    Et ça doit faire des mois que mon hébergeur me rouspète car mon site demande trop de processus apache au serveur ce qui ralentit la globalité du serveur, alors qu'en fait c'est impossible car je n'ai vraiment pas beaucoup de visiteurs (faut l'avouer, Corneille n'a pas plus aucune actualité en ce moment).

    Et en regardant les log apache et les log erreurs, j'ai remarqué que Google indexe comme un malade depuis des mois des fichiers warez qui n'existent même pas sur mon site.

    Et maintenant ça apparaît sur Google :

    https://www.google.com/search?hl=en&safe ... tnG=Search

    Comment arrêter ce problème ?

    Je ne veux pas bloquer Googlebot, car je voudrais toujours qu'il indexe mes vrais pages.

    D'ailleurs, il n'y a pas que Google, mais Yahoo aussi indexe ses mauvaises pages.

    Suis-je victime d'un virus ?

    Merci de bien vouloir m'aider!! :oops:
     
  2. cthierry
    cthierry WRInaute passionné
    Inscrit:
    15 Janvier 2005
    Messages:
    2 356
    J'aime reçus:
    87
    Tu as regardé sur le serveur pour voir si on ne t'a pas mis des fichiers à ton insu. =>forum_old semble avoir pas mal de monde dedans.
     
  3. ly
    ly Nouveau WRInaute
    Inscrit:
    9 Avril 2007
    Messages:
    5
    J'aime reçus:
    0
    Non justement, il n'y a rien, c'était un répertoire où il y avait l'ancienne config de mon forum, mais je l'ai effacé il y a 3-4 mois. Ce répertoire n'existe plus sur mon serveur.
    J'ai vérifié, aucun de ces fichiers n'a pu être mis dans mon serveur.
     
  4. ly
    ly Nouveau WRInaute
    Inscrit:
    9 Avril 2007
    Messages:
    5
    J'aime reçus:
    0
    Je me permets de remonter ce topic car je suis toujours bloqué avec mon problème.

    N'y a-t-il personne d'autre qui pourrait m'aider ?

    Est-ce un cas qui n'a jamais été vu avant ?

    Si vous n'avez pas de solution à ce problème, connaissez-vous des sites dans lesquelles je pourrais trouver d'autres informations qui pourraient m'aider ?

    Merci d'avance.
     
  5. HawkEye
    HawkEye WRInaute accro
    Inscrit:
    23 Février 2004
    Messages:
    13 857
    J'aime reçus:
    5
  6. ly
    ly Nouveau WRInaute
    Inscrit:
    9 Avril 2007
    Messages:
    5
    J'aime reçus:
    0
    Justement, c'est impossible qu'il y ait ce genre de contenu car j'en ai pas mis. Donc je me demande s'il n'existe pas un robot qui fait croire qu'il y a du contenu pour indexer des pages de spam ?

    Le redirection vers 127.0.0.1, c'est moi qui l'ai ajouté pour empêcher les robots de revenir sur ces pages (en espérant que ça fonctionne avec l'option "permanent").
    J'ai ajouté ça dans mon htaccess :

    Code:
    RedirectMatch permanent /forum_old/(.*)$ http://127.0.0.1
    Ca leur envoie une erreur 301.

    Mais bon, j'ai ajouté ça la semaine dernière, et ça les empêche pas de toujours continuer à visiter ces "fausses" pages. :(
     
  7. wullon
    wullon WRInaute accro
    Inscrit:
    18 Septembre 2004
    Messages:
    2 788
    J'aime reçus:
    0
    301 n'est pas une erreur.
    Désindexe proprement ces pages à la limite, avec un robots.txt + 404 (il y a peut-être une erreur plus appropriée).
     
  8. HawkEye
    HawkEye WRInaute accro
    Inscrit:
    23 Février 2004
    Messages:
    13 857
    J'aime reçus:
    5
    ...c'est un "code d'état" ;)

    </geek>

    Plus sérieusement:

    Fichier robots.txt à la racine du site...

    Code:
    User-agent: *
    Disallow: /forum_old/
    Au niveau de .htaccess:

    Code:
    RewriteRule ^forum_old/(.*).html$ err410.php [L]
    Dans err410.php:

    Code:
    <?php header("HTTP/1.1 410 Gone"); ?>
    --> la désindexation devrait être rapide.

    PS: Si ça traîne, repère les pages qui restent indexées et fais des liens vers ces pages (parceque si Google n'a pas de liens vers ces pages, il n'ira pas les visiter, donc ne verra pas qu'il y'a un code 410 ;) ).

    @++
     
  9. ly
    ly Nouveau WRInaute
    Inscrit:
    9 Avril 2007
    Messages:
    5
    J'aime reçus:
    0
    Merci pour ces conseils, je vais essayer tout ceci et vous dirai dans quelques jours si ça a fonctionné. :)
     
  10. Ytz
    Ytz WRInaute discret
    Inscrit:
    21 Mars 2007
    Messages:
    65
    J'aime reçus:
    0
    Très intéressant tout ca...
    je comprend mieux des erreurs 404 que j'ai souvent;
    si j'ai bien compris, google continu de chercher des pages qui n'existent plus MEME si il n'y a pas de liens vers ces pages !

    Je comprend bien le truc du dissalow /repertoire/,
    mais que faire si c'est des fichiers par-ci par-là ?
    Faire du rewrite pour chacun d'entre eux ?

    Je vais essayer pour voir...
     
Chargement...
Similar Threads - Google indexe faux Forum Date
Cette URL n'a pas été indexée par Google Problèmes de référencement spécifiques à vos sites 5 Août 2022
Google indexe en https au lieu de http Débuter en référencement 26 Juin 2022
Site non indexé par Google Problèmes de référencement spécifiques à vos sites 21 Juin 2022
Cette URL n'a pas été indexée par Google Débuter en référencement 18 Mai 2022
Mon site n’est pas indexé sur Google Débuter en référencement 10 Mai 2022
Google indexe le dossier /wp-includes/ Crawl et indexation Google, sitemaps 27 Mars 2022
Search Console Cette URL n'a pas été indexée par Google Crawl et indexation Google, sitemaps 27 Mars 2022
Comment savoir si une URL est indexée par Google ? Crawl et indexation Google, sitemaps 25 Janvier 2022
Search Console Google ne veut pas indexer après plusieurs semaines Crawl et indexation Google, sitemaps 16 Décembre 2021
Google indexe mes pages AMP sur PC Problèmes de référencement spécifiques à vos sites 10 Décembre 2021
Je n'arrive pas à indexer les pages du site sur Google Problèmes de référencement spécifiques à vos sites 2 Décembre 2021
Certaines pages importantes ne sont plus indexées dans Google Problèmes de référencement spécifiques à vos sites 28 Novembre 2021
Site web non indexé par Google Problèmes de référencement spécifiques à vos sites 22 Novembre 2021
Impossible d'indexer mon site sur google search console Rédaction web et référencement 5 Octobre 2021
Google Search console: page envoyée et indexée mais introuvables via site: Référencement Google 7 Septembre 2021
Search Console Problème d'indexer d'une page sur Google Référencement Google 20 Juin 2021
Désindexer une page via Google Search Débuter en référencement 14 Juin 2021
Connaitre les pages désindexées chez Google Crawl et indexation Google, sitemaps 14 Juin 2021
Search Console 2 513 URL Valides -Envoyée et indexée - 20 résultats dans la recherche google Crawl et indexation Google, sitemaps 28 Janvier 2021
Google indexe une page non publiée Crawl et indexation Google, sitemaps 1 Janvier 2021