En combien de temps les 404 sont supprimées de Google ?

WRInaute passionné
Bonjour,

J'ai récemment modifié mon site : suppression d'un petit forum (environ 300-400 pages indexées), nouvelles urls (passage de DotClear 1 à DotClear 2 : même si j'ai fait de l'url rewriting certaines pages n'existent plus du tout dans DC2 par rapport à DC1...).

Sitemaps m'indique donc environ 900 pages en 404 :? .

Je suppose que Google va progressivement se rendre compte qu'il lui faut supprimer ces pages de son index. Mais combien de temps cela va-t-il prendre svp ?
 
WRInaute accro
"ca peut être long" :)
j'ai eu le cas d'un site qui est resté avec des 404 quasiement 1 an. alors je sais pas si maintenant les délais sont raccours, mais l'an dernièr il fallait être treees patient si il n'y avait pas de redirection en 301 des anciennes vers les nouvelles mais juste un 404
 
WRInaute passionné
Merci e-kiwi :)

Mais ça ne risque pas de pénaliser mon site :- ?
Google ne se dira pas : "tiens ce site a pas mal de pages qui ont été supprimées récemment, l'a moins de contenu globalement, so..." ou un truc du genre :- ?
 
WRInaute impliqué
J'ai le même problème...
J'ai rajouté une ligne de le robots.txt pour essayer de déférencer l'url.
J'aurais vraiment du la laisser avec un noindex le temps de... mais le client aurait pas comprit...
 
WRInaute passionné
Oh, merci Leonick, je ne connaissais pas ce service de Google :).

Il faut donc aller dans "Supprimer un lien périmé." c'est bien ça ?
Mais après que faut-il choisir :
Supprimer :
tout élément associé à cette URL
extrait de page (snippet) du résultat (comprend la version mise en cache)
version mise en cache uniquement
Je ne comprends pas bien la différence et n'ai pas très envie de me planter sur ce genre de choses :-/...
 
WRInaute accro
tout élément est plus long, car je pense qu'il doit supprimer aussi les liens sortant de ces pages.
Sinon, cache permet de supprimer le lien "voir page en cache" et snippet permet de n'afficher que le "title" et aucun résumé de la page (ou de dmoz).
donc là, il faut choisir "tout élément associé à cette URL" et dans 3-4 jours les pages seront supprimées. J'ai déjà utilisé les 3 options selon les cas.
C'est ça qui manque chez yahoo : la possibilité de supprimer les pages qui n'existent plus. Quand on leur fait la demande, avec en plus un code 410 renvoyé par le serveur, ils sont incapables de faire le ménage dans leur index. :cry:
 
WRInaute passionné
Leonick a dit:
tout élément est plus long, car je pense qu'il doit supprimer aussi les liens sortant de ces pages.

"Les liens sortants" ? Ca veut dire qu'il me supprimera aussi les pages qui sont pointées sur la page que je veux supprimer ? Ca ne doit pas être ça, mais je ne comprends pas désolé :? .
 
WRInaute accro
Non, je pense que si une page B avait 3 liens, dont 1 venant de la page A qui doit être supprimée, il ne lui restera plus que 2 liens, mais elle restera indexée, heureusement !
 
WRInaute passionné
Merci, ça a l'air de marcher...
Même si pour le moment la page dont j'ai testé la suppression est toujours dans Google sitemaps.
 
WRInaute passionné
Mmmm j'ai soumis environ une cinquantaine d'url à supprimer via cet outil et pour la plupart (les autres sont encore en attente) j'ai :
2006-09-18 15:35:08 GMT :
suppression de -http://www.yazerty.net/category/Jeux/2006/04/03
demande refusée

Alors que ça donne bien une page d'erreur...

Pourquoi :- ?
 
WRInaute accro
Il faut regarder le code renvoyé lors de l'appel de la page. Il faut que ce soit un 404 ou 410. SI c'est 200, 301 ou 302, il n'est pas possible de supprimer la page.
 
WRInaute passionné
Des pages comme :
-http://www.yazerty.net/index.php?Web-culture/2006/03
-http://www.yazerty.net/index.php?Showbiz-et-medias/2006/03
n'existent plus.
Elle affichent l'index de mon site.
Pourtant elle ne renvoient pas de 404 :-/
Je ne comprends pas pourquoi :-?.

Mon .htaccess est le suivant (DotClear 1 -> DotClear 2) :
Code:
# Pour activer PHP 5 :
AddType x-mapp-php5 .php

# Configuration du rewriting
RewriteEngine On
RewriteBase /

# Redirection des billets
RewriteCond %{QUERY_STRING}  ^([0-9]{4}/[0-9]{2}/[0-9]{2}/[0-9]+-.+)$
RewriteRule ^index\.php$ post/%1? [L,R=301]

# Redirection des archives (mois)
RewriteCond %{QUERY_STRING}  ^([0-9]{4}/[0-9]{2})$
RewriteRule ^index\.php$ archive/%1? [L,R=301]

# Redirection des catégories
RewriteCond %{QUERY_STRING}  ^([A-Z][a-z]+.*)$
RewriteRule ^index\.php$ category/%1? [L,R=301]

# Redirection des catégories
RewriteCond %{QUERY_STRING}  ^([A-Z][a-z]+.*)$
RewriteRule ^index\.php$ category/%1? [L,R=301]

# Redirection du flux RSS
Redirect permanent /rss.php http://www.yazerty.net/feed/rss2

# Gestion de l'index.php
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule (.*) index.php/$1
RewriteRule ^index.php$  index.php/
 
WRInaute accro
C'est pas trop au niveau du htaccess qu'il faut voir, c'est dans le fichier index.php qu'il faut regarder si le fil existe.
Code:
if (page_plus_la)
  { header("Status: 410 Gone");
    exit();
  }
 
WRInaute passionné
Ah, je pensais que c'était mieux de gérer ce genre de choses dans un .htaccess

Mais alors, comment savoir si la page existe en php avec un truc du style "if (page_plus_la) " ? Je ne comprends pas la logique.
 
WRInaute impliqué
yazerty a dit:
Mais alors, comment savoir si la page existe en php avec un truc du style "if (page_plus_la) " ? Je ne comprends pas la logique.
bé y a un moment ou ton script choisit d'une manière ou d'une autre d'afficher un billet ou un page index ? (d'après ce que j'ai lu)
faut que tu vois comment se fais cette vérification pour créer ton bout de code similaire à ce qui a été expliqué précédemment.

Après, si tu connais pas le php et/ou ton script, c'est plus une question d'apprentissage et de connaissance que de logique dans le cas présent.
 
WRInaute accro
Effectivement, c'est mieux de gérer ça dans un htaccess, mais vu la réécriture, je pensais que tout était géré par le fichier index et que les données étaient dans une base de données. Et donc le seul moyen de savoir si une page n'existait plus était une requête sql.
Sinon, si les pages supprimées sont en faible quantité, il suffit, dans le htaccess de rajouter
Code:
RedirectMatch gone url_de_ma_page
et ça renverra une erreur 410
 
Discussions similaires
Haut