changement de type d'url google n'index pas / plus !

  • Auteur de la discussion Auteur de la discussion simon6
  • Date de début Date de début
WRInaute discret
Bonjour,
J'ai refait depuis le mois de Juillet mon site, je l'ai modernisé, et j'ai utilisé pour cela Joomla.

Mon site était en html et comportait ne que quelques pages, maintenant il y a donc du css et fait pas loin de 50 pages.

J'ai soumis à google mon site-map depuis un mois maintenant, mais ayant fait de nombreuses modifications en ce mois d'août et notamment sur toutes mes url sauf la page d'accueil, google avait indexé des pages (les 9/10 de mon site) qui sont maintenant en 404. mais il ne les avait pas référencées. De cela résulte plus de 240 erreurs de pages 404 dans google webmaster tool... et il index toujours des url très anciennes (plus de 2 mois), et le composant d'url_rewriting que j'utilise sh404SEF me donne dans le journal des erreur 404 des urls très bizarre.. je ne sais pas d'où viennent ces adresse (je n'ai pas de 404 depuis mon site, ayant fait un link checker complet hier)

Maintenant ma question coule de source, comment faire pour que google passe son robot (il est passé pour la dernière fois le 19 aout) et supprime de lui même les url en 404 et ajoute les nouvelles ? (sans que je perde mon ranking, qui est de 2 depuis plus de 4ans et que j'aimerais voir augmenter.. du moins je fais tout pour).. je pensais simplement supprimer le site complet de google et recommencer.. mais j'ai peur que mon classement (13ème sur les meilleurs mot clés) ne se dégrade (il n'a pas changé depuis des années également.. google n'ayant pas réellement pris en compte mon nouveau site)..

Bref je suis dans l'expectative.

Merci pour votre aide, mon site en signature bien entendu.
 
WRInaute passionné
simon6 a dit:
qui sont maintenant en 404. mais il ne les avait pas référencées. De cela résulte plus de 240 erreurs de pages 404 dans google webmaster tool... et il index toujours des url très anciennes (plus de 2 mois), et le composant d'url_rewriting que j'utilise sh404SEF me donne dans le journal des erreur 404 des urls très bizarre.. je ne sais pas d'où viennent ces adresse (je n'ai pas de 404 depuis mon site, ayant fait un link checker complet hier)

bonjour,

c'est sûrement ici que vous avez fait une erreur: changer d'url est toujours risqué, mais si en plus vous ne redirigez pas les anciennes vers les nouvelles (R301 via .htaccess) là c'est du suicide.

si vous vous souvenez des anciennes URL, au moins les + importantes, essayez de les rediriger vers vos nouvelles URL, il n'est jamais trop tard pour ça.

pour supprimer les 404 indiquées dans les outils Google vous pouvez

- ne rien faire du tout, Google les supprimera de lui-même, ce n'est pas grave
- demander leur supression (via l'outil demande de suppression d'URL en suivant bien toutes les étapes)
- les bloquer via le fichier robots.txt
- ou bien sûr les rediriger vers une page existante (R301)
 
WRInaute discret
carole heinz a dit:
simon6 a dit:
qui sont maintenant en 404. mais il ne les avait pas référencées. De cela résulte plus de 240 erreurs de pages 404 dans google webmaster tool... et il index toujours des url très anciennes (plus de 2 mois), et le composant d'url_rewriting que j'utilise sh404SEF me donne dans le journal des erreur 404 des urls très bizarre.. je ne sais pas d'où viennent ces adresse (je n'ai pas de 404 depuis mon site, ayant fait un link checker complet hier)

bonjour,

c'est sûrement ici que vous avez fait une erreur: changer d'url est toujours risqué, mais si en plus vous ne redirigez pas les anciennes vers les nouvelles (R301 via .htaccess) là c'est du suicide.

si vous vous souvenez des anciennes URL, au moins les + importantes, essayez de les rediriger vers vos nouvelles URL, il n'est jamais trop tard pour ça.

pour supprimer les 404 indiquées dans les outils Google vous pouvez

- ne rien faire du tout, Google les supprimera de lui-même, ce n'est pas grave
- demander leur supression (via l'outil demande de suppression d'URL en suivant bien toutes les étapes)
- les bloquer via le fichier robots.txt
- ou bien sûr les rediriger vers une page existante (R301)

merci beaucoup pour votre réponse, je ne pensais pas les changer, si j'avais su j'aurais soumis mon site plus tard.. il s'agit simplement de toutes les pages de mon site qui n'ont plus de "index.php" dans l'url ou bien certaine ont changée.. les rediriger est un vrai enfer car il y en a des centaines... n'y a-t-il pas un moyen de rediriger simplement avec l'htaccess toutes les 404 vers la page d'accueil.. et supprimer toutes mes pages de google à par la page d'accueil pour repartir de "0".
Y a t il une possible perte de classement pour cela ?

edit:
je viens de penser, avec un copier coller tout bête dans robot.txt des erreur 404 que google me donne ça pourrait le faire non ?
 
WRInaute discret
(j'ai conscience d'être lourd)
Les 8/10 des erreurs 404 de google proviennent de pages dont l'url est : mondomaine/index.php/page.html or j'ai réussi à supprimer cet "index.php" mes urls sont donc dans le style mondomaine/page.html maintenant.

j'ai tenté un

mais cela ne fais que rediriger une page mondomain/index.php/page vers mondomaine/page, ce qui est pas mal déjà mais pas top car j'ai changé le nom entre temps de certaines url.. du coup j'aimerais rediriger toutes les pages de la forme modomaine/index.php/* vers ma page d'accueil (au lieu d'une 404 pour les pages changées)

une syntaxe spéciale pour cela ?
 
WRInaute discret
Merci j'ai fini par arriver à me dépatouiller pour les 3/4 des redirections de mes adresses, plus ou moins en tout cas.

Encore une chose très bizarre:

Googlebot last successfully accessed your home page on Aug 19, 2008

http://www.gites-ruraux-france-dordogn...dex.php/Accueil/Points-de-Vues/pov.html 404 (Not found)Help Help
Aug 26, 2008

si il est venu le 19 pourquoi arrive-t-il a me trouver des erreurs le 26 de plus mes changements d'adresses ont été avant le 26, donc lorsqu'il trouve des 404 sur cette page cela n'est pas du tout normal... il rajoute des repertoires au milieu des urls et laisse ce "bloody" index.php alors qu'il n'y est plus depuis plus de 15 jours.

Une page que j'aurais créée récemment qui n'est donc jamais appararue sous la forme /index.php/nouvellepage il crée tout de même cette erreur en me disant attention 404 sur /index.php/Accueil/nouvelle page alors que nulle part n'apparaît un tel lien ou adresse..[/quote]
 
WRInaute passionné
oui ce n'est pas grave du tout, Google a toujours inventé des url fantaisistes.

si ces url n'ont jamais existé et n'existent pas, ce n'est même pas la peine d'y prendre garde, ces erreurs disparaîtront toutes seules.
 
WRInaute discret
ça me gêne car du coup j'ai fait des redirections même pour ces url fantaisistes.. disons que cela ne me rassure pas du tout car j'ai eu (il y a un mois) des urls de la forme mondomaine/accueil/page ...

Si je fais des redirections dessus, il ne les supprimera pas si ?

Le tableau d'erreurs et les urls se mettent à jour tt seul, mais lorsque la page devient accessible il les supprime du tableau ?
 
WRInaute passionné
simon6 a dit:
ça me gêne car du coup j'ai fait des redirections même pour ces url fantaisistes..
mais c'est du blackhat pur et dur ça dites-donc! ;)
non même si je n'ai jamais vu ce cas je pense que vous pouvez laisser ces redirections en place sans danger. (sur ce point il serait néanmoins bon d'avoir l'avis d'autres wrinautes).

concentrez-vous maintenant sur les url existantes, travaillez vos pages et ne donnez pas trop d'importance aux 404 relevées dans les outils webmaster (sauf s'il s'agit d'url existantes).
 
WRInaute discret
carole heinz a dit:
simon6 a dit:
ça me gêne car du coup j'ai fait des redirections même pour ces url fantaisistes..
mais c'est du blackhat pur et dur ça dites-donc! ;)
non même si je n'ai jamais vu ce cas je pense que vous pouvez laisser ces redirections en place sans danger. (sur ce point il serait néanmoins bon d'avoir l'avis d'autres wrinautes).

concentrez-vous maintenant sur les url existantes, travaillez vos pages et ne donnez pas trop d'importance aux 404 relevées dans les outils webmaster (sauf s'il s'agit d'url existantes).

merci beaucoup,
je n'ai pas (plus ?) de 404 dans mes urls existante et je ne me suis préoccupé que depuis hier (2mois que je travail mon nouveau site) de ces erreurs, mais google n'ayant toujours pasfait évoluer mon site cela me fait peur... j'ai pas envie de tomber dans une sandbox ou d'être ignoré pour des 404 qui n'existent pas...
 
WRInaute discret
ok donc en gros dans l'outil google pour la ligne: "web crawl error: not found" j'oublie ... ? (je viens de me rendre contre qu'il crée vraiment n'importe quoi parfois dans les url..)
 
WRInaute discret
carole heinz a dit:
exactement. sauf s'il s'agit d'une URL réelle.

ok difficile de retrouver une vraie url dans les 250 pages qu'il me propose.. mais je vérifie très régulièrement mes liens avec xenu (si vous connaissez un equivalent unix je suis preuneur) qui check tout les liens du site. je suppose que ça fait l'affaire.

Merci encore pour ces conseils :D
 
WRInaute discret
arg je suis sous gnome (je sais que je peux quand même en instllant les librairie.. mais c'est un peu lourd.. j'utilise wine pour xenu ça marche presque bien.. mais si ça pouvais être libre..)
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut