Google webmaster tools et pages "introuvables"

WRInaute discret
Bonjour à tous,

M'interessant de plus près au référencement depuis le développement de ma nouvelle version sortie debut du mois, j'était en train de faire un tour du coté de chez swan euh du coté des outils webmaster et la horreur ,je vois que j'ai 61 erreurs "introuvables" (le reste [erreur http, url inaccessibles...] étant à 0!).

J'ai mis en place lors de cette nouvelle version une redirection en cas d'erreur 404, 301...(bref toutes les erreurs courantes http).
Et la je vois que l'outil webmaster me dit que par exemple le 9 mars à rencontré des erreurs et me donne la liste des 61 url de ce genre : http://www.pspman80.fr/community , le probleme est que quand je clique sur ces liens la j'arrive sur une page d'erreur personnalisée (donc pourquoi affiche t'il ces erreurs dans les outils webmaster?). Cela a t'il un impact sur le référencement dans google?

Je me suis également apercu quand quand on saisi une url introuvable avec un dossier (genre "http://www.pspman80.fr/news/commentaires.php?idnews=297&page=1") on tombe sur ma meme page personalisé mais qui a un probleme de css [je compte corriger cela d'ailleurs... (est ce que hormis le fait que c'est pas lisible pour l'oeil humain, c'est pas bon pour google?)

erreur_google.jpg

Merci d'avance!
 
WRInaute discret
Bonjour,


Oui c'est tres tres important de corriger les érreurs que google te donne, Tu pourra etre placer dans la premier page apres correction des erreurs, c'est important, c'est normal que votre serveur donne a google un message il lui dit que la page chercher est introuvable, c'est tu change une adressse tu met une redirection 301 c'est beaucoup mieu,

Merci est a plus tard.
 
WRInaute discret
CE que je ne comprends pas c'est que dans mon htaccess j'ai bien ca:

ErrorDocument 400 /erreur.php?erreur=400
ErrorDocument 401 /erreur.php?erreur=401
ErrorDocument 402 /erreur.php?erreur=402
ErrorDocument 403 /erreur.php?erreur=403
ErrorDocument 404 /erreur.php?erreur=404
ErrorDocument 405 /erreur.php?erreur=405
ErrorDocument 500 /erreur.php?erreur=500
ErrorDocument 501 /erreur.php?erreur=501
ErrorDocument 502 /erreur.php?erreur=502
ErrorDocument 503 /erreur.php?erreur=503
ErrorDocument 504 /erreur.php?erreur=504
ErrorDocument 505 /erreur.php?erreur=505

Erreur introuvable = erreur 404 a ce que je sache non?

Merci!
 
WRInaute discret
Tu renvois les pages introuvable vers une page perso mais qui renvoie quand même une erreur 404 donc introuvable pour google ( et pour tout le monde d'ailleurs) et c'est normal.
Par contre pour la liste des url en 404 tu peux faire une redirection pour chaque page vers la nouvelle en 301 avec ton htaccess.
Et vérifie les liens qui ont permis à google d'arriver sur tes 404.
 
WRInaute discret
Tu as beau personnaliser tes pages d'erreur, cela reste des pages d'erreur. Google te les signales donc.

Si tu veux calmer Google, tu dois enlever tous les liens qui mènent vers des pages d'erreur. Google t'indique même ou ils sont dans la colonne « accessible via ». Si tu les as déjà enlevés, il faut juste attendre que le GWT le prenne en compte.
 
WRInaute discret
Le truc c'est que ces url ne sont pas présente sur mon site, mais c'est des bots qui y accedent directement (je ne vois que cette solution...), comment faire?

Autant pour moi...J'avais un fichier htm dans les dossiers uploadé qui contenait plein de lien erroné et morts (puisque c'était un copie d'une page de youtube détournée: http://www.pspman80.fr/une-pub-originale-519.html

Je vais corriger ca de ce pas!

EDIT: Est ce long à etre repris en compte?

Je voudrais corriger des erreurs sur cette page http://www.pspman80.fr/news/commentaires.php?idnews=297&page=1 qui ne pointe vers rien, je voudrais la rediriger vers la page des news sur la news en question dans le parametre "idnews" je bloque sur le htaccess ce qui est bizare! Voici ma règle:

RewriteRule ^news/commentaires\.php\?idnews=([0-9]+)&page=([0-9]+)$ /afficher_la_news.php?id_de_lanews=$1 [L]

Cette règle ne fonctionne pas du tout, je ne comprends pas pourquoi...j'ai bien échappé le . et le ? faut-il transformer le "&" ou quelque chose du genre? j'ai essayé sans succès de mettre "&" ...


Merci d'avance!
 
WRInaute passionné
j'ai le même souci même avec des pages corrigées depuis 3 ou 4 mois, et google y accède toujours (je reçois un mail d'erreur car la page provoque une erreur mysql donc je suis informé en temps réel) et le user agent est bien google bot

quand je vais dans gmt, 404 avec date de détection : il y a 2 jours

je précise que ces quelques pages ne sont pas linkées, et google les connait car c'était au moment du développement du site, il y avait un petit bug !

vous me direz ça a pas d'importance mais je me dis que google pénalise peut être légèrement les sites qui ont des 404 !!!
 
WRInaute discret
Bah ouais dans les 61 erreurs de nombreuses étaient dues à la page experience-wii.htm que j'ai corrigé par contre toutes celles genre news/commentaires.php ... n'existent plus depuis la nouvelle version du site, puisque le seul lien pour ajouter des commentaires pointe sur la page ou on consulte la news (le formulaire est en bas de la news).

Ce qui serait cool, c'est de dire au bot, de reinitialiser tout ca ou de reverifier rapidement les erreurs (comme c'est fait pour reverifier les sitemaps par exemple)
 
WRInaute passionné
pspman80 a dit:
Ce qui serait cool, c'est de dire au bot, de reinitialiser tout ca ou de reverifier rapidement les erreurs (comme c'est fait pour reverifier les sitemaps par exemple)

oui ce serait cool :lol:
 
WRInaute discret
En attendant j'espere juste qu'il reviendra voir tout ca dans peu de temps pour voir que je n'ai plus 61 erreurs! ce qui est énorme!

Le truc c'est qu'il m'affiche de vieilles erreurs à la *%# et que les erreurs affichées ne sont plus d'actualités car, je refondu mon site en début du mois, et je suis pertinament sur à 1000000% que par exemple je n'ai plus de lien qui pars de la page d'accueil vers les erreurs décrites. D'ailleurs ces erreurs datent de 2007 ou 2008 mais sont toujours présentes dans le rapport...

Ca m'enerve!

kill -9 rapport-erreurs-google ! et paf!
 
WRInaute discret
Je reviens vers vous, plusieurs jours après et quelques erreurs corrigées (qui couvrent la globalité des erreurs), j'ai remarqué que google webmaster était actualisé tous les jours (pas les erreurs apparement!).

Il me reste 52 erreurs, et je suis persuadé qu'elles n'ont plus lieu d'être (à la rigueur qu'il en reste 1 ou 2 et encore je suis quasi sur que non).

Alors il me marque derniere actualisation aujourd'hui même mais mes erreurs sont toujours affichées. Exemple tout bête il m'affiche des erreurs sur la page d'accueil detectées il y a 1an, a cette époque j'avais des liens sur ma page d'articles qui pointaient vers une page de commentaires, sur la page d'accueil je n'ai plus de liens vers cette page puisqu'avec la nouvelle version du site le seul moyen de laisser un commentaire est de consulter une news comme par exemple ici : http://www.pspman80.fr/greve-du-19-mars--le-bilan-588.html

J'ai pas mal cherché sur le net pour trouver un moyen de virer ces erreurs mais sans grand succès avez vous une solution ou faut il laisser le temps au temps (et si oui combien de temps?).

Merci a tous

pspman80
 
WRInaute discret
Salut,

Maintenant que tu as fais le nécessaire pour les pages d'erreur il faut laisser comme tu dis "du temps au temps". Ça va dépendre de la fréquence du passage du bot sur ton site et du nombre de page visitées.
Donc désormais wait and see ;-)

Bye
 
WRInaute discret
J'ai une erreur qui date de août et toujours pas mise à jour par google alors que même la page sources n'existe plus.. Parfois les robots sont têtus...
 
WRInaute discret
Salut à tous!

Je reviens vers vous, car après quelque semaines de repos, j'ai des erreurs qui sont parties commes des grandes et des nouvelles inconnues qui sont arrivées! :s

Genre j'ai 5 erreurs dans "Erreurs rencontrées pour les URL répertoriées dans les sitemaps"
ou à chaque fois les détails sont : "Impossible d'atteindre robots.txt" alors que les urls qu'il marque sont absolument correcte et valides! (genre http://www.pspman80.fr/la-depeche-de-l-afp-291.html )

Mon fichier robos.txt se situe ici : http://www.pspman80.fr/robos.txt


Dans la rubrique "Exploration du web" il me donnes des erreurs de type "URL inaccessibles" dont les détails sont à chaque fois "Impossible d'atteindre robots.txt"

Est ce que le fait que le site ait été indisponible une grosse dizaine d'heures peut avoir provoqué cela? (si le bot est passé à ce moment la??)



J'ai également un multitude d'erreurs (30-40!!!) qui me dit URL Introuvable sur des url de type : htt p://www.pspman80.fr/news/une-news-au-hasard-8.html , mais le truc c'est que je n'ai aucune trace sur mon serveur d'un dossier "news" ni de liens pointant vers un dossier "news"... mes news s'affichent à la racine du site comme ici par exemple 'http://www.pspman80.fr/la-depeche-de-l-afp-291.html' mais jamais dans un dossier news qui n'existe absolument pas...
La seule trace de dossier news que j'ai eu sur mon serveur était sur la version précedente du site (datant d'il y a 6mois...), mais ces articles datent de la nouvelle version du site (comme si quelque part sur le site un lien pointait vers ce dossier...pourtant apres une minutieuse vérification je n'ai rien trouvé...).


Merci d'avance, ca m'inquiète tout ca!
 
WRInaute discret
Un petit retour quelque semaines après encore pour dire que tout est rentré dans l'ordre, mais ca a pris du temps!

Merci a tous pour l'aide et les conseils!
 
Discussions similaires
Haut