Existe il un outil pour repérer les erreurs 404 d'un site?

HawkEye

WRInaute accro
finstreet a dit:
HawkEye a dit:
...Google Webmaster Tools :roll:

Ca va faire plusieurs mois que j'essaye de solder mes Titres et Description identiques :) Ils en trouvent toujours

Il m'en reste moins de 20 à virer, mais ce sont des pages redirigées (genre /123/mon-test.html [titre: "mon test"] qui redirige vers /test/123/mon-test.html [titre: "mon test"]).

Pas glop, la gestion des 301 dans GWT :mrgreen:
 

Massif Affaires

WRInaute discret
j'ai téléchargé xenu
j'ai mis l'adresse du site
j'ai plus de 25000 url..... whoua ! ça me semble beaucoup...
ça va etre long comme analyse .... :mrgreen:

avec google tools j'ai essayé mais j'y suis pas arrivé ; je n'arrive pas a valider la propriété de mon site :(
 

Massif Affaires

WRInaute discret
j'ai plus de 35000 url et il y en a encore....
est ce normal ?
ça va mettre combien de temps pour tout analyser ?
le temps que j'ecrive ici, j'en suis deja à 36400 url
je me demande où j'ai mis les pieds... :mrgreen: (je suis vert oui !)lol
 

bproductiv

WRInaute accro
oui à mon avis tu va avoir beaucoup de pages dupliquées, si ca trouve xenu va tourner en boucle, cela voudra dire que le webmaster n'a pas pensé à tout en terme de duplication de contenu / réécriture.Tiens nous au jus sur le nombre de page !
 

nickargall

WRInaute accro
+1 avec au dessus; si Xenu tourne en boucle, tu dois avoir un problème structurel sur le site, genre une réécriture mal ficelée couplée avec des liens en adresses relatives mal ficelés
 

Leonick

WRInaute accro
le mieux est quand même de faire tourner Xenu en local, sur le serveur de test, en ayant fait la màj de la bdd. Ca permet de pouvoir tourner à pleine charge et évite de surcharger ton serveur de prod
 

finstreet

WRInaute accro
HawkEye a dit:
finstreet a dit:
HawkEye a dit:
...Google Webmaster Tools :roll:

Ca va faire plusieurs mois que j'essaye de solder mes Titres et Description identiques :) Ils en trouvent toujours

Il m'en reste moins de 20 à virer, mais ce sont des pages redirigées (genre /123/mon-test.html [titre: "mon test"] qui redirige vers /test/123/mon-test.html [titre: "mon test"]).

Pas glop, la gestion des 301 dans GWT :mrgreen:

Pour les pages redirigées, je les compte pas car je dois en rediriger une centaine par semaine (plus que 3.000 je crois lol)
 

Massif Affaires

WRInaute discret
bproductiv a dit:
oui à mon avis tu va avoir beaucoup de pages dupliquées, si ca trouve xenu va tourner en boucle, cela voudra dire que le webmaster n'a pas pensé à tout en terme de duplication de contenu / réécriture.Tiens nous au jus sur le nombre de page !
bonjour,
j'ai arrêté l'analyse car j'avais 125000 urls et il en apparaissait encore....
merci de ton attention
 

Madrileño

Membre Honoré
Avez-vous un fichier sitemaps ? Ceci vous permettrait si vous en avez un de comparer le nombre de pages du crawl avec le nombre de pages théoriques de votre site.
 

jeanluc

WRInaute accro
Bonjour,

GWT n'est pas un outil valable pour éliminer les liens cassés. GWT indique seulement les URL du site qui donnent une erreur 404 ou autre. Un vrai outil de détection des liens cassés doit indiquer les pages du site qui contiennent des liens cassés. Ce n'est pas la même chose: si la page d'accueil contient un lien cassé vers www.autre_site.com, GWT ne l'indique pas, or cela ne doit pas se passer sur un site de bonne qualité.

Xenu est un outil gratuit qui a des qualités et des inconvénients:
Les + :
- il trouve les pages qui contiennent des liens qui renvoient un code d'erreur HTTP
- il est rapide
- il est gratuit
Les - :
- il ne trouve pas les pages parking, ni les soft 404
- parfois il entre dans des boucles infinies si le mapping du site n'est pas parfait
- il ralentit (parfois gravement) le site testé
Xenu est bien pour un site "hobby", mais ne convient pas pour un site pro qui veut donner une bonne image de qualité.

verification-des-liens.com est un service pro payant que nous proposons:
Les + :
- il trouve les pages qui contiennent des liens qui renvoient un code d'erreur HTTP
- il trouve les pages parking et les soft 404 (erreur 704)
- il est automatique, sans installation par l'utilisateur
- il n'affecte pas le bon fonctionnement du site testé
Les - :
- il n'est pas gratuit
- le test d'une page est plus lent (pour ne pas ralentir le site testé)

L'élimination des liens brisés sur un site pro ne peut pas être fait une fois par an par un stagiaire pendant les vacances. Pour maintenir un niveau de qualité correct pour les visiteurs, une analyse périodique programmée est nécessaire. La preuve: la page d'accueil de Xenu contient plusieurs liens morts parce qu'aucune méthode de tests périodiques n'a été mise en place.

Jean-Luc
 

Leonick

WRInaute accro
l'avantage de Xenu sur le on site, c'est :
- qu'on peut l'utiliser en local et donc cela ne ralentira pas le serveur de prod.
- qu'on peut, en parallèle, vérifier les logs d'erreurs d'apache
- qu'on peut le faire aller dans toute notre interface admin, alors que je ne vois pas du tout donner l'accès à un site tiers
- qu'on peut arrêter le script à tout instant, au cas où il y ait des problèmes de redirection sur le site et recommencer ensuite. Alors qu'avec ton script, par exemple, on ne se rendra compte du problème qu'une fois le rapport reçu et il faudra recommencer après correction du bug

Mais bon, c'est vrai que tu redonnes les pages parking, ce que ne fait pas Xenu. Par contre, fais-tu comme Xenu de donner les redirections effectuées sur les pages ?
 

jeanluc

WRInaute accro
Tu as raison pour le test en local et pour les pages d'admin, mais ce n'est qu'une (petite) partie du problème des liens morts. Le problème difficile à combattre, c'est le "pourissement" des liens: quand on place un lien sur son site, 99,9 fois sur 100, il est bon, mais six mois ou un an après, c'est une autre histoire.

Pour les redirections, notre outil les signale aussi. En plus, il indique d'un mois sur l'autre les changements de redirection qui peuvent être des indices de changement de contenu des pages. A travers les redirections, notre outil détecte aussi automatiquement toute une série de soft 404 (généralement une redirection vers une page qui affiche un texte du style "page introuvable" mais qui renvoie le code "200 OK").

Jean-Luc
 

Leonick

WRInaute accro
Madrileño a dit:
C'est intéressant pour les sites de type blog ce système, si Jeanluc pouvait confirmer, merci.
pas que : le nombre de sites ecommerce où on arrive sur des pages inexistantes quand on clique sur "+ d'infos" pour un article.
et le site de video de tf1 est bien aussi dans son genre, car on se retrouve avec des programmes affichés dans le bandeau du haut différents du bandeau droit et arrivant donc à des pages inexistantes.
En fait, pour les erreurs 404 on peut le gérer directement depuis son appli (si elle est bien programmée) et de s'envoyer un message sur toutes les erreurs. Autant pour les 404 externes et les parking, là, il faut vérifier régulièrement
 

Madrileño

Membre Honoré
Madrileño a dit:
C'est intéressant pour les sites de type blog ce système, si Jeanluc pouvait confirmer, merci.
Concernait le passage :
jeanluc a dit:
Le problème difficile à combattre, c'est le "pourissement" des liens: quand on place un lien sur son site, 99,9 fois sur 100, il est bon, mais six mois ou un an après, c'est une autre histoire.
qui est un phénomène très connu des gens qui ont un blog. :wink:
 

jeanluc

WRInaute accro
C'est utile pour tous les sites, mais surtout pour ceux qui ont beaucoup de liens vers l'extérieur: les blogs, mais, comme le dit Leonick, beaucoup d'autres sites sont dans le cas.

Nous avons, parmi les clients, des sites de municipalités qui listent des événements locaux, des activités d'associations, des entreprises locales, etc. C'est tous les mois qu'ils doivent faire des nettoyages pour que les listes restent agréables à utiliser.

Jean-Luc
 

Discussions similaires

Haut