Soft 404 : Google détecte les erreurs 404 qui n'en sont pas

WRInaute accro
Voila qui devrait permettre de résoudre certains mystères de pages non-indexées…

La firme californienne présente aujourd’hui une nouveauté qui complète ses très utiles outils pour les webmasters. Il s’agit de la différenciation entre les erreurs 404 basiques et celles du type soft 404 – même la version française ne fournit pas d’équivalent à cette expression.
Source
Via
 
WRInaute passionné
Pour en avoir fait le constat, les soft 404 correspondent à des pages bel et bien existantes mais qui n'ont pas été délivrées par le serveur à "temps"... Le header 200 étant le premier renvoyé, les autres codes suivants ne semblent pas être pris en compte. Conclusion, elles disparaissent des GWT aussi vite qu'elles étaient apparues (en 2 jours pour 2 urls).
 
Olivier Duffez (admin)
Membre du personnel
je ne comprends pas bien comment une page peut être envoyée avec plusieurs codes (autres que des redirections) ?
 
WRInaute discret
Pour ma part, sur certains gros sites que je gère, celà vient de "fatal error" ou des temps maximum d'exécution d'un script dépassé
 
WRInaute accro
WebRankInfo a dit:
je ne comprends pas bien comment une page peut être envoyée avec plusieurs codes (autres que des redirections) ?
Quelque soit la redirection appliquée, si elle mène sur un contenu similaire, elle sera considéré en Soft404.
C'est ce que j'ai compris.
 
WRInaute passionné
Nic'O a dit:
Pour ma part, sur certains gros sites que je gère, celà vient de "fatal error" ou des temps maximum d'exécution d'un script dépassé
Exactement. Et là, c'est le 200 qui prime. D'ailleurs, les 2 pages dont je parlais ont disparu des soft404 2 jours après : GG semble réexaminer ces pages assez rapidement.
 
WRInaute passionné
Ce n'est pas suffisamment probant, mais j'ai eu une piste avec une "vraie" soft404 : une page avec un script qui boucle et qui boucle et qui boucle... Le serveur déclare la page existante (logique, elle existe) mais à un moment donné, en raison d'un time-out pour délivrer le contenu de la page, cela affiche une page blanche* (totalement, sans rien dedans). Il est possible que GG détecte une page totalement vide (vierge) pour la déclarer en soft404.

C'est juste une hypothèse.



* le CMS utilise smarty, et c'est surement un bug smarty.


edit 10h50 : curieux, je reçois une notification de réponse datant de 10h26 sans qu'il y ait de nouvelle réponse???
 
Nouveau WRInaute
Salut,

Et on fait comment si Google nous détecte un soft 404 sur une page n'en étant pas une?
J'ai des simulateurs de financement personnalisés avec des paramètres de biens immobiliers (donc une page matrice, un peu de contenu qui change mais c'est souvent la même chose, les chiffres, on génère les paramètres supplémentaires et zou on a un simulateur) qui nous permet de faire nos simulations personnalisées.

Problème, c'est que j'en ai quelques uns (une trentaine) qui sont marqués comme soft 404 alors qu'ils n'en sont pas ...

Une idée?
 
Nouveau WRInaute
la plus ancienne chez moi est marquée comme ayant été détectée le 05/06 mais c'est pas une erreur, c'est une vraie page (un des simulateurs justement :) )
 
Nouveau WRInaute
Techniquement, qu'elles ne le soient pas, ça ne me dérange pas. Le problème c'est que par rapport au partenariat qui nous lie avec les agences immobilières en question je suis "obligé" de ne rien faire contre leur indexation.
Il y a un formulaire de contact attaché à chaque simulateur, pour eux c'est bon, je les aient retirés via le robots.txt (Disallow) mais pour les simulateurs eux même, je crois bien que je dois répondre "oui".
 
WRInaute impliqué
anemone-clown a dit:
Ce n'est pas suffisamment probant, mais j'ai eu une piste avec une "vraie" soft404 : une page avec un script qui boucle et qui boucle et qui boucle... Le serveur déclare la page existante (logique, elle existe) mais à un moment donné, en raison d'un time-out pour délivrer le contenu de la page, cela affiche une page blanche* (totalement, sans rien dedans). Il est possible que GG détecte une page totalement vide (vierge) pour la déclarer en soft404.

C'est juste une hypothèse.
* le CMS utilise smarty, et c'est surement un bug smarty.

J'ai noté le même problème, avec Smarty également.
Les pages déclarées en soft 404 sont soit:
- des pages avec redirection
- des pages pouvant provoquer un timeout à cause d'une analyse de flux
 
Nouveau WRInaute
Bonjour
Ok très bien, mais ce que je n'arrive pas à comprendre c'est comment google peut détecter automatiquement ces soft 404 ???????
 
Nouveau WRInaute
Je me suis aperçu que cela arrive toujours à la m^me heure, quand mes bases de données sont automatiquement mises à jour.
Certains sites suggèrent d'envoyer une erreur 503 pendant les temps de maintenance, outre la complexité de l'opération, je me demande si c'est bien pertinent.
 
Discussions similaires
Haut