Augmentation du nombre d'erreurs de type "Page introuvable" (bug thème Wordpress)

Nouveau WRInaute
Bonjour,

J'utilise actuellement le thème cookingpress pour mon blog, installé depuis 2 semaines. Hier j'ai reçu un message sur Google Webmaster Tool me disant la chose suivante :

"Augmentation du nombre d'erreurs de type "Page introuvable"
Nous avons détecté une augmentation significative du nombre d'URL qui renvoient une erreur 404 (Page introuvable). En examinant ces erreurs et en les corrigeant le cas échéant, vous vous assurez que nous explorerons correctement les pages de votre site"


Hier j'avais alors 3760 erreurs et ce matin 5460 ! En regardant de plus près les urls qui posent problème, il s'avère que ce sont des résultats du moteur de recherche avancée intégré au thème (pour rechercher une recette par ingrédients). Par exemple :
http://www.blabla.fr/search/+/page/4/?s=&include_ing%5B%5D=beurre&rela ... recherche+!

Et j'en ai donc des milliers comme ça, avec le numéro de page qui change ou les ingrédients dans l'url. Et tous ces résultats mènent à une belle erreur 404. Ca n’arrête pas d'augmenter et la je ne sais vraiment pas quoi faire pour corriger tout ça, et surtout pour que ces urls arrêtent de se créer.

Si vous pouvez m'aider, je vous remercie d'avance !!
Bonne journée :)
 
Nouveau WRInaute
En fouillant un peu, j'ai vu qu'on pouvait utiliser la fonction "disallow" dans le fichier robots.txt pour éviter au robot de crawler les résultats de recherche. Vu la syntaxe des résultats, est-ce que je devrais mettre ceci : Disallow: /search/ ?
Quant à toutes les erreurs 404 générées dans Google Webmaster Tool, y a t-il une solution pour les rediriger automatiquement vers la page d'accueil de mon blog ? (Je me vois mal faire les 5000 redirections à la main !)

Merci encore si vous pouvez m'éclairer la dessus !
 
WRInaute impliqué
le mieux serait de corriger ton thème pour que la recherche ne pointe pas vers une 404 non ?
 
Nouveau WRInaute
madri2 a dit:
le mieux serait de corriger ton thème pour que la recherche ne pointe pas vers une 404 non ?

Bien entendu c'est la meilleure solution ! L'ennui c'est que je ne comprend pas d'où vient ce problème et pourquoi toutes ces pages et erreurs sont générées. En me penchant de plus près sur le problème, la syntaxe correcte des urls de recherche avancée devrait être : http://www.mon-site.fr/recherche-avancee/?s=&include_ing%5B%5D=beurre&relation=any&exclude_ing%5B%5D=eau&cat=20&level=&serving=&timeneeded=&submit=Lancer+la+recherche+!
or dans google webmaster tool, je trouve la syntaxe suivante : http://www.mon-site.fr/search/+/page/numéro de page/?s=&include_ing%5B%5D=beurre&relation=any&exclude_ing%5B%5D=eau&cat=20&level=&serving=&timeneeded=&submit=Lancer+la+recherche+!
Ce qui fait donc une duplication des résultats de recherche d'une part, et en plus des résultats qui mènent à une erreur 404 (à cause de la numérotation des pages dans les urls) : quand j'écris par exemple "search/+/page/1", la page de résultat s'affiche, par contre si j'écris "search/+/page/2" je tombe sur une erreur 404.
C'est un vrai casse-tête, d'autant que je ne comprend pas comment ces urls ont été trouvées par Google (j'ai toutefois tenté de contacter le support du thème (thème payant en plus), sans réponse...)
 
Nouveau WRInaute
madri2 a dit:
sans l'url du site on ne peut t'aider

Ok, alors voici un exemple peut-être plus concret parmi les 5000 url crawlées par Google :
-http://www.recettes-bretonnes.fr/search/+/page/4/?s=&include_ing%5B%5D=beurre&relation=any&exclude_ing%5B%5D=sel&cat=4&level=&serving=&timeneeded=&submit=Lancer+la+recherche+!

En modifiant la structure par search/+/page/1 par exemple, le résultat s'affiche correctement (il n'y a d'ailleurs qu'une seule page de résultats, donc je comprend pas pourquoi il arrive à crawler la page 4...) : -http://www.recettes-bretonnes.fr/search/+/page/1/?s=&include_ing%5B%5D=beurre&relation=any&exclude_ing%5B%5D=sel&cat=4&level=&serving=&timeneeded=&submit=Lancer+la+recherche+!

Mais en principe, si vous utilisez le moteur de recherche avancée dans la sidebar, la structure correcte est : -http://www.recettes-bretonnes.fr/recherche-avancee/?s=&include_ing%5B%5D=beurre&relation=any&exclude_ing%5B%5D=sel&cat=4&level=&serving=&timeneeded=&submit=Lancer+la+recherche+%21

Donc je ne comprend pas d'où vient cette duplication et surtout comment google arrive à voir tous ces résultats de recherche ! Merci pour votre aide (j'ai retourné le thème dans tous les sens, je ne comprend pas ! :roll:)
 
Nouveau WRInaute
madri2 a dit:
gwt t'indique que ces pages sont indéxées via quelles pages ?

Pour l'exemple que j'ai donné, il me dit que l'url est référencée sur :
- -http://www.recettes-bretonnes.fr/search/+/page/4/?s=&include_ing%5B%5D=beurre&relation=any&exclude_ing%5B%5D=sucre-vanille&cat=7&level=&serving=&timeneeded=&submit=Lancer+la+recherche+!
- -http://www.recettes-bretonnes.fr/search/+/page/4/?s=&include_ing%5B%5D=beurre&relation=any&exclude_ing%5B%5D=poivre&cat=0&level=&serving=&timeneeded=&submit=Lancer+la+recherche+!
- -http://www.recettes-bretonnes.fr/search/+/page/4/?s=&include_ing%5B%5D=beurre&relation=any&exclude_ing%5B%5D=galettes&cat=0&level=&serving=&timeneeded=&submit=Lancer+la+recherche+!
... et bien d'autrs encore ! dans ces urls à chaque fois c'est l'ingrédient à exclure qui change. Vraiment étrange !
 
WRInaute impliqué
déjà essaye de voir pour faire les recherches en POST et/ou mettre les résultats en no index
 
Discussions similaires
Haut