Problème avec Sitemap Google

WRInaute passionné
Bonjour,
Depuis google semble ne pas arriver à charger le fichier sitemap:
sitemap.png


Pourtant il est bien accessible http://www.wallpapers-hd.com/sitemap.xml

Quelqu'un a une idée d'où ça pourrait venir?

Je n'ai jamais eu ce cas de figure.
Merci d'avance.
 
WRInaute passionné
Je ne sais pas. J'ai généré le sitemap avec un outil en ligne, et il marchait jusque là.
Ce n'est que ce matin où il a bloqué.
Merci de ta réponse :)
Je vais essayé de générer un sitemap autrement.
C'est reparti pour 5 heures...
 
WRInaute passionné
Je vais créer un sitemap plus cours de 500 urls. Le temps de reup un plus complet par la suite.
De toute manière je vais rajouter pas mal de contenu aujourd'hui et demain.
 
WRInaute passionné
Non ça c'est parce que je l'ai effacé sans faire gaffe ^^
J'ai réupload un sitemap plus court pour voir ce que ça donne avec google. Bing et Yahoo ne semblent pas avoir de problème en tout cas.
Edit: Le nouveau sitemap passe bien chez google. Ca me laissera le temps d'en refaire un plus large.
Merci pour l'intérêt que vous avez porter à mes questions :)
 
WRInaute accro
et plutot que d'utiliser des outils en ligne longs et limités, télécharge plutôt un logiciel qui fait ça sans limite et rapidement, en fermant bien les balises :) et sans commentaire HTML;
dans les outils "connus", ya referencement-mkt.com/creation-sitemap.html, qui prend en compte les restrictions moteurs (robots.txt, meta noindex, liens nofollow).
 
WRInaute discret
Bonsoir,
C'est bizarre, mais j'ai aussi un problème aujourd'hui alors qu'il n'y avait rien à signaler jusqu'à présent. J'utilise depuis plus d'un an le même logiciel et aujourd'hui bug. Je viens de resoumettre le sitemap et toujours bug. Comprend pas.
 
WRInaute accro
Il est possible qu'ils aient changé quelque chose de leur côté qui fait que des choses incorrectes qui étaient tolérées jusqu'ici ne le sont plus...

Jacques.
 
WRInaute accro
jcaron a dit:
Il est possible qu'ils aient changé quelque chose de leur côté qui fait que des choses incorrectes qui étaient tolérées jusqu'ici ne le sont plus...

Jacques.
Je doute qu’ils l’eussent fait sans prévenir, un schéma XML défini le protocole sitemap. Google l’a même plébiscité.

A quoi penses-tu ?
 
WRInaute accro
salva a dit:
jcaron a dit:
Il est possible qu'ils aient changé quelque chose de leur côté qui fait que des choses incorrectes qui étaient tolérées jusqu'ici ne le sont plus...
Je doute qu’ils l’eussent fait sans prévenir, un schéma XML défini le protocole sitemap. Google l’a même plébiscité.

A quoi penses-tu ?

Justement, au fait qu'ils soient plus stricts sur la validation XML par exemple. Comme je n'ai pas vu les fichiers incriminés, difficile à dire quoi exactement, mais ça pourrait être des histoires de tags mal fermés, de & pas correctement encodés dans les URLs, des choses comme ça... S'ils parsaient à la sauvage (à coups de regexps par exemple) et qu'ils sont passés à un vrai parsing XML, ça peut arriver.

Jacques.
 
WRInaute accro
Je viens de vérifier l’ensemble de mes sites et le message apparaît pour le sitemap de l’un d’entre eux.

Et si je ne m’abuse, il s’agirait d’une nouveauté, du moins je ne l’ai pas constaté auparavant.

En cliquant sur le nom de fichier du sitemap (console GWT), Google affiche ceci :
URL dupliquée
Cette même URL figure dans le sitemap. Veuillez la supprimer, puis renvoyer le sitemap.
Google nous aiderait-il à lutter contre le duplicate content ?

Par contre, Google me liste 8 urls en duplicate qui n’en sont pas et GWT semble bugger :
Voyons… il semble y avoir un problème. Nous en cherchons la cause.
Merci de nous en faire part sur notre forum d'aide.
Un autre message de Google par intermittente.
 
WRInaute passionné
Je ne comprends pas ce qui se passe...
J'ai refait un sitemap avec MKT sitemap: http://www.wallpapers-hd.com/sitemap.xml
Et là il me remet une croix rouge devant le sitemap sans me dire c'est quoi le problème.
Peut-être que le sitemap est trop gros? plus de 20000 urls. Dois-je changer quelque chose?
Merci de vos conseils.

Ce problème semble toucher pas mal de monde:

https://www.google.com/support/forum/p/Webmasters/thread?tid=4ac117495b ... 5aa9&hl=en

Et moi je n'ai aucun message d'erreur...
 
WRInaute accro
Firewave a dit:
Et là il me remet une croix rouge devant le sitemap sans me dire c'est quoi le problème.
Tu as bien cliqué sur le nom de fichier "sitemap.xml" pour le message d'erreur (directement dans la console GWT) ?
sitemap.png
 
WRInaute passionné
Au temps pour moi. Je suis tellement fatigué que j'ai continué à cliquer sur la croix par réflexe :lol:

J'ai cette erreur:

Code:
Erreur HTTP générique: 404 introuvable
Nous avons rencontré une erreur en essayant d'accéder à votre sitemap. Assurez-vous que votre sitemap est conforme aux consignes et qu'il est accessible à l'emplacement que vous avez spécifié. Ensuite, essayez de nouveau.

Pourtant le sitemap est accessible. Mais je pense qu'il est tellement gros que google met trop de temps à le charger. Il fait plus de 3 mb

Je n'ai jamais fait un sitemap en plusieurs partis :/ Je sens que va falloir que je regarde un tuto :mrgreen:
 
WRInaute accro
Ben continue avec les dates. La date ou les balises dates ne doivent pas être correctement formatées.
Date de la dernière modification du fichier. Cette date doit être au format date et d’heure W3C. Celui-ci vous permet d'omettre l'heure, si vous le souhaitez, et de n'utiliser que le format AAAA-MM-JJ.
 
WRInaute passionné
Haha je sens que ça va être drôle vu la longueur de la liste :p
Rendez-vous dans une heure, peut-être que j'aurais fini d'ici là... Merci en tout cas!
 
WRInaute accro
Si tu modifies ton sitemap à la main, au prochain crawl, le problème ressurgira.
Apparemment ton outil ne formate pas correctement le protocole sitemap.

Tu peux utiliser GsiteCrawler, respectueux du protocole.
 
WRInaute accro
Dans le cas présent un petit coup de recherche-remplacement devrait le faire: 2009-29-07 -> 2009-07-29

Mais effectivement il y a un bug avec l'outil utilisé qui ne génère pas la date au bon format (entre autres problèmes), visiblement.

Jacques.
 
WRInaute passionné
lol je n'ai pas pensé à l'outil de remplacement...
Sinon pour l'outil en question, le bug de la date, c'est de ma faute, c'est moi qui l'ai mal insérée à la base. Pour l'autre bug par contre ça vient du logiciel.
PAr contre là il me ressort plein de lignes buggées du coups il va falloir que je refasse le tout. Il détecte même les urls dupliquées maintenant oO
 
WRInaute accro
Firewave a dit:
lol je n'ai pas pensé à l'outil de remplacement...
Sinon pour l'outil en question, le bug de la date, c'est de ma faute, c'est moi qui l'ai mal insérée à la base. Pour l'autre bug par contre ça vient du logiciel.
PAr contre là il me ressort plein de lignes buggées du coups il va falloir que je refasse le tout. Il détecte même les urls dupliquées maintenant oO


De quel autre bug parles-tu ? Je l'ai testé sur un site de 4 333 URL et je n'ai rencontré aucun bug avec ce MktSitemap ...
 
WRInaute passionné
J'ai 20 000 urls. Je ne sais pas pourquoi mais il génère des codes doublons en ouvrant des balises et en ne les refermant pas, ou en mettant deux urls dans la même balise. Je suis en train d'essayer avec Yooda là.
Je vous tiendrai au courant.
bug.png
 
Nouveau WRInaute
Bonjour,
Je me permets de poster dans ce topic car il me semble avoir un souci également avec mon sitemap.
C'est un sitemap dynamique qu'a installé un dév pour nous (je ne suis pas seule à gérer ce site), qui est à la base en php et qui est rewrité.
Il se trouve ici : -http://www.dvdseries.net/sitemap.xml

Je l'ai soumis via google webmaster tools le 31 juillet, or il s'avère que depuis, Google ne l'a toujours pas visité.
Je n'arrive pas à déterminer si le sitemap prend bien en compte les pages dynamiques (c'est essentiel, vous en conviendrez) et surtout je ne comprends pas pourquoi Google ne le prend pas en charge...

Par ailleurs, histoire de tester avec autre chose, j'ai entrepris de créer un sitemap manuellement avec Yooda, mais j'ai l'impression que ce programme encaisse mal les presque 60 000 pages crawlées et quand je désire enregistrer le sitemap, Yooda plante... Je ne sais pas quoi faire du coup :(
 
WRInaute accro
Premier problème: les URLS utilisent le nom de domaine www.www.dvdseries.net...

Deuxième problème potentiel: si tu dois avoir 60 000 pages, c'est un peu raté, il y en a nettement moins que ça.

Sinon qu'est-ce-qui te fait dire que Google ne l'a jamais visité? Et puis ça ne fait que 4 jours... Tu l'as ajouté via GWT en plus de le mettre dans le /robots.txt?

Jacques.
 
Nouveau WRInaute
jcaron a dit:
Premier problème: les URLS utilisent le nom de domaine http://www.www.dvdseries.net...

Misère, je n'avais même pas vu ça, la honte ! Ceci explique cela... Vous savez comment je peux rattraper le coup moi-même ? Le mec qui l'a installé est en vacances...

jcaron a dit:
Deuxième problème potentiel: si tu dois avoir 60 000 pages, c'est un peu raté, il y en a nettement moins que ça.

C'est justement pour ça que je pense que le script php ne prend pas en charge les pages dynamiques... Dans ce sitemap il n'y a que les pages statiques...

jcaron a dit:
Sinon qu'est-ce-qui te fait dire que Google ne l'a jamais visité? Et puis ça ne fait que 4 jours... Tu l'as ajouté via GWT en plus de le mettre dans le /robots.txt?

Voilà, c'est exactement ça... C'est comme ça que je sais que GG n'est pas passé dessus... ceci étant dit, du coup avec les 2 x www je suppose que ça n'aurait pas vraiment d'utilité s'il passait dessus :(

Merci pour ta réponse :)
 
Nouveau WRInaute
Ok d'acc, merci de l'information :)
J'ai pu virer les 3W en trop, déjà.
Maintenant en effet, si le sitemap est limité à 50 000 liens, ça risque également de coincer.
Mais est-ce possible d'avoir un sitemap dynamique qui sache se limiter à "seulement" 50 000 pages crawlées ?
 
Discussions similaires
Haut