Problème avec Sitemap Google

Discussion dans 'Problèmes de référencement spécifiques à vos sites' créé par Firewave, 29 Juillet 2009.

  1. Firewave
    Firewave WRInaute passionné
    Inscrit:
    26 Juillet 2009
    Messages:
    1 910
    J'aime reçus:
    0
  2. nickargall
    nickargall WRInaute accro
    Inscrit:
    13 Juin 2005
    Messages:
    6 658
    J'aime reçus:
    0
    Bonjour

    C'est quoi ces commentaires HTML dans ton fichier sitemap ? Ca doit venir de là ...
     
  3. Firewave
    Firewave WRInaute passionné
    Inscrit:
    26 Juillet 2009
    Messages:
    1 910
    J'aime reçus:
    0
    Je ne sais pas. J'ai généré le sitemap avec un outil en ligne, et il marchait jusque là.
    Ce n'est que ce matin où il a bloqué.
    Merci de ta réponse :)
    Je vais essayé de générer un sitemap autrement.
    C'est reparti pour 5 heures...
     
  4. Firewave
    Firewave WRInaute passionné
    Inscrit:
    26 Juillet 2009
    Messages:
    1 910
    J'aime reçus:
    0
    Je vais créer un sitemap plus cours de 500 urls. Le temps de reup un plus complet par la suite.
    De toute manière je vais rajouter pas mal de contenu aujourd'hui et demain.
     
  5. jcaron
    jcaron WRInaute accro
    Inscrit:
    13 Février 2004
    Messages:
    2 593
    J'aime reçus:
    0
    Il manque surtout le tag d'ouverture <urlset> (il est bien fermé mais il n'est jamais ouvert)...

    Jacques.
     
  6. Firewave
    Firewave WRInaute passionné
    Inscrit:
    26 Juillet 2009
    Messages:
    1 910
    J'aime reçus:
    0
    Non ça c'est parce que je l'ai effacé sans faire gaffe ^^
    J'ai réupload un sitemap plus court pour voir ce que ça donne avec google. Bing et Yahoo ne semblent pas avoir de problème en tout cas.
    Edit: Le nouveau sitemap passe bien chez google. Ca me laissera le temps d'en refaire un plus large.
    Merci pour l'intérêt que vous avez porter à mes questions :)
     
  7. nickargall
    nickargall WRInaute accro
    Inscrit:
    13 Juin 2005
    Messages:
    6 658
    J'aime reçus:
    0
    et plutot que d'utiliser des outils en ligne longs et limités, télécharge plutôt un logiciel qui fait ça sans limite et rapidement, en fermant bien les balises :) et sans commentaire HTML;
    dans les outils "connus", ya referencement-mkt.com/creation-sitemap.html, qui prend en compte les restrictions moteurs (robots.txt, meta noindex, liens nofollow).
     
  8. Firewave
    Firewave WRInaute passionné
    Inscrit:
    26 Juillet 2009
    Messages:
    1 910
    J'aime reçus:
    0
    Ah merci! Je me disais bien que ça devait exister :)
    Je vais en créer un de ce pas avec mkt sitemap :)
     
  9. manubu
    manubu WRInaute occasionnel
    Inscrit:
    18 Novembre 2005
    Messages:
    253
    J'aime reçus:
    1
    Bonsoir,
    C'est bizarre, mais j'ai aussi un problème aujourd'hui alors qu'il n'y avait rien à signaler jusqu'à présent. J'utilise depuis plus d'un an le même logiciel et aujourd'hui bug. Je viens de resoumettre le sitemap et toujours bug. Comprend pas.
     
  10. Firewave
    Firewave WRInaute passionné
    Inscrit:
    26 Juillet 2009
    Messages:
    1 910
    J'aime reçus:
    0
    Peut-être que ça vient de google. Qui sait ^^
     
  11. salva
    salva WRInaute accro
    Inscrit:
    16 Avril 2006
    Messages:
    3 577
    J'aime reçus:
    0
    Pas d’inquiétude à avoir, ça se produit quelques fois.
     
  12. jcaron
    jcaron WRInaute accro
    Inscrit:
    13 Février 2004
    Messages:
    2 593
    J'aime reçus:
    0
    Il est possible qu'ils aient changé quelque chose de leur côté qui fait que des choses incorrectes qui étaient tolérées jusqu'ici ne le sont plus...

    Jacques.
     
  13. salva
    salva WRInaute accro
    Inscrit:
    16 Avril 2006
    Messages:
    3 577
    J'aime reçus:
    0
    Je doute qu’ils l’eussent fait sans prévenir, un schéma XML défini le protocole sitemap. Google l’a même plébiscité.

    A quoi penses-tu ?
     
  14. salva
    salva WRInaute accro
    Inscrit:
    16 Avril 2006
    Messages:
    3 577
    J'aime reçus:
    0
    manubu as-tu un message d'erreur ? Si problème il y a, Google te stipule où il se situe.
     
  15. jcaron
    jcaron WRInaute accro
    Inscrit:
    13 Février 2004
    Messages:
    2 593
    J'aime reçus:
    0
    Justement, au fait qu'ils soient plus stricts sur la validation XML par exemple. Comme je n'ai pas vu les fichiers incriminés, difficile à dire quoi exactement, mais ça pourrait être des histoires de tags mal fermés, de & pas correctement encodés dans les URLs, des choses comme ça... S'ils parsaient à la sauvage (à coups de regexps par exemple) et qu'ils sont passés à un vrai parsing XML, ça peut arriver.

    Jacques.
     
  16. salva
    salva WRInaute accro
    Inscrit:
    16 Avril 2006
    Messages:
    3 577
    J'aime reçus:
    0
    Je viens de vérifier l’ensemble de mes sites et le message apparaît pour le sitemap de l’un d’entre eux.

    Et si je ne m’abuse, il s’agirait d’une nouveauté, du moins je ne l’ai pas constaté auparavant.

    En cliquant sur le nom de fichier du sitemap (console GWT), Google affiche ceci :
    Google nous aiderait-il à lutter contre le duplicate content ?

    Par contre, Google me liste 8 urls en duplicate qui n’en sont pas et GWT semble bugger :
    Un autre message de Google par intermittente.
     
  17. Firewave
    Firewave WRInaute passionné
    Inscrit:
    26 Juillet 2009
    Messages:
    1 910
    J'aime reçus:
    0
    Je ne comprends pas ce qui se passe...
    J'ai refait un sitemap avec MKT sitemap: http://www.wallpapers-hd.com/sitemap.xml
    Et là il me remet une croix rouge devant le sitemap sans me dire c'est quoi le problème.
    Peut-être que le sitemap est trop gros? plus de 20000 urls. Dois-je changer quelque chose?
    Merci de vos conseils.

    Ce problème semble toucher pas mal de monde:

    https://www.google.com/support/forum/p/Webmasters/thread?tid=4ac117495b ... 5aa9&hl=en

    Et moi je n'ai aucun message d'erreur...
     
  18. salva
    salva WRInaute accro
    Inscrit:
    16 Avril 2006
    Messages:
    3 577
    J'aime reçus:
    0
    Tu as bien cliqué sur le nom de fichier "sitemap.xml" pour le message d'erreur (directement dans la console GWT) ?
    [​IMG]
     
  19. Firewave
    Firewave WRInaute passionné
    Inscrit:
    26 Juillet 2009
    Messages:
    1 910
    J'aime reçus:
    0
    Au temps pour moi. Je suis tellement fatigué que j'ai continué à cliquer sur la croix par réflexe :lol:

    J'ai cette erreur:

    Code:
    Erreur HTTP générique: 404 introuvable
    Nous avons rencontré une erreur en essayant d'accéder à votre sitemap. Assurez-vous que votre sitemap est conforme aux consignes et qu'il est accessible à l'emplacement que vous avez spécifié. Ensuite, essayez de nouveau.
    Pourtant le sitemap est accessible. Mais je pense qu'il est tellement gros que google met trop de temps à le charger. Il fait plus de 3 mb

    Je n'ai jamais fait un sitemap en plusieurs partis :/ Je sens que va falloir que je regarde un tuto :mrgreen:
     
  20. salva
    salva WRInaute accro
    Inscrit:
    16 Avril 2006
    Messages:
    3 577
    J'aime reçus:
    0
    Compresse le fichier en sitemap.xml.gz et modifie le robots.txt en conséquence :
    Sitemap: http://www.ndd.tld/sitemap.xml.gz
     
  21. Firewave
    Firewave WRInaute passionné
    Inscrit:
    26 Juillet 2009
    Messages:
    1 910
    J'aime reçus:
    0
    Moui...

    [​IMG]

    J'ai gagné le gros lot. Je suis parti pour refaire le sitemap, c'est ça?
    Merci de ton aide :)
     
  22. salva
    salva WRInaute accro
    Inscrit:
    16 Avril 2006
    Messages:
    3 577
    J'aime reçus:
    0
    Procède par ordre, corrige déjà la première erreur de balise comme demandé.
    Sers-toi du protocole sitemap.
     
  23. Firewave
    Firewave WRInaute passionné
    Inscrit:
    26 Juillet 2009
    Messages:
    1 910
    J'aime reçus:
    0
    C'est fait :)

    Mais le problème de la date persiste:
    [​IMG]

    Ce n'est pas trop grave?
    Et désolé pour le dérangement :)
     
  24. salva
    salva WRInaute accro
    Inscrit:
    16 Avril 2006
    Messages:
    3 577
    J'aime reçus:
    0
    Ben continue avec les dates. La date ou les balises dates ne doivent pas être correctement formatées.
     
  25. Firewave
    Firewave WRInaute passionné
    Inscrit:
    26 Juillet 2009
    Messages:
    1 910
    J'aime reçus:
    0
    Haha je sens que ça va être drôle vu la longueur de la liste :p
    Rendez-vous dans une heure, peut-être que j'aurais fini d'ici là... Merci en tout cas!
     
  26. salva
    salva WRInaute accro
    Inscrit:
    16 Avril 2006
    Messages:
    3 577
    J'aime reçus:
    0
    Qu'utilises-tu comme outil pour générer ton sitemap ?
     
  27. Firewave
    Firewave WRInaute passionné
    Inscrit:
    26 Juillet 2009
    Messages:
    1 910
    J'aime reçus:
    0
  28. salva
    salva WRInaute accro
    Inscrit:
    16 Avril 2006
    Messages:
    3 577
    J'aime reçus:
    0
    Si tu modifies ton sitemap à la main, au prochain crawl, le problème ressurgira.
    Apparemment ton outil ne formate pas correctement le protocole sitemap.

    Tu peux utiliser GsiteCrawler, respectueux du protocole.
     
  29. jcaron
    jcaron WRInaute accro
    Inscrit:
    13 Février 2004
    Messages:
    2 593
    J'aime reçus:
    0
    Dans le cas présent un petit coup de recherche-remplacement devrait le faire: 2009-29-07 -> 2009-07-29

    Mais effectivement il y a un bug avec l'outil utilisé qui ne génère pas la date au bon format (entre autres problèmes), visiblement.

    Jacques.
     
  30. Firewave
    Firewave WRInaute passionné
    Inscrit:
    26 Juillet 2009
    Messages:
    1 910
    J'aime reçus:
    0
    lol je n'ai pas pensé à l'outil de remplacement...
    Sinon pour l'outil en question, le bug de la date, c'est de ma faute, c'est moi qui l'ai mal insérée à la base. Pour l'autre bug par contre ça vient du logiciel.
    PAr contre là il me ressort plein de lignes buggées du coups il va falloir que je refasse le tout. Il détecte même les urls dupliquées maintenant oO
     
  31. nickargall
    nickargall WRInaute accro
    Inscrit:
    13 Juin 2005
    Messages:
    6 658
    J'aime reçus:
    0

    De quel autre bug parles-tu ? Je l'ai testé sur un site de 4 333 URL et je n'ai rencontré aucun bug avec ce MktSitemap ...
     
  32. Firewave
    Firewave WRInaute passionné
    Inscrit:
    26 Juillet 2009
    Messages:
    1 910
    J'aime reçus:
    0
    J'ai 20 000 urls. Je ne sais pas pourquoi mais il génère des codes doublons en ouvrant des balises et en ne les refermant pas, ou en mettant deux urls dans la même balise. Je suis en train d'essayer avec Yooda là.
    Je vous tiendrai au courant.
    [​IMG]
     
  33. julienringard
    julienringard WRInaute discret
    Inscrit:
    13 Juillet 2009
    Messages:
    193
    J'aime reçus:
    0
    Rien de tels que yooda
     
  34. Akazan
    Akazan Nouveau WRInaute
    Inscrit:
    18 Mars 2006
    Messages:
    10
    J'aime reçus:
    0
    Bonjour,
    Je me permets de poster dans ce topic car il me semble avoir un souci également avec mon sitemap.
    C'est un sitemap dynamique qu'a installé un dév pour nous (je ne suis pas seule à gérer ce site), qui est à la base en php et qui est rewrité.
    Il se trouve ici : -http://www.dvdseries.net/sitemap.xml

    Je l'ai soumis via google webmaster tools le 31 juillet, or il s'avère que depuis, Google ne l'a toujours pas visité.
    Je n'arrive pas à déterminer si le sitemap prend bien en compte les pages dynamiques (c'est essentiel, vous en conviendrez) et surtout je ne comprends pas pourquoi Google ne le prend pas en charge...

    Par ailleurs, histoire de tester avec autre chose, j'ai entrepris de créer un sitemap manuellement avec Yooda, mais j'ai l'impression que ce programme encaisse mal les presque 60 000 pages crawlées et quand je désire enregistrer le sitemap, Yooda plante... Je ne sais pas quoi faire du coup :(
     
  35. jcaron
    jcaron WRInaute accro
    Inscrit:
    13 Février 2004
    Messages:
    2 593
    J'aime reçus:
    0
    Premier problème: les URLS utilisent le nom de domaine www.www.dvdseries.net...

    Deuxième problème potentiel: si tu dois avoir 60 000 pages, c'est un peu raté, il y en a nettement moins que ça.

    Sinon qu'est-ce-qui te fait dire que Google ne l'a jamais visité? Et puis ça ne fait que 4 jours... Tu l'as ajouté via GWT en plus de le mettre dans le /robots.txt?

    Jacques.
     
  36. Akazan
    Akazan Nouveau WRInaute
    Inscrit:
    18 Mars 2006
    Messages:
    10
    J'aime reçus:
    0
    Misère, je n'avais même pas vu ça, la honte ! Ceci explique cela... Vous savez comment je peux rattraper le coup moi-même ? Le mec qui l'a installé est en vacances...

    C'est justement pour ça que je pense que le script php ne prend pas en charge les pages dynamiques... Dans ce sitemap il n'y a que les pages statiques...

    Voilà, c'est exactement ça... C'est comme ça que je sais que GG n'est pas passé dessus... ceci étant dit, du coup avec les 2 x www je suppose que ça n'aurait pas vraiment d'utilité s'il passait dessus :(

    Merci pour ta réponse :)
     
  37. salva
    salva WRInaute accro
    Inscrit:
    16 Avril 2006
    Messages:
    3 577
    J'aime reçus:
    0
    Sache également que ton sitemap doit contenir au maximum 50 000 urls et le fichier ne doit pas excéder 10 Mo en poids.
     
  38. Akazan
    Akazan Nouveau WRInaute
    Inscrit:
    18 Mars 2006
    Messages:
    10
    J'aime reçus:
    0
    Ok d'acc, merci de l'information :)
    J'ai pu virer les 3W en trop, déjà.
    Maintenant en effet, si le sitemap est limité à 50 000 liens, ça risque également de coincer.
    Mais est-ce possible d'avoir un sitemap dynamique qui sache se limiter à "seulement" 50 000 pages crawlées ?
     
Chargement...
Similar Threads - Problème Sitemap Google Forum Date
Problème avec le sitemap pour Google News Crawl et indexation Google, sitemaps 5 Mai 2014
Problème d'indexation Google / sitemap / (code 520) Problèmes de référencement spécifiques à vos sites 5 Avril 2014
Gros problème référencement Google malgré sitemap.xml Problèmes de référencement spécifiques à vos sites 27 Décembre 2013
Problème Sitemap Google Actualités non répertorié Crawl et indexation Google, sitemaps 9 Août 2013
Problème de sitemap pour Google actu Crawl et indexation Google, sitemaps 22 Octobre 2011
Google, problème avec le Sitemap Crawl et indexation Google, sitemaps 14 Février 2010
Problème indexation dans Google avec le sitemap Problèmes de référencement spécifiques à vos sites 24 Septembre 2009
Google Sitemap Generator : Problèmes d'utilisation Administration d'un site Web 14 Février 2009
Problème de sitemap pour Google Actualités Crawl et indexation Google, sitemaps 31 Décembre 2008
Url redirigée en 301 mais indexée : problème sitemap ? Crawl et indexation Google, sitemaps 9 Octobre 2019
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice