Virgule dans les sitemaps entrainant des urls tronquées

Discussion dans 'Crawl et indexation Google, sitemaps' créé par clean, 24 Septembre 2014.

  1. clean
    clean WRInaute discret
    Inscrit:
    10 Octobre 2011
    Messages:
    58
    J'aime reçus:
    0
    Bonjour,
    Je me suis aperçu récemment (oh horreur :eek: ) que nos sitemaps étaient restés au schéma 0.84.
    Je l'ai donc fait changé par notre programmeur et il commence désormais comme ça :
    Code:
    <?xml version='1.0' encoding='UTF-8'?>
    <urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd"
    xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    Mais, du coup sont apparues des erreurs dans la page de détection des erreurs 404 dans GWT telles que http://www.example.fr/opel-sintra (url n'existant pas car tronquée par la virgule voir un exemple de la vraie url ci-dessous) référencée sur http://www.example.fr/sitemap-opel-voiture-occasion.xml

    Effectivement dans ce sitemap l'url déclarée est de ce type (c'est-à-dire avec une virgule) :
    Code:
    <url>
    <loc>http://www.example.fr/opel-sintra,essence-occasion-e-0.html</loc>
    <priority>0.5</priority>
    <changefreq>monthly</changefreq>
    </url>
    Y a-t-il une erreur de syntaxe ? Un moyen de corriger le pb ?
    Faut-il revenir en version 0.84 ?
    Car je me vois mal réécrire et faire des 301 sur les milliers d'url écrites comme ça.
    Merci d'avance pour vos conseils
     
  2. cthierry
    cthierry WRInaute passionné
    Inscrit:
    15 Janvier 2005
    Messages:
    2 194
    J'aime reçus:
    40
    Les virgules dans les url, je ne pense pas que cela soit une bonne idée sinon tous les gros sites les auraient :-D
    Pourquoi ne pas remplacer ta virgule par un "-" en réécriture.

    Sinon se servir de %C2 à la place de la virgule <= je sais pas si cela va fonctionner :-D
     
  3. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 138
    J'aime reçus:
    350
    je confirme que la virgule dans l'URL n'est pas une super idée (notamment quand on exploite un fichier CSV avec séparateur virgule)
    pourquoi ce pb viendrait-il de la version du standard sitemap utilisé ? si tu encodais bien en UTF8, ça devrait marcher
    au passage, pourquoi s'embêter avec du XML ?

    PS : lecture conseillée : SEO : bons et mauvais séparateurs dans les URL
     
  4. clean
    clean WRInaute discret
    Inscrit:
    10 Octobre 2011
    Messages:
    58
    J'aime reçus:
    0
    Merci pour vos réponses.
    Comment ça si j'encodais bien en UTF8 ? Si le fichier n'était pas en UTF8 Google ne le prendrait pas non ?
    Et xml est bien le format normal du sitemap non ? Y en a un autre ?
     
  5. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 138
    J'aime reçus:
    350
    je lis dans ton fichier "encoding='UTF-8'" donc j'espère qu'il est effectivement encodé comme tel.
    tu peux faire un format texte, avec une URL par ligne (difficile de faire plus simple)
    va faire un tour sur mon tuto sur les sitemaps Google
     
  6. clean
    clean WRInaute discret
    Inscrit:
    10 Octobre 2011
    Messages:
    58
    J'aime reçus:
    0
    Google prendrait en compte un fichier qui ne serait pas en UTF8 ? Je pense qu'il le refuserait ou me le signalerait non ?
    Sinon je ne vois pas comment le vérifier sur le serveur. Quand je fais la commande file et le nom du sitemap il m'indique text.
    Si je l'édite avec Notepad il est bien en UTF8 sans BOM
     
  7. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 417
    J'aime reçus:
    0
    pour l'avoir fait, dans le temps, les virgules sont une très mauvaise idée : ça me permettait de séparer les paramètres pouvant contenir des "-" à l'intérieur, sauf que FB, par exemple, introduisait une espace après la virgule. Et je m'étais ainsi retrouvé avec des milliers de 404 quand gg, mais surtout bing, tentait de suivre les url présentes dan les pages fb
     
  8. clean
    clean WRInaute discret
    Inscrit:
    10 Octobre 2011
    Messages:
    58
    J'aime reçus:
    0
    Merci pour vos réponses
    J'ai aussi des cas ou il y a des parenthèses dans l'url.
    Google les indexe mais elle ne sont pas bien placées (c'est peut-être aussi à cause d'autre chose).
    Je suppose qu'il faut que les enlève aussi hein ?
     
Chargement...
Similar Threads - Virgule sitemaps entrainant Forum Date
SEO, pour plusieurs villes, virgule dans title ? Débuter en référencement 14 Janvier 2017
Impact référencement avec url contenant une virgule Débuter en référencement 18 Juin 2015
Se positionner sur "virgule" Débuter en référencement 20 Juin 2013
mot clef à séparer par une virgule Débuter en référencement 28 Novembre 2012
Problème de sitemap et de virgule Crawl et indexation Google, sitemaps 7 Octobre 2011
[SQL] Stocker nombre à virgules Développement d'un site Web ou d'une appli mobile 21 Octobre 2010
SVP comment séparer les mots clés que donne adword par des virgules? Débuter en référencement 18 Juillet 2009
Problème de référencement et ajout sitemaps Problèmes de référencement spécifiques à vos sites 26 Novembre 2019
Problème d'indexation, Sitemaps non lus et baisse drastique du référencement/trafic Débuter en référencement 22 Mars 2019
Taille des sitemaps qui diminue alors que le catalogue produit augmente Débuter en référencement 8 Mars 2019
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice