Tirets dans les url et duplicate content sur blog

Nouveau WRInaute
Bonjour,

Je viens de lancer un blog (sous dotclear mais modifié de partout...) et d'optimiser le code pour le référencement.

Deux choses pourraient me poser problème au vu de ce que j'ai lu jusqu'à présent :

- Apparemment, Google n'apprécie pas les tirets dans les urls ? Mon url rewriting crée des urls de billets de type monblog.com/titre-du-billet.html (les titres sont généralement longs), pensez-vous que cela pose problème ? Devrais-je remplacer les "-" par des "+" comme je l'ai vu sur d'autres blogs ?

- Mes billets étant jusqu'à présent assez courts, je n'utilise pas de "chapô" et sur la page d'index (+ des catégories) s'affichent donc l'intégralité de tous les billets + les liens vers les pages permanentes. Est-ce que cela va être enregistré comme "duplicate content" ; et si oui, est-ce la page d'index ou les pages permanentes qui seront pénalisées ? Le meta-tag description et keywords est généré automatiquement en fonction du titre et donc toujours différent, il paraît que ça aide ?

Le blog est ici.

Merci d'avance de votre aide :)
 
WRInaute accro
mythos75 a dit:
- Apparemment, Google n'apprécie pas les tirets dans les urls ? Mon url rewriting crée des urls de billets de type monblog.com/titre-du-billet.html (les titres sont généralement longs), pensez-vous que cela pose problème ? Devrais-je remplacer les "-" par des "+" comme je l'ai vu sur d'autres blogs ?
Mal lu ;) ce sont les underscores _ que google n'identifie pas comme séparateurs, et msn live qui a des problemes avec plus de deux tirets.

mythos75 a dit:
- Mes billets étant jusqu'à présent assez courts, je n'utilise pas de "chapô" et sur la page d'index (+ des catégories) s'affichent donc l'intégralité de tous les billets + les liens vers les pages permanentes. Est-ce que cela va être enregistré comme "duplicate content" ; et si oui, est-ce la page d'index ou les pages permanentes qui seront pénalisées ?
Duplicate content = page identique
Donc pas dans ce cas.

mythos75 a dit:
Le meta-tag description et keywords est généré automatiquement en fonction du titre et donc toujours différent, il paraît que ça aide ?
Non, puisque ce balises ne sont pas utilisées pour le référencement
 
WRInaute accro
Marie-Aude a dit:
Mal lu ;) ce sont les underscores _ que google n'identifie pas comme séparateurs, et msn live qui a des problemes avec plus de deux tirets.

Effectivement.
Néanmoins, d'expérience je constate que les URI avec "un peu trop de tirets" s'en sortent moins bien. J'ajouterais volontiers aux "basics" de l'URL rewriting un petit dictionnaire de "mots morts", histoire d'éviter les choses comme:

blog.tld/url-avec-plein-de-mots-cles-dont-on-en-a-pas-grand-chose-a-faire-1122.htm

Marie-Aude a dit:
Duplicate content = page identique
Donc pas dans ce cas.

C'est un peu trop radical: une page dont le contenu figure intégralement sur une autre page du site, à meilleur potentiel risque fort de tomber en dupe. Si la page "pommes" (= catégorie) d'un même site reprend la même info, combinée, que les pages "pomme verte" (= billet #1) et "pomme gold" (= billet #2), elle risque fort de passer devant (plus balaise sur "pomme" ;) )

Un "chapeau" peut souvent se limiter à une phrase... et le teasing est un art --> autant en jouer.

mythos75 a dit:
Le meta-tag description et keywords est généré automatiquement en fonction du titre et donc toujours différent, il paraît que ça aide ?

Meta is dead ;)
 
Nouveau WRInaute
Merci pour vos réponses,
je vais mettre des chapô.

Dans mon cas (http://blog.librairie-papyrus.be), les titres des livres + l'auteur sont dans l'url, est-ce qu'il ne vaut pas mieux laisser les petits mots pour avoir plus de chance d'être bien classé sur le titre exact du livre ?

Qu'est-ce que le "teasing" ? :)
 
WRInaute accro
HawkEye a dit:
Marie-Aude a dit:
Duplicate content = page identique
Donc pas dans ce cas.

C'est un peu trop radical: une page dont le contenu figure intégralement sur une autre page du site, à meilleur potentiel risque fort de tomber en dupe. Si la page "pommes" (= catégorie) d'un même site reprend la même info, combinée, que les pages "pomme verte" (= billet #1) et "pomme gold" (= billet #2), elle risque fort de passer devant (plus balaise sur "pomme" ;) )

Certes, mais est-ce un problème ? :)
En plus ce ne sera pas pour DC, mais pour - éventuellement - densité supérieure.
Et si la densité est trop élevée sur la page catégorie, alors ce seront les pages individuelles qui ressortiront.


mythos75 a dit:
Le meta-tag description et keywords est généré automatiquement en fonction du titre et donc toujours différent, il paraît que ça aide ?

HawkEye a dit:
[/quote]

N'oublions quand même pas les descriptions pour l'affichage dans les résultats...
 
Nouveau WRInaute
Ok, je vais voir comment ça va évoluer ;
je sais que je dois faire attention au meta description.

Pour l'instant seule ma page d'accueil est présente sur Google, référencée la nuit passée. Les articles n'y sont pas, j'espère que ça va venir :?
 
Nouveau WRInaute
Comme ça a déjà été dit des tirets dans un titre c'est très bien (pas des underscore, sinon ça va être interprété comme un seul et même mot), je rajouterais juste que si tu veux encore plus plaire à Google, il faut que tu réduises tes URL si elles sont trop longues... l'idéal c'est de faire des URL courtes, en gros qu'un humain pourrait retenir facilement. La tu lui fais plaisir à Mr G :D Et si tu à des URL courtes avec les bons key words c'est encore mieux :)
 
Nouveau WRInaute
Il y a 3 billets que tu as postés le 24 Juin... laisse à Google le temps de repasser ! Ton site a été crawlé le 22 juin pour la dernière fois. Ce n'est qu'une affaire de temps :D
 
WRInaute discret
mythos75 a dit:
26 juin, Google est repassé deux fois depuis, mais toujours que l'index de référencé... :(

T'inquietes, au lancement de mon blog, google indexait les articles en quelques jours. Avec des mises à jour régulières, ils sont maintenant indexés en 10 minutes.
 
Discussions similaires
Haut