stagnation

WRInaute occasionnel
(voir mon profil ou le bouton WWW pour l'url)

Mon site a maintenant plusieurs mois et un PR4, le nombre de page indexées par Google varie entre 280 et 305 (sur 8000 publiées). J'utilise l'URL Rewriting (les liens ont été testés).

Quelqu'un saurait pourquoi l'indexation de mes pages stagne ?
Auriez-vous, au passage, quelques conseils d'optimisations qui auraient pu nous échapper ?

Ne me parlez pas du côté "légal" de mon site, je suis parfaitement au courant, voir -http://www.adpci.fr pour plus d'infos là-dessus.)

Merci de vos conseils !
 
WRInaute accro
Didier_S a dit:
Quelqu'un saurait pourquoi l'indexation de mes pages stagne ?!
vu le nombre de sites qui diffusent les paroles de chansons a mon avis c'est un duplicate content géant. Vous avez tous les memes pages avec le même texte ( forcément ). simple hypothèse of course .. c'est peut etre eutre chose
 
WRInaute occasionnel
en effet, j'y avais pas pensé... étant dans les "petits nouveaux" on est peut-être pénalisés par la non-originalité de notre contenu...

Si quelqu'un dans l'assistance a fait référencer, par exemple, un site avec des infos provenant de fils RSS dans tous les sens, qu'il n'hésite pas à nous faire partager son expérience...

De mon côté je vais essayer de voir avec les autres webmasters, histoire d'organiser des tests niveau référencement (on pourra peut-être en savoir plus)

Merci pour l'hypotèse, âne parisien :)
 
WRInaute accro
Petite question hors sujet :

Texte soumis aux droits d'auteur - Réservé à un usage privé ou éducatif

En bas des textes, ca veut dire quoi?

Tu payes la SACEM ? Tu as obtenu l'autorisation de les reproduire ?

C'est juste une question comme ca car je voudrais mettre le texte d'une chanson sur mon site, c'est pas pour concurrencer.

Merci par avance.

Sur ta question je pense également qu'il doit y avoir duplicate content avec les autres sites.
 
WRInaute accro
tu pourrais nous en dire un peu plus sur tes pages indéxées et non indéxées (age, rewrittées ou non, profondeur dans la structure de lien, nombre et niveau des liens qui pointent vers elles, vers quelles pages pointent elles, etc ...) ?
 
WRInaute accro
Autant pour moi pour ma question, je n'avais pas bu assez de café et j'avais sauté le lien que tu fournissais. :roll:

Pour l'indexation de tes pages j'ai parcouru les résultats de Google et il me semble que ton problème est peut-être dû à l'URL rewriting que tu as fait.

Le moteur renvoit encore des pages avec les anciennes URL, donc à mon avis il considère les nouvelles comme du duplicate content jusuq'à ce que les anciennes disparaissent de l'index ; ce qui devrait arriver assez vite puisque tes anciennes URL (style -http://*/chansons-TOOL--385-.html) renvoient en 404.

A mon avis donc patience.
 
WRInaute occasionnel
Cendrillon a dit:
tu pourrais nous en dire un peu plus sur tes pages (...)
en gros, les pages ayant des liens sur l'index ont tous été crawlés, plus quelques liens sur ces pages (donc les pages "liste des chansons de Untel")
j'ai des pages non-rewritées qui ont été indexées (alors que le rewriting était en place avant l'apparition des pages dans l'index; j'ai du manquer de chance et le mettre en place juste entre le crawl et l'indexation réelle)
l'avancée dans l'indexation me semble donc logique, ça part de l'index et ça suit l'arborescence. ce qui me gêne plus, c'est la stagnation dans le nombre de pages indexées, mais je pense que vous avez trouvé ce qui cloche.

serval2a a dit:
Le moteur renvoit encore des pages avec les anciennes URL(...) puisque tes anciennes URL renvoient en 404.
Je viens de pondre un petit script qui, à partir de l'identifiant dans l'url, qui renvoie vers la page rewritée, au moyen d'une redirection 301. Ce qui devrait accélérer le processus (arrêtez moi si j'ai tort)

autre détail, Yahoo! a indexé tous les fichiers dans les répertoires de mon site, sans que ceux-ci ne soient linkés nulle part... (j'utilise des fichiers textes pour les paroles, le tout couplé à un système de cache, afin de ne pas saturer le serveur SQL). Il n'y a absolument nulle part de référence à ces fichiers (puisque c'est le PHP qui y accède), ni de lien vers un aute fichier qui serait dans le même répertoire... Par curiosité, comment Yahoo aurait-il pu trouver ces fichiers ?
(je viens de mettre en place un robots.txt pour qu'il arrête d'y fouiller son nez, 960 pages indexées dont seulement 120 chansons c'est pas top)

Merci les djeunz
 
Haut