Génération de sitemap sur du gros volume

Nouveau WRInaute
Bonjour,

Je cherche actuellement à référencer un annuaire complet. Or cet annuaire est dynamique et fonctionne de la manière suivante :

- Chaque entrée est géolocalisée (environ 60 000)
- je dispose d'une base de donnée des villes de france classée selon les régions, départements etc...


Quand on recherche une entrée dans mon annuaire, on sélectionne sa ville via le menu des régions, et les résultats s'affichent en fonction de la distance de la ville sélectionnée. Mais au final, TOUTS les résultats sont renvoyés ! seul le classement géographique change.


Je me pose la question sur la génération du sitemap de cet annuaire :
- je génére les 60 000 liens vers les pages de mes entrées

Ensuite j'aimerais générer les liens vers les différents types de recherches ce qui fait :
35 000 entrées (villes de france et données géographique) x 25 (mon nombre de catégories) x 60 000 (nombres d'entrées) / 20 (le nombre d'entrées par pages affichées)

Ca fait un sacré paquet d'urls.

Quel est selon vous la meilleure méthode de référencement ? Dois je tout référencer ? comment google se comportera face à la génération d'un sitemap aussi gros ? Dois je y aller progressivement ?

De plus mes entrées étant redondantes (le classement change uniquement), est ce que je risque de tomber en duplicate content ?

Merci d'avance pour vos réponses
 
WRInaute accro
brindavoine a dit:
Ensuite j'aimerais générer les liens vers les différents types de recherches ce qui fait :
35 000 entrées (villes de france et données géographique) x 25 (mon nombre de catégories) x 60 000 (nombres d'entrées) / 20 (le nombre d'entrées par pages affichées)

Ca fait un sacré paquet d'urls.
oui, ça s'appelle du spamindex
brindavoine a dit:
Quel est selon vous la meilleure méthode de référencement ? Dois je tout référencer ? comment google se comportera face à la génération d'un sitemap aussi gros ? Dois je y aller progressivement ?

De plus mes entrées étant redondantes (le classement change uniquement), est ce que je risque de tomber en duplicate content ?
google ne va pas aimer du tout. Même si ça passe encore pour certains sites, mais gg a commencé à faire le ménage depuis 1 an.
voir https://www.google.com/support/webmasters/bin/answer.py?answer=66359
google a dit:
Limitez les contenus similaires : si de nombreuses pages de votre site sont similaires, développez chacune d'entre elles ou regroupez-les pour n'en faire qu'une seule. Par exemple, si votre site de voyages présente des pages distinctes pour deux villes, mais que celles-ci comportent des informations identiques, regroupez les informations sur les deux villes sur une seule page ou développez chaque page afin qu'elles contiennent des informations bien différentes.
 
Nouveau WRInaute
quelle est alors la bonne méthode ?

Je mets dans le sitemap juste les entrées de mon annuaire. Le reste je laisse google faire comme il veux ?

Dois je revoir ma méthode d'accès à ces fiches ?

Merci d'avance pour vos réponses
 
Discussions similaires
Haut