indexation de pages avec une url page.aspx?id=valeur

Discussion dans 'Problèmes de référencement spécifiques à vos sites' créé par adabey, 4 Août 2003.

  1. adabey

    adabey Nouveau WRInaute

    Inscrit:
    14 Mai 2003
    Messages:
    3
    J'aime reçus:
    0
    Bonjour,

    des amis qui ont un site http://www.dvdcritiques.com/

    ont des pages du type page.aspx?id=valeur :
    exemple : http://www.dvdcritiques.com/critiques/dvd_visu.aspx?id=875
    et ils ont beaucoup de mal à les indexer chez Google.

    J´ai lu quelque part dans un forum que les paramètres des url dynamiques nommés "id" posaient problème car associés à des ouvertures de session.

    Comme d´autres pages sans paramètre ont été indexées (en aspx et sans paramètre) je suppose que le problème provient du nom du paramètre.

    Si quelqu´un peut aporter quelques argument à ces hypothèses.
    En attendant, ils vont changer le nom id en autre chose pour voir si GG fait bel et bien une allergie aux ids.

    Merçi d´avance.
     
  2. iconso

    iconso WRInaute occasionnel

    Inscrit:
    8 Avril 2003
    Messages:
    445
    J'aime reçus:
    0
    J'avais quelques pages qui trainaient sur un ancien site avec des pages du genre actu.asp?id=XXX
    Google ne les indexaient pas (il ne les crawl meme pas), et depuis que ces pages ont été changées en actu.asp?news=XXX (actu.asp?newsid=XXX est OK aussi, testé sur un autre site) Google les a dévorées en qq jours et indexées. Donc oui a priori les deux paramètres à proscrire sont "id" et "sid".

    Le principal argument pour ne pas indexer les pages contenant le paramètre id ou sid : puisqu'il s'agit la plupart du temps d'un identifiant de session, Google indexerait X fois la meme page. Gachis de temps, de bande passante, des pages a filtrer dans l'index parce que duplicate content, en voila assez je pense :)

    Fred
     
  3. iconso

    iconso WRInaute occasionnel

    Inscrit:
    8 Avril 2003
    Messages:
    445
    J'aime reçus:
    0
    Et si tu veux un cas un peu plus concret sur ce qui pourrait arriver si Google indexait ce genre de pages : Il y a quelques années pour remédier aux pb des proxies peu respectueux (ils ne respectaient pas le "expire" et conservaient les pages en cache), j'avais créé des pages genre

    page.asp?anticache=<%=Date et heure%>

    Le problème : google pensaient trouver une nouvelle page a chaque visite ! Donc au bout de 2 ans, pour récupérer une seule et meme page il passait environ une centaine de fois genre :

    page.asp?anticache=13/10/2001:12:32:00
    page.asp?anticache=02/06/2002:16:21:45
    etc...

    Tout ca pour une seule page, qui était finalement indexée une seule fois dans l'index (les autres étaient présentes mais il éliminait le cache). Meme si l'utilisation de cette méthode n'était pas dans un but de spamdexing, google ne peut pas le savoir, mais pour autant n'a jamais pénalisé cette page pour duplicate content a priori.

    Fred
     
  4. BZHcool

    BZHcool WRInaute discret

    Inscrit:
    18 Avril 2003
    Messages:
    176
    J'aime reçus:
    0
    Salut adabey,

    Je te confirme que GG ne prend pas en compte "id="

    Je viens de modifier les scripts de mes pages PHP pour non plus "id=" mais "val=", et là aucun problème il les a repérées tout de suite...

    Sinon, si ton hébergeur accepte l'Url Rewriting... celà peut etre la solution au problème.
     
  5. adabey

    adabey Nouveau WRInaute

    Inscrit:
    14 Mai 2003
    Messages:
    3
    J'aime reçus:
    0
    Ok !

    Je crois que le changement de nom sera fait !
    Pour l'url_rewriting je leur soumet la suggestion. C'est vrai que ça simplifie
    l'affaire.

    Merçi de ces réponses précises.
     
  6. Anonymous

    Anonymous Guest

  7. BZHcool

    BZHcool WRInaute discret

    Inscrit:
    18 Avril 2003
    Messages:
    176
    J'aime reçus:
    0
    Salut petit ours,

    Regarde bien... ce n'est pas id= mais content_id=xxx

    Et c'est bien là, la différence... Car effectivement tu peux aussi trouver cat_id= ou bien d'autres mais dans ce cas id est rattaché a autre chose.... donc GG suit pas l'Url.