Question générale sur l'URL rewriting et Googlebot

Discussion dans 'Référencement Google' créé par lambi521, 18 Juillet 2012.

  1. lambi521
    lambi521 WRInaute passionné
    Inscrit:
    15 Juin 2010
    Messages:
    1 476
    J'aime reçus:
    0
    Bonjour à tous,

    J'aurais besoin que vous m’éclaircissiez sur un aspect de l'URL rewriting face à Googlebot.

    Par exemple, j'ai une page qui s'appelle "fiche_produit.php".
    Pour un produit, la page est "fiche_produit.php?id_produit=100"
    Je fais de l'URL rewriting et l'URL devient "la-fiche-produit-du-produit-100.html"

    Mes questions sont :
    1) Quand Googlebot crawle "la-fiche-produit-du-produit-100.html", est-ce qu'il sait qu'il est sur "fiche_produit.php?id_produit=100" ?
    2) Si je bloque "fiche_produit.php" dans mon robots.txt, est-ce que Googlebot peut crawler et indexer "la-fiche-produit-du-produit-100.html" ?
    3) Si avant j'indexais toutes les URLs du type "fiche_produit.php?id_produit=100" et qu'ensuite je fais du rewriting et que toutes les URLs deviennent du type "la-fiche-produit-du-produit-100.html", est-ce je peux bloquer les URLs du type "fiche_produit.php?id_produit=100" ? Est-ce qu'il aura toujours accès aux URLs rewritées ?

    4) Autre chose: Avant le rewriting, j'avais dans mes URLs le paramètre GET "id_produit=100" par exemple. Une fois le rewriting mis en place, ce paramètre n'existe plus vraiment dans l'URL rewritée du type "la-fiche-produit-du-produit-100.html". DONC: Est-ce que dans GWT > Paramètres d'URLs, on peut dire de ne plus prendre en compte ce paramètre GET.

    Je vous demande ça car avant mes URLs était indéxées non rewritées mais désormais elle le sont, mais je ne sais pas trop ce que je peux ou ne peux pas bloquer pour Googlebot. Car il teste toujours d'anciennes URLs et me propose mes paramètres GET dans GWT bien qu'ils ne soient plus dans les URLs (enfin si mais pas les rewritées... ^^)

    J'espère être assez clair.. Merci pour votre aide :)
     
  2. nickargall
    nickargall WRInaute accro
    Inscrit:
    13 Juin 2005
    Messages:
    6 661
    J'aime reçus:
    4
    Bonjour

    Première chose, la mise en place de rééctriture d'URL sur un site déjà indexé n'est pas forcément une bonne idée.


    Ici, tu te poses beaucoup de question; la seule chose que tu aies à faire, est de mettre en place un système qui provoque la redirection 301 des "URL non réécrites" vers l'URL réécrite correspondant.

    En résumé,

    fiche_produit.php?id_produit=100 ==301==> la-fiche-produit-du-produit-100.html
    fiche_produit.php?id_produit=200 ==301==> la-fiche-produit-du-produit-200.html
    Etc.

    Ne fais rien d'autre que ça.
     
  3. lambi521
    lambi521 WRInaute passionné
    Inscrit:
    15 Juin 2010
    Messages:
    1 476
    J'aime reçus:
    0
    Les 301 sont faites depuis plus d'un an, rewriting dans .htaccess et 301 en PHP

    Ce que je voudrais c'est des réponses à mes questions pour bien comprendre le fonctionnement
     
  4. nickargall
    nickargall WRInaute accro
    Inscrit:
    13 Juin 2005
    Messages:
    6 661
    J'aime reçus:
    4
    1) Quand Googlebot crawle "la-fiche-produit-du-produit-100.html", est-ce qu'il sait qu'il est sur "fiche_produit.php?id_produit=100" ?

    ==> Non

    2) Si je bloque "fiche_produit.php" dans mon robots.txt, est-ce que Googlebot peut crawler et indexer "la-fiche-produit-du-produit-100.html" ?

    ==> Oui

    3) Si avant j'indexais toutes les URLs du type "fiche_produit.php?id_produit=100" et qu'ensuite je fais du rewriting et que toutes les URLs deviennent du type "la-fiche-produit-du-produit-100.html", est-ce je peux bloquer les URLs du type "fiche_produit.php?id_produit=100" ? Est-ce qu'il aura toujours accès aux URLs rewritées ?

    ==> Oui, mais mieux vaut rediriger en 301 que bloquer

    4) Autre chose: Avant le rewriting, j'avais dans mes URLs le paramètre GET "id_produit=100" par exemple. Une fois le rewriting mis en place, ce paramètre n'existe plus vraiment dans l'URL rewritée du type "la-fiche-produit-du-produit-100.html". DONC: Est-ce que dans GWT > Paramètres d'URLs, on peut dire de ne plus prendre en compte ce paramètre GET.

    ==> Oui, mais mieux vaut rediriger en 301 que bloquer
     
  5. oli004
    oli004 WRInaute passionné
    Inscrit:
    5 Janvier 2005
    Messages:
    1 643
    J'aime reçus:
    0
    Dès lors que les pages contenant des paramètres ne sont plus accessibles par googlebot du fait de l'U.R., il n'est plus nécessaire de restreindre des paramètres.
     
  6. lambi521
    lambi521 WRInaute passionné
    Inscrit:
    15 Juin 2010
    Messages:
    1 476
    J'aime reçus:
    0
    Merci pour vos réponses !

    Donc c'est bien ce que je pensais, on peut ne laisser que les URLs rewritées pour indexer les pages, merci !

    Concernant les 301, je sais que c'est mieux que de bloquer seulement Googlebot vient toujours tester mes URLs NON rewritées et me propose toujours les paramètres GET dans GWT donc je me demandais si je pouvais ENFIN virer tout ça sans risquer de désindexer mes URLs rewritées
     
Chargement...
Similar Threads - générale rewriting Googlebot Forum Date
Conditions générales de vente et devis Droit du web (juridique, fiscalité...) 30 Octobre 2015
Question SEO générale et page particulière Demandes d'avis et de conseils sur vos sites 4 Septembre 2015
Redirection spécifique, puis générale. URL Rewriting et .htaccess 1 Août 2013
Bouton twitter générale Twitter 20 Mai 2013
Question générales ADWORDS Débuter en référencement 26 Juillet 2012
Sogenactif, contrat VAD société générale... e-commerce 26 Novembre 2011
Modification des conditions generales pour les noms de domaine .be Noms de domaine et référencement 13 Mai 2011
Petites questions générales :) Débuter en référencement 21 Mars 2011
CultureQuizz: Quizz et Culture Générale, vos avis ? Demandes d'avis et de conseils sur vos sites 23 Février 2011
Plagiat des CGV (conditions générales de vente) Droit du web (juridique, fiscalité...) 31 Janvier 2011
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice