Redirection après rewriting ?

WRInaute discret
Bonjour à tous,

face a la relative complexité du rewriting de notre portail et le nombre d'url rewritées (mon .htaccess pese quand même 9Ko) je me pose la question de savoir si la redirection des anciennes urls vers les nouvelles en vaut vraiment la peine.

Il s'agit principalement du forum (+ de 500.000 messages) des articles et des annonces (~ 1000).

j'aimerais avoir vos avis.

merci

Cecile
 
WRInaute accro
Ben a quoi ça sert sinon ? de toute façon pour un forum ça va aussi vite s'il y a 2 messages ou 2.000.000 non ? :wink:
 
WRInaute discret
squawk a dit:
Ben a quoi ça sert sinon ?

quoi qui sert à quoi ? :? :?:

quant au nombre de sujet, en effet il n'y a pas de rapport direct avec les regles de rewriting (pour le forum, il doit y en avoir 5 ou 6) ... je l'ai précisé (inutilement ?) pour donner une idée de l'indexation (~ 200.000 pages indexées ... la moitié surement du forum).
 
WRInaute impliqué
ça dépend de ton url rewriting, mais c'est sur qu'une redirection auto est difficile, voir impossible (enfin jamais vu) si tu injectes le titre dans tes url.

Par contre, tu peux dire à google d'arreter d'explorer tes anciennes url en creant un jeu de regles qui les squizz dans ton robots.txt et en le soumettant à google ici : https://www.google.com/webmasters/remove ... lude_pages

(systeme de suppression auto : http://services.google.com:8882/urlcons ... tcmd=login)

Au moins, comme cela il arrettera te venir tester tes vielles url.

Donc, soit tu avais des url natures avant ton rewrite, et elles marchent encore, et donc, tu peux attendre un peu (mais pas trop) que google découvre quelques nouvelles url avant des les retirer, soit tu a changé de rewrite, les anciennes url ne marchent plus du tout et là bah je pense qu'il faut les exclure au plus vite.

De toutes façon, il va falloir que google redecouvre toutes tes pages, ce qui risque de prendre un peut de temps.

++
 
WRInaute discret
Donc, soit tu avais des url natures avant ton rewrite, et elles marchent encore, et donc, tu peux attendre un peu (mais pas trop) que google découvre quelques nouvelles url avant des les retirer
.

C'est mon cas justement.

En fait ce dont je me soucie, c'est le duplicate content, c'est la raison pour laquelle je pose la question.

Mais comment renvoyer les bots vers la bonne url

avant rewrite:
http://www.domain.tld/pages/viewtopic.php?topic_id=X&forum=Y

après rewrite:
http://www.domain.tld/topic-X-Y.html

j'aimerais que GG cesse de consulter ces vieilles urls :?
 
WRInaute impliqué
je viens de t'ecrire comment faire pour que justement google arrete d'explorer tes vielles url.

++
 
WRInaute discret
j'ai moi-meme répondu a ton message ;-)
je n'ai pas trouvé la réponse a ma question dans la premiere url, et la seconde ne fonctionne pas...

ma question reste en suspend ;-)
 
WRInaute impliqué
cecileB2K a dit:
j'aimerais que GG cesse de consulter ces vieilles urls :?

Si tu les retire de la liste que google prend en compte, il ne reviendra plus les visiter, c'est aussi simple que ça.
De plus comme tu n'avais pas d'url rewriting avant cela, je pense que tu dois pas être très bien indexé, du coup tu perdra pas grand chose pendant la transition (le temps que google reèexplore tes nouvelles urls.

Pour le deuxieme lien, il faut s'enregistrer pour avoir accès à l'outil, mais tout est expliquer dans le premier lien (page dans laquelle se trouve le deuxieme)

++
 
WRInaute discret
Si tu les retire de la liste que google prend en compte, il ne reviendra plus les visiter, c'est aussi simple que ça.
Simple ??!
Je ne suis pas sure d'avoir été très claire, car comment supprimer de l'index de Google près de 50.000 urls ?
D'autre part le but n'est pas de les supprimer, mais de lui dire - je répète - que aujourd'hui:
http://www.domain.tld/pages/viewtopic.p ... =X&forum=Y
vaut
http://www.domain.tld/topic-X-Y.html

Cela doit être possible sans passer par une "suppression" manuelle par les outils proposés par Google…non ?

De plus comme tu n'avais pas d'url rewriting avant cela, je pense que tu dois pas être très bien indexé, du coup tu perdra pas grand chose pendant la transition (le temps que google reèexplore tes nouvelles urls.)
Idée reçue.
A l'exception pour les urls disposant de plus de deux variables, et des gens qui intègrent le titre dans l'url (ce n'est pas notre cas, trop gourmand.) L'url-rewriting a de nombreux avantages et peut accessoirement favoriser l'indexation, mais croire qu'un site non url-rewrité sera moins bien indexé qu'un site rewrité, c'est faux et en tout cas complètement utopique.

Merci quand même dcz.w
 
WRInaute impliqué
cecileB2K a dit:
Si tu les retire de la liste que google prend en compte, il ne reviendra plus les visiter, c'est aussi simple que ça.
Simple ??!
Je ne suis pas sure d'avoir été très claire, car comment supprimer de l'index de Google près de 50.000 urls ?
D'autre part le but n'est pas de les supprimer, mais de lui dire - je répète - que aujourd'hui:
http://www.domain.tld/pages/viewtopic.p ... =X&forum=Y
vaut
http://www.domain.tld/topic-X-Y.html

1 : Robots.txt

User-agent: *
Disallow: /pages/viewtopic.php?

2 : soumission du robots.txt là ou je te l'ai dit

3 : deux trois jours plus tard, plus rien dans google (tes 50 000 pages).

cecileB2K a dit:
Cela doit être possible sans passer par une "suppression" manuelle par les outils proposés par Google…non ?

Oui, sur la même page, mais une à une c'est très long.


cecileB2K a dit:
De plus comme tu n'avais pas d'url rewriting avant cela, je pense que tu dois pas être très bien indexé, du coup tu perdra pas grand chose pendant la transition (le temps que google reèexplore tes nouvelles urls.)
Idée reçue.
A l'exception pour les urls disposant de plus de deux variables, et des gens qui intègrent le titre dans l'url (ce n'est pas notre cas, trop gourmand.) L'url-rewriting a de nombreux avantages et peut accessoirement favoriser l'indexation, mais croire qu'un site non url-rewrité sera moins bien indexé qu'un site rewrité, c'est faux et en tout cas complètement utopique.

Disons que si ta page d'acceuil possède un bon PR (au moins trois) google va indexer les url avec des variable, mais beaucoup plus lentement que si elle ne possedaient pas de variables.

En tous cas tu dois savoir ou tu en est avec le site dont tu parles sur ce sujet. Et si tu veux changer tes url, il faudra soit que tu fasse cela (suppressions des liens non réécrits de l'index de google, soit que tu trouve un moyen (je pense que c'est faisable) de rediriger les anciennes url vers les nouvelles, mais je pense que cela pomperait pas mal de ressources.
J'ai tout de même vue des sites n'être pratiquement pas indéxé avec des PR de 4 ou 5.


Et pour la gourmandise, en principe l'utilisation d'un .htaccess est pratiquement temps réel, après, cela dépend de comment sont construits tes liens dans ton site. Si tu utilises une fonction qui te permet d'injecter, par exemple le titre de chaque lien dans l'url, cela peut eventuellement ralentir un poil (ça dépend de la qualité du code aussi), mais si tu construis tes url directement dans le code php, à l'endroit ou ils sont fait (où le titre du lien est en général présent), cela change vraiment pas grand chose.

cecileB2K a dit:
Merci quand même dcz.

De rien ;)

++
 
Discussions similaires
Haut