De l'Url rewriting pénalisante?

Nouveau WRInaute
Bonjour

Et pardonnez moi si la réponse se trouve dans un des forums, j'ai cherché mais n'ai pas trouvé :P

Voilà le binz: J'ai fait de l'url rewriting sur un site, j'avais des types de pages à 1 variable (du type page.php3?parm1=1) et d'autres totalement différents à 2 (du type monautrepage.php3?param2=2&param3=3) .

Pour les premiers, jai collé de l'extension .html, et j'ai appelé les deuxièmes en .shtml, pourquoi me direz-vous? je javais pas comment les appeller pour qu'elles restent en html et parfois on a envie de tester un peu tout.

Ce n'était pas une très bonne idée, le site était bien placé sur certains mots clés et il a disparu du coup, pourtant si je recherche des keywords sur le site avec google, les pages sont encore indexées.... les anciennes en php3, et le nouvel index en php , les nouvelles en réécriture HTML ont été ignorées.... Le PR est lui à 0 sauf la page d'accueil en php qui est à 5... bref, j'en conclus que j'ai pris une pénalité, mais j'ai du mal à comprendre pourquoi, vu que les anciennes pages n'étaient plus accessibles et traçaient sur l'index en 404 (car j'avais renommé les .php3 rewrités aussi pour éviter les doublons, il y a avait cependant le doublon page.php3/shtml et aussi monautrepage.php3/shtml- est-ce cela qu'il a condamné).

Bref, ce truc m'a l'air bien compliqué, j'ai quand même du mal à cerner ce que google n'a pas aimé... Trop de nouveauté et peut-être... des pages trop optimisées?

Merci de votre aide, si vous le pouvez, j'avoue que je n'y comprends pas grand chose sur ce coup.
 
WRInaute discret
La migration d'un site vers l'UR est toujours delicate parce qu'on ne peut pas dire du jour au lendemain a Google d'oublier les anciennes url et de les remplacer par les nouvelles... Le seule raison de faire cette migration est a mon sens de remedier a l'inindexabilite des pages avec de nombreux parametres, ce qui manifestement n'est pas ton cas !!! :-(

Il y a une periode pendant laquelle Google connait les 2 url d'une meme page et il n'aime pas ca... Il fait donc un choix (pas celui que tu souhaiterais en general), personnellement je pense que le PR et les BL sont un bons critere pour effectuer ce choix... Il faut donc lui laisser le temps d'integrer la nouvelle topologie de ton site...

Ca c'est la maniere douce... la maniere forte c'est d'utiliser entre autre le fichier robots.txt pour interdire a google d'indexer (ou de les renommer ce qui revient au meme)les anciens fichiers... Mais en general, avec cette methode, les anciennes pages disparaissent beaucoup plus vite que les nouvelles n'apparaissent dans l'index :-(
La perte dans les premiers temps est terrible :-( et le gain difficile a prouver...

Autant la maniere douce peut passer dans tous les cas, mais la maniere forte n'est a reserver qu'aux pages non indexees et/ou non indexables par Google...

Quand a eu lieu la migration vers l'UR ? Googlebot est-il passe depuis sur les pages ?

Olivier,

PS: J'ai pas compris ton histoire d'extension html vs shtml... Donne ton url pour qu'on fasse une analyse plus poussee
 
Nouveau WRInaute
En fait il y avait des pages du type:

page.php3?parm1=1 ...

...que j'ai transformées en 1.html par exemple

et d'autres totalement différentes du type:

monautrepage.php3?param2=2&m3=3 ...

.....que j'ai transformées en 2-3.shtml par exemple

(car sinon 2-3.html aurait affiché page.php3?parm1=2-3 ce qui créait des conflits)

Je pense que ton analyse, Olivier, est la bonne, car même sans rewriting, certaines pages d'un autre site qui avaient simplement changé de répertoire tout en restant un peu similaires sont restées ignorées plusieurs mois.

Cette fois la bêtise est que j'ai aussi changé l'index.

Dans l'abslou, mieux vaut faire de l'url rewriting sur un site tout neuf, ou alors pour permettre l'indexation de pages non indexées à + de 2 paramètres... ça me parait plus difficile quand il s'agit d'optimiser encore + des pages déjà bien indexées avec 1 ou 2 variables en php.

Par contre, pour ce qui est des extensions shtml, j'ai à nouveau fait des modifs en jouant sur les extensions .HTM et .HTML pour éviter les conflits décrits + hauts. je pense pas que ce soit le fait de nommer des extensions ssl (shtml) - pour des pages sans ssl justement - qui pose problème ... mais on ne sait jamais.

J'ai remis l'index.html de base à la racine et les urls rewritées dans un nouveau répertoire (certains répertoires sont encore très bien indexés en fait c'est l'index à la racine qui avait (a) disparu après renommage en index.php et rewriting du reste).

On verra ce que ça donne, c'était un test de toute façon... je vous tiens au courant.
 
Nouveau WRInaute
Qaghan a dit:
Ca c'est la maniere douce... la maniere forte c'est d'utiliser entre autre le fichier robots.txt pour interdire a google d'indexer (ou de les renommer ce qui revient au meme)les anciens fichiers...

Mais en general, avec cette methode, les anciennes pages disparaissent beaucoup plus vite que les nouvelles n'apparaissent dans l'index :-( La perte dans les premiers temps est terrible :-( et le gain difficile a prouver...

Autant la maniere douce peut passer dans tous les cas, mais la maniere forte n'est a reserver qu'aux pages non indexees et/ou non indexables par Google...

Quand a eu lieu la migration vers l'UR ? Googlebot est-il passe depuis sur les pages ?

>>>>> a titre informatif, aurais-tu la ligne de code adéquate pour le robots.txt dans ce cas? Je ne saurais quoi mettre.

>>>> Migration: fin de semaine dernière (apparemment il y a eu une dance en + ce w-e...)

>>>> Pour googlebot, je ne sais pas, je n'utilise pas ça.... en fait j'avais jamis cherché jusqu'à présent à faire de l'UR, ou utiliser les robots.txt.
 
WRInaute discret
PeterKitsch a dit:
>>>>> a titre informatif, aurais-tu la ligne de code adéquate pour le robots.txt dans ce cas? Je ne saurais quoi mettre

Je me suis peut-etre un peu trop avance... je viens de voir que le robots.txt ne permet de specifier que des repertoires...

Je te recommande de consulter la FAQ de WRI a ce sujet : https://www.webrankinfo.com/dossiers/indexation/20-ans-robots-txt

>>>> Migration: fin de semaine dernière (apparemment il y a eu une dance en + ce w-e...)

Un peu de patience... Je sais que Google s'amerliore en ce moment mais il ne faut pas etre trop exigeant quand meme... Il y a moins de 6 mois, il fallait compter 1 a 2 mois pour que ce genre de modifications soient prises en compte...

La dance de ce WE est, pour moi, un mystere qu'il reste encore a elucider... Mais quoiqu'il en soit il faut laisser le temps aux robots de Google de parcourir la nouvelle structure de ton site pour mettre a jour son index...

>>>> Pour googlebot, je ne sais pas, je n'utilise pas ça.... en fait j'avais jamis cherché jusqu'à présent à faire de l'UR, ou utiliser les robots.txt.

Googlebot c'est le nom donne aux robots de Google, tu confonds avec googlestat (ou robostat) l'outil developpe par WRI pour recenser le passage des robots sur un site... c'est plus pratique mais il suffit que tu aies acces a tes logs pour etre capable de determiner si les robots de googlebots sont passe sur ton site depuis ta modification... S'ils ne sont pas encore passes, je n'ai rien d'autre a te dire que ... patience. Une fois qu'ils seront passes la mise a jour de l'index est rapide (moins d'une semaine en general)

Olivier,
 
WRInaute impliqué
>>>>> a titre informatif, aurais-tu la ligne de code adéquate pour le robots.txt dans ce cas? Je ne saurais quoi mettre
Je me suis peut-etre un peu trop avance... je viens de voir que le robots.txt ne permet de specifier que des repertoires...
Ah bon, c'est nouveau ça ? :wink:

Il me semble que tu peux nommer les fichiers uns à uns. Pour ma part, suite à un url rewriting complet, j'interdit aux robots d'indexer ma page index.php (avec tous les paramètres possibles).

Syntaxe:
User-agent: *
Disallow: index.php

Pour l'instant, ça a l'air de fonctionner même si c'est assez lent,
Loïc.
 
WRInaute discret
Et tant qu'a faire, placer un redirect qui renvoie un code HTTP (301 ou 302) des anciennes URL vers les nouvelles.

Ca te permettra de ne pas avoir le pb des 404 pour les internautes qui viennent de Google, et de garder ton positionnement et ton PR.

A Bien'tot.
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut