Il ne faut pas utiliser l'URL Rewriting. C'est mal.

WRInaute accro
Il n'en reste pas moins l'avantage de l'anchor text dans les liens que font les sites vers le notre. Même si Google arrive à se servir des url non rewrité.
 
WRInaute passionné
Et bien moi, je continue sans aucune hésitation mes rewritings.
Il suffit de faire des rewritings logiques. (et aps avec des caractere pourris dedans, genre des slashs)
 
WRInaute occasionnel
Disons plutôt que ça les emmerde de pas pouvoir faire la distinction entre un site entièrement statique et un dynamique.
 
WRInaute occasionnel
Ca depend comment tu fais ton url rewriting, c'est sur que si le resultat est aussi moche que l'original, ne pas rewriter c'est le mieux :)
Si c'est pour passer de mondomaine.com/script.php?id=454&categorie=3&prout=6 à mondomaine.com/454/3/6 autant rien faire!
Mais un simple mondomaine.com/mots-cles-454.html la ok.
Il faut s'assurer que le script retrouve les elements un peu inutiles style la categorie et prout qui peuvent etre retrouvés a partir de l'id.
 
WRInaute accro
Il est marrant, GG :)
Si on doit utiliser l'URL-rewriting, c'est parce qu'il n'est pas fichu de traiter correctement les URL natives, pas oublier ça.
C'est seulement ensuite qu'on s'est dit "Oh bin ce serait chouette de rewriter pour simuler tout au root avec des URL courts compréhensibles de bout en bout par l'internaute et qui lui parlent avec les bons mots qui nous intéressent".
Mais GG veut pouvoir situer l'emplacement exact de chaque ressource, ce qui est l'essence même de l'URL : Unique resource locator.
Or, une page dynamique n'a pas de réelle existence, elle est créée au moment de la requête. Son URL est donc du pur virtuel : moteur cassé, y a plus de page et l'index de GG est dans les choux.
Un jour, devant l'accroissement monstrueux du nombre des pages dynamiques, GG risque de conserver en index les seules pages en dur, permanentes :)
Continuons à simuler : il est incapable de s'en rendre compte.
 
Nouveau WRInaute
du vent !

Hello, oui j'avoue que comme tout le monde j'ai été tres surpris par cet article, mais je suis d'accord pour dire que c'est des conneries liées au fait que GG ne gère pas correctement l'indexation des url complexes. J'utilise comme tout le monde des systèmes tels que Wordpress, ou via des framework style CodeIgniter et l'url rewriting y proporement fait. D'ailleurs il ne faut pas oublier que le relation entre l'anchor texte, les mots clé passés dans l'url, et le texte de la page de destination (notamment le H1) crée un niveau de qualité qui aura une influence sur la note global du lien et qui donc considere le lien comme intéressant ou non. Alors a priori garder l'url rewriting est plutot une bonne chose, en tout cas, quel revirement de point de vue de la part de google !
 
WRInaute accro
Salut,
En fait de ce que j'en comprend Google nous dit de ne pas réécrire pour réécrire mais de le faire intelligemment, rappelant ce faisant que les seules URL dynamiques qui lui posent problème sont celles qui comprennent des sessions et que si il sait que sid c'est généralement la variable de session il comprend plus rien quand l'URL est réécrite et qu'il merde alors lamentablement.
@+
 
WRInaute impliqué
On dirait que GG veut punir les sites sur-optimisé
Maintenant jusqu'à zappé les rewritings c'est chaud.

Quesque je vais vendre maintenant au client ??
Des sites non optimisés, comment vont ils le prendre.
 
WRInaute accro
Ce qui doit faire encore plus ch* Google, ce sont les rewritings mal ficelés, qui ne sont qu'une injection de mots-clés.

Avec toutes les reprises de contenu (flux RSS parsés à gauche / à droite), il doit y avoir des milliards d'erreurs (urls tronqués, caractères mal convertis, etc...) qui font que Google se retrouve avec des tonnes de contenus dupliqués (tiens... encore du duplicate content ?), parceque tout ce qui compte dans ces URL-rewritings "légers", c'est la clé qui correspond à l'enregistrement en db.

Exemple: http://www.moteurs-news.com/blog/index. ... -sur-toi... (sorry :oops:)

C'est pas sa faute hein... c'est le script de base qui n'est pas pensé pour.

Le cas n'est pas possible ici: http://annuaire.indexweb.info/2652/vive ... at-3D.html

--> c'est toujours un URL rewriting "inutile" (bête injection de keywords), mais au moins il n'y a aucun risque de duplication.

Pour WP, il existe le plugin "Permalink Redirect". DC doit certainement avoir un équivalent.
Le mod phpBB-SEO avancé fait les redirection aussi: http://www.phpbb-seo.com
 
WRInaute accro
Oh le cochon... Il a mis une 301 dessus :mrgreen:
Ils vont plus rien comprendre ;)


Précisons donc pour les néophytes que, à l'origine, en cliquant sur le lien suivant: -http://www.moteurs-news.com/blog/index.php/2008/09/23/192-desole-Monty-ca-tombe-sur-toi... on avait le contenu du billet "192" (Il ne faut plus réécrire les URLs. Dixit Google), sur la page "/192-desole-Monty-ca-tombe-sur-toi...": ce qui constituait un doublon à 100% avec le contenu original ;)
 
WRInaute passionné
En même temps si ça peut participer à calmer les gens qui voient dans la réécriture la solution miracle...

De plus si dans le futur GG développe une méthode pour interroger directement les BDD en entrant des paramètres dans les URLs, les URLs pseudostatiques seront désavantagée (pure prospective)
 
WRInaute passionné
je suis d'accord avec HawkEye : il faut bien vérifier qu'il n'y a qu'une url accessible pour un contenu donné.

il va bientôt falloir demander à GG avant d'aller pisser :lol:
 
WRInaute accro
French Dread a dit:
En même temps si ça peut participer à calmer les gens qui voient dans la réécriture la solution miracle...

De plus si dans le futur GG développe une méthode pour interroger directement les BDD en entrant des paramètres dans les URLs, les URLs pseudostatiques seront désavantagée (pure prospective)

Je ne sais pas si Google s'amusera à jouer à l'apprenti sorcier à ce niveau là. Mais je suis totalement d'accord avec toi, si celà peut calmer la mode qui veut que le tout réécrit soit la panacée du référencement .. les référenceurs en herbe vont gagner du temps et économiser de l'aspirine en ne s'astreignant plus à mettre coûte que coûte de la réécriture d'URL tous azimuts, en étant persuadés qu'il s'agit de l'optimisation ultime qui leur apportera une visibilité imbattable
 
WRInaute passionné
L'article condamne l'utilisation de l'URL pour donner une apparence statique à un lien dynamique. Entendons par là un lien dont l'URL varie.

Il ne s'agit pas, si j'ai bien compris, de condamner l'URL rewritting pour créer des permalinks avec un texte significatif.
 
WRInaute accro
De toute manière...

je fais de l'url-rewriting, essentiellement car les noms des variables GET prendraient de l'espace en plus, qui allongerait la longueur des urls ( qui sont assez longues ). C'est même arrivé avant l'url-rewriting, que je me chope des internal errors du serveur, pour cause de longueur trop grande d'urls. Il y a quelques années... ;)

Le problème du contenu unique ne me concerne pas, je n'ai pas de variable de session transmise par les urls.

D'autre part, deux urls différentes ( rewritées ), mèneront toujours à des contenus différents.

Ne serais-je pas concerné par ce que dit Google ? ;(

Il est vrai, que cet url-rewriting, entraîne une augmentation très forte du nombre d'urls différentes à crawler... Celà est-il le problème principal de Google ? Espérons que non.

Bien à vous.

Amicalement.

Jean-François Ortolo
 
WRInaute accro
Moi, j'dis juste que si GG communique, c'est que c'est un soucis pour lui, sinon, aucun intérêt de prévenir les webmasteur peu scrupuleux.

Donc...


On s'en cogne.
 
Nouveau WRInaute
Monty973 a dit:

Faites ce que je dis et non pas ce que je fais, à la lecture de l'url, je pense qu'il s'agit d'Url rewriting.

Je suis assez d'accord avec moktoipas, si le rewriting est logique et que l'on en abuse pas pour passer en force des mots clés.

Même sans rien capter à l'url rewriting, en ne jetant qu'un coup d'oeil rapide à Wordpress, on s'aperçoit que l'on peut pousser le bouchon très loin, en incluant la catégorie, les tags...

Toujours le même problème, à partir de quel moment on sur-optimise une page ?
 
WRInaute accro
b1mou100 a dit:
http://googlewebmastercentral.blogspot.com/2008/09/dynamic-urls-vs-static-urls.html

Faites ce que je dis et non pas ce que je fais, à la lecture de l'url, je pense qu'il s'agit d'Url rewriting.

C'est de l'url rewriting, mais disons "au premier degré": le "slug" dynamic-urls-vs-static-urls est ici la clé unique (l'équivalent du "192" de Monty à la page précédente ;) ).
 
WRInaute accro
c'est plutôt pour éviter les www.example.com/mondossier/mondossier/m ... ier/lapage car on a oublié de mettre un / avant le mondossier ce qui fait que ça boucle indéfiniment.
Et on en trouve de telles réécritures. Et c'est ça qui gène gg
en plus, ça n'est pas dur de voir si les règles sont bonnes pour gg : il lui suffit de tester avec un nonexists8888888.htm à la fin et de voir si on a bien un 404 :wink:
 
WRInaute discret
mouais je suis d'accord, le rewriting c'est plus pour l'utilisateur que pour le robot ... Et inversement :D

mais je préfère ca :
-http://www.cluborter.com/fiches/club/ac-ajaccio/
-http://www.cluborter.com/fiches/joueur/james-fanchone/

Qu'un truc à la con genre
-http://www.cluborter.com/index.php?section=5&type=2&id=15647


De toute façon dans 6 mois ils vont dire le contraire...

Le dialogue sur les image m'a fait rire aussi...
le mec dis clairement qu'il n'y a aucun soucis pour qu'on ai un picture.php?id=324... je renvois au post de'olivier sur le ref d'image. Clairement, le nom de l'image influe enormément, et c'est bien normal !
 
WRInaute impliqué
Je pense que les algos de google savent maintenant utiliser le fait que l'ordre des paramètres n'a aucune importance en général.

Donc il savent reconnaitre que foo?key1=value1&key2=value2 a le même contenu que foo?key2=value2&key1=value1 a priori. Ca leur permet d'économiser beaucoup de place dans leur index.

Par contre il n'ont aucun moyen de savoir que foo-value1-value2.htm et foo-value2-value1.htm sont les mêmes...

Bref, ils sont devenus un peu plus subtils, et veulent en profiter.

Ce n'est qu'une hypothèse, mais elle me parait très plausible après avoir lu l'article sur leur blog.
 
WRInaute impliqué
google

difficile de sortir des informations pertinentes sur les blogs de google.
Il y a peu de temps ils annonçaient que les rss ne servaient a rien pour le referencement et
au final ils les crawl toutes les 20 minutes...
 
WRInaute discret
Ce qui m'étonne c'est que personne ne parle de sécurité ?

Il semblerait que des url rewritées soient plus sûres ?

vrai ? faux ?
 
WRInaute impliqué
c'est cool comme news, on va perdre moins de temps en bricolage comme ça, et se concentrer sur le principal:

l'utilité d'un site.
 
Nouveau WRInaute
Bonjour,

Alors voilà, je vends des produits que l'on peut retrouver dans plusieur catégorie différentes:
ex:/mapremière-souscat/monproduit
/madeuxieme-cat/monproduit ,

Pour eviter le duplicata content, je mets des redirection 301 sur touts les prouits multicatégorique non associés à la première sous catégorie, ainsi /madeuxieme-cat/monproduit sera redirigé vers /mapremière-souscat/monproduit

Ceci creer donc beaucoups de redirection, est-ce grave ?

Faudrai-t-il mieu directement associer les urls à la première souscatégorie associée ?

Cela baisse t-il le référenncement ? ou les url redirigées ne sont de toute manière pas pris en considération ?


MERCI
 
WRInaute impliqué
Audiofeeline a dit:
Je rêve, ils sont pas foutu de faire un truc qui arrive à indexer les urls complexes...

C'est l'inverse il me semble. Maintenant ils savent prendre en compte les paramètres intelligement, enfin c'est ce qu'ils disent.

Mais bon, si quelqu'un pense mieux faire, il faut se lancer dans la réalisation d'un autre moteur de recherche!
 
WRInaute discret
Vap a dit:
foo?key1=value1&key2=value2 a le même contenu que foo?key2=value2&key1=value1 a priori.
ok car tu déclares quelle valeur est attribuée à quelle variables (&var=value)
Vap a dit:
Par contre il n'ont aucun moyen de savoir que foo-value1-value2.htm et foo-value2-value1.htm sont les mêmes....
non elles sont pas les mêmes car ton url rewriting prends les paramètres dans un ordre précis et un seul! ton exemple ne marche pas. (sauf dans le cas de recherche sur deux mots-clefs)

si je fais avec un url-rewrite

RewriteRule ^([A-Za-z0-9]+)[/_]([A-Za-z0-9]+)[/_][^/]*\.(html|htm|php|asp)$ /index.php?LNG=$1&ARTICLE=$2 [QSA,L]
et lance

domiane.com/FR/122/page.htm
domiane.com/122/FR/page.htm

je vais pas avoir la page 122 en français dans les deux cas :)

(je sais que je peux peaufiner ma regle
RewriteRule ^([A-Za-z]{2})[/_]([0-9]{3,9})[/_][^/]*\.(html|htm|php|asp)$ /index.php?LNG=$1&ARTICLE=$2 [QSA,L]
RewriteRule ^([0-9]{3,9})[/_]([A-Za-z]{2})[/_][^/]*\.(html|htm|php|asp)$ /index.php?LNG=$2&ARTICLE=$1 [QSA,L]
mais seulement sur des cas précis, ici car je sais que la langue c'est [A-Za-z]{2} et lid de l'article [0-9]{3,9}
mais essaie sur le nom de catégorie et le nom de marque d'un produit. les deux sont en [a-zA-Z0-9]+
)

si GG n'aime pas l'url-rewriting c'est qu'il permet de réécrire autant de fois que voulu les url d'une même page, il ne peut pas deviner que mondomaine.com/ART/FR/1222/mon-titre.htm est la même que mondomaine.com/index.php?ART=1222 ou mondomaine.com/1222/index.php ou mondomaine.com/ART/FR/1222/le-mec-qui-fait-un-lien-se-gourre-dans-l-extension.php

il va voir 4 pages à indexer (même si je lui précise par un 301 que seule la page mondomaine.com/ART/FR/1222/mon-titre.htm est la bonne)
il perd du temps

et encore je parle d'un site qui est sympas... je peux aussi m'amuser à faire du spam par url-rewriting!

mais perso je #### GG. Moi je développe pour mon business et mes internautes, je développe pas gratos pour que GG se fasse du fric en économisant du temps.

GG veut que l'on arrête les url-rewriting? il donne quoi en échange. Moi si je veux la première place sur GG je lui donne de l'argent!
 
WRInaute impliqué
@jfcontart

Mon exemple est trop caricatural, je l'admet, mais tu semble quand même d'accord que si les paramètres sont gardés, alors GG peut reconnaitre des contenus identiques alros qu'il ne le peut pas sinon.

jfcontart a dit:
si GG n'aime pas l'url-rewriting c'est qu'il permet de réécrire autant de fois que voulu les url d'une même page, il ne peut pas deviner que mondomaine.com/ART/FR/1222/mon-titre.htm est la même que mondomaine.com/index.php?ART=1222 ou mondomaine.com/1222/index.php ou mondomaine.com/ART/FR/1222/le-mec-qui-fait-un-lien-se-gourre-dans-l-extension.php

il va voir 4 pages à indexer (même si je lui précise par un 301 que seule la page mondomaine.com/ART/FR/1222/mon-titre.htm est la bonne)
il perd du temps

Il perd du temps, mais il n'a pas besoin d'indexer les 4 pages, seule la page obtenue après redirection est indexée. Fais le test tu verras.

Sinon, je suis d'accord avec ta conclusion. Si on fait de la réécriture, c'est pour les visiteurs en général, pas pour GG.
 
WRInaute discret
Vap a dit:
Il perd du temps, mais il n'a pas besoin d'indexer les 4 pages, seule la page obtenue après redirection est indexée. Fais le test tu verras.

oui oui je suis d'accord, je me suis mal exprimé. C'était le sens de ma redirection 301: je force google à comprendre qu'il doit pas perdre son temps et considérer seulement un certain url. J'évite aussi le duplicate-content :)
 
WRInaute discret
HawkEye a dit:
Oh le cochon... Il a mis une 301 dessus :mrgreen:
Ils vont plus rien comprendre ;)


Précisons donc pour les néophytes que, à l'origine, en cliquant sur le lien suivant: -http://www.moteurs-news.com/blog/index.php/2008/09/23/192-desole-Monty-ca-tombe-sur-toi... on avait le contenu du billet "192" (Il ne faut plus réécrire les URLs. Dixit Google), sur la page "/192-desole-Monty-ca-tombe-sur-toi...": ce qui constituait un doublon à 100% avec le contenu original ;)

Salut,

Je n'ai pas tout à fait compris ton texte ?
Peux-tu préciser stp ?

Ce que je ne comprends c'est que, en rajoutant l'ID de l'article dans l'url rewriting normalement c'est bon pour ne plus faire de duplicate n'est-ce-pas ?

MErci d'avance de tes éclaircissement
 
WRInaute discret
faire du rerewriting pour faire du rewriting n'a pas d'interet
mais par contre du rewriting pour des outils comme wordpress jooomla drupal etc
est essentiel et ces outils font du bon travail avec des URls pertinentes


je trouve que google va loin un peu trop loin l'allusion "je peux aller pisser"
n'est pas totalement infondé
n'oublions pas qu'ils ne sont qu'un acteur de l'internet
et de plus en plus Googe donne des conseils comment faire ceci comment faire cela ...

je pense que ces conseils servent surtout leurs intérêts et le fonctionnement de leurs moteurs de recherche
 
WRInaute passionné
Le retour du serpent de mer !

Je rappele à tous les webmasters qu'il est trés facile de faire en sorte qu'il soit impossible de savoir de l'exterieur si votre site est statique , dynamique, si il utilise apache ou autre, si il utilise php, ruby, perl ou autre, etc ... etc ...

Il est même possible de faire croire que l'on est en php 7 sous IIS alors que l'on utilise perl avec apache :wink:

En plus, il est précisé "A static URL is one that does not change" c'est à dire que Google considére comme statique une URL qui reste la même au fil du temps même si elle est rewritée.
 
WRInaute discret
fandecine a dit:
Je rappele à tous les webmasters qu'il est trés facile de faire en sorte qu'il soit impossible de savoir de l'exterieur si votre site est statique , dynamique, si il utilise apache ou autre

déjà au minimum rien que 2 trucs à faire pour être plus discrets (en plus du urlrewriting)

Apache envoie une bannière descriptive de la configuration du serveur dans le header. Il est possible de désactiver cela en modifiant les deux directives suivantes:
ServerSignature Off
ServerTokens Prod

Par défaut, PHP est configure pour envoyer un en-tête HTTP appelé X-Powered-By. Pour supprimer ce header, il suffit de modifier l'option expose_php dans le fichier php.ini:
expose_php = off
 
WRInaute impliqué
jfcontart a dit:
fandecine a dit:
Je rappele à tous les webmasters qu'il est trés facile de faire en sorte qu'il soit impossible de savoir de l'exterieur si votre site est statique , dynamique, si il utilise apache ou autre

déjà au minimum rien que 2 trucs à faire pour être plus discrets (en plus du urlrewriting)

Apache envoie une bannière descriptive de la configuration du serveur dans le header. Il est possible de désactiver cela en modifiant les deux directives suivantes:
ServerSignature Off
ServerTokens Prod

Par défaut, PHP est configure pour envoyer un en-tête HTTP appelé X-Powered-By. Pour supprimer ce header, il suffit de modifier l'option expose_php dans le fichier php.ini:
expose_php = off

Merci pour l'info.

ServerTokens ne peut pas etre utilisée dans un .htaccess malheureusement. IL faut avoir un dédié pour s'en servir.
 
WRInaute accro
webmasterlamogere a dit:
bernie07 a dit:
Ce qui m'étonne c'est que personne ne parle de sécurité ?

Il semblerait que des url rewritées soient plus sûres ?

vrai ? faux ?
oui car ca masque le script et les paramètres.
non pour les CMS largement diffusées.

Salut,
A noter sur ce point que ça permet également, et surtout amha, au niveau sécurité d'éviter certaines injections, en effet suivant la règle utilisée on peut limiter la réécriture aux cas où la variable contient uniquement des chiffres, si en lieu et place de la variable numérique (exemple article-288.html) on tente d'indiquer une URL (exemple article-http://spam.ru/malware.exe.html) apache renverra une erreur 404 sans appel au script PHP (par exemple) et donc sans interaction avec l'URL passée en variable.
Ce qui fait que sans erreur SQL (par exemple) on ne trouvera effectivement pas de suite le vrai nom de la variable et on évite donc du coup que le vilain passe par article.php?id=
@+
 
Nouveau WRInaute
je pense que le titre doit présenter le contenu brièvement le contenu c'est tout, google cherche a éviter les mots clés sans rapport avec le contenu qui perturbent les chercheurs
 
Discussions similaires
Haut