URL rewriting=Spam ??

  • Auteur de la discussion Auteur de la discussion lou-ve
  • Date de début Date de début
WRInaute discret
Salut
J'ai entendu une rumeur qui dit qu'à terme, l'URL rewriting serait considéré comme du spam par Google.

Vrai ou faux ?
 
WRInaute discret
Salut,

Oui, peut-être à terme dans le sens où si tu as une page :

-http://www.example.com/page.php?variable=valeur

indexée dans google et que du jour au lendemain tu la rewrites en :

-http://www.example.com/page/variable/valeur.htm

elle aura le même contenu et sera peut-être considérée comme un double de la précédente.

C'est pourquoi il faut faire des redirections 301 de tes anciennes pages vers les nouvelles.

Je pense que d'autres t'expliqueront plus en détails ce phénomène, je ne peux que te dire ce que je sais (enfin, ce que je crois savoir ;)).

A+

Doug
 
WRInaute accro
oui, rien de nouveau. si deux page sont duppliquées, alors les moteurs en virent (au moins) une. Comme la tehnique de l´UR permet de donner une URL "simplifiée" à une page qui dispose déja d´une URL qui lui est propre, alors on peut estimer qu´il y a SPAM si ces deux pages restent indexées parallelement. D´ou l´importance de la redirection ou de rewritter les pages avant leur indexation initiale.
 
WRInaute discret
C'est pas de ça dont je parle.
Ce que j'ai entendu c'est que Google fait de gros efforts pour mieux référencer les codes genre php et qu'il vaudra mieux à l'avenir ne pas les rewriter pour être bien considéré
 
Olivier Duffez (admin)
Membre du personnel
lou-ve, personne ne peut savoir si une page est "rewritée" ou pas.
même pas Google avec des milliards de $

;-)
 
WRInaute impliqué
WebRankInfo a dit:
lou-ve, personne ne peut savoir si une page est "rewritée" ou pas.
même pas Google avec des milliards de $
;-)

tu penses vraiment que google avec ses milliards de $ ne peut pas savoir que :
-https://www.webrankinfo.com/forum/viewtopic_29661.htm
=
-https://www.webrankinfo.com/forum/viewtopic.php?topic=29661

si il en avait réellement envie ?
:wink:
 
WRInaute accro
Bonjour,

J'ai déjà lu plusieurs fois ici qu'il serait techiquement impossible d'identifier une page rewritée. Je pense que ce n'est pas exact.

Si je prends l'exemple cité, il est facile de voir que https://www.webrankinfo.com/forum/t/url-rewriting-spam.29661/ est rewritée. Il suffit d'examiner l'en-tête HTTP et on voit que c'est une page dynamique. Comme elle se termine par .htm, il est évident qu'elle est rewritée.

cqfd ?

Jean-Luc :wink:
 
WRInaute occasionnel
Gralon a dit:
WebRankInfo a dit:
lou-ve, personne ne peut savoir si une page est "rewritée" ou pas.
même pas Google avec des milliards de $
;-)

tu penses vraiment que google avec ses milliards de $ ne peut pas savoir que :
-https://www.webrankinfo.com/forum/viewtopic_29661.htm
=
-https://www.webrankinfo.com/forum/viewtopic.php?topic=29661

si il en avait réellement envie ?
:wink:

En meme temps, "phpBB" ou "forum" dans l'url suffira à Google à baisser la valeur des liens venant d'un forum...

En meme temps, ce n'est pas ce genre de UR que Google veut contrer, mais plutot des pages fantomes et du spamdex...
 
WRInaute occasionnel
jeanluc a dit:
Bonjour,

J'ai déjà lu plusieurs fois ici qu'il serait techiquement impossible d'identifier une page rewritée. Je pense que ce n'est pas exact.

Si je prends l'exemple cité, il est facile de voir que https://www.webrankinfo.com/forum/t/url-rewriting-spam.29661/ est rewritée. Il suffit d'examiner l'en-tête HTTP et on voit que c'est une page dynamique. Comme elle se termine par .htm, il est évident qu'elle est rewritée.

cqfd ?

Jean-Luc :wink:

et si on met une extension php, asp, aspx, ... ?

De toute façon, pour revenir au sujet, si c'est considéré comme du spam, tous les sites d'infos seront considérés comme tels...
Faut aller plus loin...
C'est pire que ce qui avait été avancé sur le fait que si l'on utilisait l'attribut css display, on serait sandboxé... C'est très violent comme technique ! :-)
 
Olivier Duffez (admin)
Membre du personnel
jeanluc a dit:
Bonjour,

J'ai déjà lu plusieurs fois ici qu'il serait techiquement impossible d'identifier une page rewritée. Je pense que ce n'est pas exact.

Si je prends l'exemple cité, il est facile de voir que https://www.webrankinfo.com/forum/t/url-rewriting-spam.29661/ est rewritée. Il suffit d'examiner l'en-tête HTTP et on voit que c'est une page dynamique. Comme elle se termine par .htm, il est évident qu'elle est rewritée.

cqfd ?

Jean-Luc :wink:
Jean-Luc, peux-tu m'expliquer comment tu vois que c'est une page dynamique ?
Voici l'entête :
Code:
HTTP/1.1 200 OK
Date: Wed, 01 Jun 2005 10:51:57 GMT
Server: Apache
X-Powered-By: PHP/4.3.10
Set-Cookie: webrankinfo2_data=a%3A0%3A%7B%7D; expi
res=Thu, 01-Jun-06 10:51:58 GMT; path=/; domain=ww
w.webrankinfo.com
Set-Cookie: webrankinfo2_sid=0889a4e61294ca2ffda14
7d2fe5ddcc6; path=/; domain=www.webrankinfo.com
Cache-Control: private, pre-check=0, post-check=0,
max-age=0
Expires: 0
Pragma: no-cache
Connection: close
Content-Type: text/html
(je ne demande qu'à apprendre pour comprendre ;) )

@Gralon : Google (ou n'importe qui) peut voir que les contenus des page dont tu as donné l'URL sont identiques. Mais ça ne veut pas dire que la page en .htm passe par de l'URL Rewriting...
Relis ma phrase, je n'ai pas parlé des pb de contenus dupliqués
 
WRInaute accro
WebRankInfo a dit:
Jean-Luc, peux-tu m'expliquer comment tu vois que c'est une page dynamique ?
Voici l'entête :
Code:
HTTP/1.1 200 OK
Date: Wed, 01 Jun 2005 10:51:57 GMT
Server: Apache
X-Powered-By: PHP/4.3.10
Set-Cookie: webrankinfo2_data=a%3A0%3A%7B%7D; expi
res=Thu, 01-Jun-06 10:51:58 GMT; path=/; domain=ww
w.webrankinfo.com
Set-Cookie: webrankinfo2_sid=0889a4e61294ca2ffda14
7d2fe5ddcc6; path=/; domain=www.webrankinfo.com
Cache-Control: private, pre-check=0, post-check=0,
max-age=0
Expires: 0
Pragma: no-cache
Connection: close
Content-Type: text/html
(je ne demande qu'à apprendre pour comprendre ;) )

C'est simple. Dans une page statique, il y a un Content-Length et il y a souvent un Last-Modified.

Exemple :
HTTP/1.1 200 OK
Date: Wed, 01 Jun 2005 11:40:15 GMT
Server: Apache/1.3.27 (Unix) (Red-Hat/Linux)
Last-Modified: Wed, 18 May 2005 06:41:23 GMT
ETag: "8280ca-46b8-428ae393"
Accept-Ranges: bytes
Content-Length: 18104
Connection: close
Content-Type: text/html

Evidemment, je ne crois pas que Google pénalise les pages rewritées. A mon avis, on devrait plutôt se demander si Google traite de la même façon les pages statiques et les pages dynamiques.

Jean-Luc
 
Olivier Duffez (admin)
Membre du personnel
je préfère cette explication car dire que "X-Powered-By: PHP/4.3.10" est louche...
 
WRInaute occasionnel
En effet, je crois que j'ai un peu dit n'importe quoi, "X-Powered-By: PHP/4.3.10" veut simplement dire que le module PHP est activé... Je croyais que jeanluc faisait référence à ça...

Sorry...
 
WRInaute impliqué
WebRankInfo a dit:
@Gralon : Google (ou n'importe qui) peut voir que les contenus des page dont tu as donné l'URL sont identiques. Mais ça ne veut pas dire que la page en .htm passe par de l'URL Rewriting...
Relis ma phrase, je n'ai pas parlé des pb de contenus dupliqués

dans l'absolu tu as raison, car ... par exemple ... tu peux très bien écrire la page en dur à chaque nouveau message sur le topic.

Il ne peut donc y avoir que "suspicion" de "rewrite"
:wink:
 
WRInaute occasionnel
ca méritait une conclusion : rien à craindre pour le moment...
Trop de risques de supprimer du contenu intéressant...
 
WRInaute discret
Ouf !

Quand on sait l'importance des conséquences sur le choix d'une technologie, quand on commence un gros projet, on essaie de valider la perennité de ses choix.
Ca rassure... du moins pour le moment.

Merci en tout cas de vos réponses.

Lou-ve
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Haut