Rewriting et risque évident de duplication de contenu

WRInaute passionné
Bonjour,

Ma première question n'est pas technique mais plus une question de pertinence (ou d'inutilité) de mon rewriting.

Sur mon forum punbb, j'ai rewrité toutes les pages de forums par défaut (viewforum.php?id=XXX) sous la forme forum-XXX.html et celles des sujets (viewforum.php?id=XXX) en sujet-XXX.html

Ma question : point de vue référencement et/ou vitesse d'indexation, est-ce réellement bénéfique ce que j'ai fait où me suis-je embêté pour rien ? [Je penche plus pour la solution 2 là :roll:]

Second point, plus grave potentiellement et relatif au risque de duplication de contenu... Ok c'est parti, disons que c'est bien beau, mon forum est rewrité depuis sa création, pas de problème de duplication à ce jour, mais je me dis que si une personne mal intentionnée (et oui ça existe) souhaite m'embêter, il suffit qu'elle fasse des liens vers les pages sources de mon forum (viewforum.php?id=XXX ou viewtopic.php?id=XXX) pour que google puisse les référencer et qu'ainsi la duplication de contenu naisse.
[Dans l'absolu, WRI pourrait avoir exactement ce même problème puisque -webrankinfo.com/forums/viewtopic_68556.htm équivaut à -webrankinfo.com/forums/topic_page_68556_0.htm ou encore à -webrankinfo.com/forums/viewtopic.php?t=68556 - même souci potentiel pour le forum de yagoort qui comme moi tourne sous punbb...]

Bref, je suppose qu'il existe une "rustine" pour empêcher l'indexation des pages sources (non rewritées).

Si tel est le cas, pouvez-vous me la communiquer ? Là, je ne vois vraiment pas.

D'avance GRAND MERCI à vous pour votre future aide.

Bertrand
[En mode parano]
 
5
57269
Guest
Trois lignes dans le robots.txt ne suffiraient-elles pas dans ton cas ?

Code:
User-agent: *
Disallow: /abonnes/viewforum.php
Disallow: /abonnes/viewtopic.php
 
WRInaute passionné
ça change pas grand chose dans ton cas mais c'est plus joli.

Tout l'intérêt de l'URL ReWriting pour des forums est de mettre l'intitulé du post dans l'URL si possible..
 
WRInaute passionné
St0uK a dit:
Trois lignes dans le robots.txt ne suffiraient-elles pas dans ton cas ?

Code:
User-agent: *
Disallow: /abonnes/viewforum.php
Disallow: /abonnes/viewtopic.php

C'est tout, c'est aussi simple et efficace ? [Car je l'ai déjà fait ça]

Pour moi le robots.txt n'était efficace que pour un crawl direct du site, pas forcément pour les liens externes... mais si c'est ça, OK hein :wink:

Merci à vous,

Bertrand
 
WRInaute accro
bertimus a dit:
Bonjour,

Ma première question n'est pas technique mais plus une question de pertinence (ou d'inutilité) de mon rewriting.

Sur mon forum punbb, j'ai rewrité toutes les pages de forums par défaut (viewforum.php?id=XXX) sous la forme forum-XXX.html et celles des sujets (viewforum.php?id=XXX) en sujet-XXX.html

Ma question : point de vue référencement et/ou vitesse d'indexation, est-ce réellement bénéfique ce que j'ai fait où me suis-je embêté pour rien ? [Je penche plus pour la solution 2 là :roll:]

Second point, plus grave potentiellement et relatif au risque de duplication de contenu... Ok c'est parti, disons que c'est bien beau, mon forum est rewrité depuis sa création, pas de problème de duplication à ce jour, mais je me dis que si une personne mal intentionnée (et oui ça existe) souhaite m'embêter, il suffit qu'elle fasse des liens vers les pages sources de mon forum (viewforum.php?id=XXX ou viewtopic.php?id=XXX) pour que google puisse les référencer et qu'ainsi la duplication de contenu naisse.
[Dans l'absolu, WRI pourrait avoir exactement ce même problème puisque -webrankinfo.com/forums/viewtopic_68556.htm équivaut à -webrankinfo.com/forums/topic_page_68556_0.htm ou encore à -webrankinfo.com/forums/viewtopic.php?t=68556 - même souci potentiel pour le forum de yagoort qui comme moi tourne sous punbb...]

Bref, je suppose qu'il existe une "rustine" pour empêcher l'indexation des pages sources (non rewritées).

Si tel est le cas, pouvez-vous me la communiquer ? Là, je ne vois vraiment pas.

D'avance GRAND MERCI à vous pour votre future aide.

Bertrand
[En mode parano]
A partir du moment ou une url source est rewritée, elle n'existe plus sous sa forme initiale aux yeux des bots et des visiteurs.
Donc pas de risque de duplicate.

Si d'aventure un concurrent malintentionné pouvait récupérer une url source, ton htaccess se chargerait de la diriger sur l'url avec la syntaxe rewritée.
 
WRInaute passionné
Si d'aventure un concurrent malintentionné pouvait récupérer une url source, ton htaccess se chargerait de la diriger sur l'url avec la syntaxe rewritée.

Ben non justement, c'est bien ça mon problème...

Si je reprend l'exemple qui est plus haut :
-webrankinfo.com/forums/viewtopic.php?t=68556 est tout autant accessible que -webrankinfo.com/forums/viewtopic_68556.htm

ou encore -http://forum.yagoort.org/forum/viewforum.php?id=46 est tout autant accessible que -forum.yagoort.org/forum/forum-referencement-46.html et rien ne force ainsi l'utilisation de la syntaxe rewritée ?

[Ou alors ai-je manqué une nouvelle chose ? Ce qui est également envisageable :wink:]
 
WRInaute passionné
OK on y vient, c'est justement là que je coince. Ca me génère une belle erreur 500 là...

Bon ça se fait via le .htaccess mais comment j'inclue les paramètres dans un redirection permanente ?

J'ai en fait l'impression de créer une boucle sans fin puisque viewforum.php?id=13 doit mener vers forum-13.html qui lui-même mène vers viewforum.php?id=13 qui lui même...

Merci pour ton ultime aide :wink:

[HS]Sais-tu que ma mère a grandi à Forbach et que mes grands parents y tenaient l'école maternelle ? :P[/HS]
 
WRInaute accro
bertimus a dit:
OK on y vient, c'est justement là que je coince. Ca me génère une belle erreur 500 là...

Bon ça se fait via le .htaccess mais comment j'inclue les paramètres dans un redirection permanente ?

J'ai en fait l'impression de créer une boucle sans fin puisque viewforum.php?id=13 doit mener vers forum-13.html qui lui-même mène vers viewforum.php?id=13 qui lui même...

Merci pour ton ultime aide :wink:

[HS]Sais-tu que ma mère a grandi à Forbach et que mes grands parents y tenaient l'école maternelle ? :P[/HS]
As-tu essayé ta règle avec ce flag: [R=301,L]

[HS]Tu es le petit fils à Louis?[/HS]
 
WRInaute passionné
Arf non je n'y arrive pas, note que tu as à faire à un non-spécialiste du .htaccess :wink:

J'ai testé ça mais ça ne change rien :
Code:
RewriteRule ^viewforum.php?id=([0-9]+)$ http://www.example.com/forum/forum-$1.html [R=301,L]

bref, je me tracasse peut-être pour rien (?), mon robots.txt inclue
Code:
Disallow: /forum/viewtopic.php
Disallow: /forum/viewforum.php
Ca devrait suffire non ?

----------
Pour le HS, hum non, je ne connais pas ce cher Louis, attention hein, je te parle d'un temps que les moins de 50 ans ne peuvent pas connaîtreuhh, Forbach en ce temps là, tilalilalala :)

Mon grand-père, né en 1900, s'appelait Alphonse et était le directeur de l'école de plein air au Schlossberg jusqu'en 1960.
Ma grand-mère quant à elle était directrice de l'école maternelle du quartier Bellevue.
Hum voilà tu sais tout, le nom de famille concerné est Karst ;)
 
WRInaute occasionnel
Quels sont justement les retours sur wri?

il me semble pourtant que le forum n'est pas si mal referencé que cela? (idem yagoort).
 
WRInaute accro
bertimus a dit:
Arf non je n'y arrive pas, note que tu as à faire à un non-spécialiste du .htaccess :wink:

J'ai testé ça mais ça ne change rien :
Code:
RewriteRule ^viewforum.php?id=([0-9]+)$ http://www.example.com/forum/forum-$1.html [R=301,L]

bref, je me tracasse peut-être pour rien (?), mon robots.txt inclue
Code:
Disallow: /forum/viewtopic.php
Disallow: /forum/viewforum.php
Ca devrait suffire non ?

----------
Pour le HS, hum non, je ne connais pas ce cher Louis, attention hein, je te parle d'un temps que les moins de 50 ans ne peuvent pas connaîtreuhh, Forbach en ce temps là, tilalilalala :)

Mon grand-père, né en 1900, s'appelait Alphonse et était le directeur de l'école de plein air au Schlossberg jusqu'en 1960.
Ma grand-mère quant à elle était directrice de l'école maternelle du quartier Bellevue.
Hum voilà tu sais tout, le nom de famille concerné est Karst ;)
Peux tu poster la règle en fonctionnement décrite dans ton premier post.

Monsieur Louis Houpert devait être (paix à son âme) son successeur.
Il sévissait déjà dans les années 65.
 
WRInaute passionné
Bien sûr, les voici :

Code:
RewriteRule ^forum-([0-9]+)-page([0-9]+)\.html$ viewforum.php?id=$1&p=$2 [QSA,L]
RewriteRule ^forum-([0-9]+)\.html$ viewforum.php?id=$1 [QSA,L]

RewriteRule ^sujet-([0-9]+)-page([0-9]+)\.html$ viewtopic.php?id=$1&p=$2 [QSA,L]
RewriteRule ^sujet-([0-9]+)\.html$ viewtopic.php?id=$1 [QSA,L]
 
WRInaute accro
bertimus a dit:
Bien sûr, les voici :

Code:
RewriteRule ^forum-([0-9]+)-page([0-9]+)\.html$ viewforum.php?id=$1&p=$2 [QSA,L]
RewriteRule ^forum-([0-9]+)\.html$ viewforum.php?id=$1 [QSA,L]

RewriteRule ^sujet-([0-9]+)-page([0-9]+)\.html$ viewtopic.php?id=$1&p=$2 [QSA,L]
RewriteRule ^sujet-([0-9]+)\.html$ viewtopic.php?id=$1 [QSA,L]
En remplaçant ceci [QSA,L] par [QSA,R=301,L] ça donne quoi?
 
WRInaute passionné
Ca génère des erreurs 404.

Les liens forums-XX.html ramènent dorénavant vers -www.example.com/home/example/www/forum/viewforum.php?id=XX

Les liens sujet-XX.html ramènent vers -www.example.com/home/example/www/forum/viewtopic.php?id=XX
 
WRInaute accro
Salut,
Si cela peut t'aider...voilà ce que je fais personnellement:

1- Je fais une règle de réécriture dans mon fichier htaccess pour transformer mes urls exotiques
2-Dans ma page générée en php, je rajoute ceci en début de prog:
<?php
//*****ARRAY POUR LES TITRES********************
$ArrayTitre = array ("blabla", "blabla");
$choix4 = $_GET['rubrique_voyage'];
$Titre = $ArrayTitre[$choix4];

//*******ARRAY POUR LES PAYS****************
$tableau3 = array ("", "blabla", "blabla");
$choix3 = $_GET['pays'];
$pays_choisis = $tableau3[$choix3];
//*******************************************
// RECUPERATION DES VARIABLES
//*******************************************

$url=$_SERVER['REQUEST_URI'];
$adresse="/ton-url--$choix4-$choix3.php";
$adresse1="ton-url-1-$choix4-$choix3.php";
$adresseExotique="/ton-url.php?rubrique_voyage=$choix4&pays=$choix3";
if ($url==$adresseExotique)
{
header("Status: 301 Moved Permanently");
header("Location: -http://www.TonNDD.com/$adresse1");
exit();
}
elseif ($url==$adresse)
{
header("Status: 301 Moved Permanently");
header("Location: -http://www.TonNDD.com/$adresse1");
exit();
}

//********************************************************************************
?>

De cette façon, tu modifies toutes pages exotiques......ainsi tu ne pourras jamais avoir de "duplicate content" puisque tu les transformes dynamiquement :) et tu as pu remarquer que je faisais aussi passer mes variables dans mes META et <title> pour assurer l'indexation ($titre et $pays_choisis)!

P.S: j'ai rajouté (-) devant l'url dans la Location header pour qu'elle s'affiche!
 
WRInaute passionné
Merci passion pour m'avoir transmis ton code.

Non spécialiste du php et pour ne pas t'embêter davantage, je place quelqu'un qui s'y connaît plus que moi sur ce coup... Quoiqu'il en soit, et de ce que j'en comprends, ça m'a l'air nickel.

Bref, merci encore, (à salva également et aux autres) et bonne continuation à vous :wink:

Bertrand
 
WRInaute passionné
1 - le robots.txt suffit :)
2 - tu ne peux pas réécrire la chaine située après le "?", normal donc que tes règles ne fonctionnaient pas !
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut