PhpBB et duplicate content

WRInaute occasionnel
J'aurai bien posé cette question sur le forum de phpBB-fr mais il est indisponible pour le moment, et je pense que beaucoup de gens sont assez qualifiés pour me répondre ici.

Sur un forum phpBB rewrité l'adresse de base d'un topic et de la forme :
-http://www.site.com/forum/ftopic170.php

Quand le nombre de messages dans le topic est important d'autres pages sont créées et en haut sous le titre du topic on peut naviguer avec "suivante" "précédente" et des numéros. Mais lorsqu'on est sur la deuxième page et que l'on veux revenir sur la première l'adresse donné par "précédente" ou "1" est de la forme :
-http://www.site.com/forum/ftopic170-0-asc-0.php

Les deux adresses renvoie à la même page, et je pense qu'il y a un risque de duplicate content.

Questions :
1/ Y a-t-il vraiment un gros risque ?
2/ Que dois-je mettre dans mon fichier robots.txt pour que les robots ne prennent pas en compte la deuxième adresse ? (En sachant qu'il faut qu'ils prennent tout de même en compte les adresses du type -http://www.site.com/forum/ftopic170-0-asc-15.php)

Merci.
 
WRInaute impliqué
J'ai trouvé ce mod sur phpBB-fr et je l'ai placé sur mon forum et ça marche :wink:


Code:
##############################################################
## Supprimer _asc_ dans les pages des topics
##############################################################
#
#-----[ OUVRIR  ]------------------------------------------
#

viewtopic.php

#
#-----[ TROUVER ]------------------------------------------
#

$pagination = ( $highlight != '' ) ? generate_pagination("viewtopic.$phpEx?" . POST_TOPIC_URL . "=$topic_id&postdays=$post_days&postorder=$post_order&highlight=$highlight", $total_replies, $board_config['posts_per_page'], $start) : generate_pagination("viewtopic.$phpEx?" . POST_TOPIC_URL . "=$topic_id&postdays=$post_days&postorder=$post_order", $total_replies, $board_config['posts_per_page'], $start);

#
#-----[ REMPLACER PAR ]------------------------------------------
#

$pagination = ( $highlight != '' ) ? generate_pagination("viewtopic.$phpEx?" . POST_TOPIC_URL . "=$topic_id", $total_replies, $board_config['posts_per_page'], $start) : generate_pagination("viewtopic.$phpEx?" . POST_TOPIC_URL . "=$topic_id", $total_replies, $board_config['posts_per_page'], $start);

#
#-----[ SAUVEGARDER ET FERMER ]------------------------------------------
#
 
WRInaute occasionnel
Merci pour le mod, il marche pour ce qu'il doit faire, mais il ne résoud pas vraiment mon problème.

Maintenant l'adresse de "précédente" ou "1" est de la forme :

-http://www.site.com/forum/ftopic68-0.php

alors que l'adresse du titre du sujet est de la forme :

-http://www.usj86.com/forum/ftopic68.php

pour la même page... donc risque de duplicate encore une fois.

Mais merci quand même car je préfère les adresses sans les asc :wink: .
 
WRInaute impliqué
Après relecture, je vois à quoi tu fais allusion. C'est vrai que c'est gênant, car ça fait du duplicate content :cry: . Mais je ne vois pas comment résoudre ce problème :oops: .
 
WRInaute accro
ton forum est bourré de duplicate en effet

pense à virer les sutra


exemple :

-http://www.usj86.com/forum/sutra202.php
-http://www.usj86.com/forum/sutra218.php
-http://www.usj86.com/forum/sutra220.php
-http://www.usj86.com/forum/setopic_100-.html


va falloir completer ton robots.txt et virer ton ce duplicate ;-)
 
WRInaute occasionnel
Voici le code de mon robots.txt

Code:
User-agent: *
Disallow: /index.php3?
Disallow: /forum/posting 
Disallow: /forum/profile 
Disallow: /forum/privmsg 
Disallow: /forum/viewonline 
Disallow: /forum/groupcp 
Disallow: /forum/memberlist 
Disallow: /forum/search 
Disallow: /forum/login 
Disallow: /forum/faq 
Disallow: /forum/post- 
Disallow: /forum/updates-topic 
Disallow: /forum/stop-updates-topic 
Disallow: /forum/ptopic 
Disallow: /forum/ntopic 
Disallow: /forum/sutra 
Disallow: /forum/mforum 
Disallow: /forum/index.php? 
Disallow: /forum/viewtopic.php? 
Disallow: /forum/viewforum.php?

Donc si tu regardes bien Ohax, les sutra sont bloqués et en faisant un site: je n'ai pas de sutra, et t'as réponse ne résout pas mon problème d'adresse de cette forme -http://www.site.com/forum/ftopic68-0.php
 
WRInaute passionné
Simple, rewrite les liens "viewtopic.php?t=XXX" vers les topic en ftopicXXX-0.php au lieu de ftopicXXX.php. Ca se trouve dans ton includes/page_header.php ;)
 
WRInaute occasionnel
Merci DJ, mais j'aurai bien aimé garder les adresses du genre ftopicXXXX.php et non ftopicXXXX-0.php, parce que j'ai déjà quelques pages d'indexées avec le premier type d'adresse.

Donc est-ce qu'il n'y aurait pas moyen de faire ce que tu me conseilles mais en faisant l'inverse c'est-à-dire de ftopicXXXX-0.php à ftopicXXXX.php ?
 
WRInaute occasionnel
Après avoir réfléchi un 1/4 de seconde, j'avais pensé que plutot de rewrité les adresses, le mieux serait d'interdir les robots d'indexer les pages ftopicXXXX-0.php

Mais voilà, quelle ligne inscrire dans le fichier robots.txt pour interdir les robots d'indexer ces pages ?

En même temps, après, pour le bot de google adsense va y avoir un problème... :cry: j'y un peu perdu là !!!
 
WRInaute accro
faire des urls de forme ftopic0-XXXX.php au lieu de ftopicXXXX-0.php


et c'est ensuite un jeu d'enfant pour le robots.txt ^^
 
WRInaute occasionnel
Je veux bien te croire Ohax, mais je ne suis pas un boss ni en rewriting ni en robots.txt, alors je crois que je vais avoir besoin d'un peu plus de précision si ça ne te dérange pas.

Je pense que pour le robots.txt ça doit être
Code:
Disallow: /forum/ftopic0

Mais pour le rewriting, là je suis pas trop calé.
 
WRInaute passionné
Ohax, tu sais comment faire pour autoriser le bot Adsense tout en interdisant l'indexation de la page par googlebot dans robots.txt ?
 
WRInaute impliqué
Dj_Apx a dit:
Ohax, tu sais comment faire pour autoriser le bot Adsense tout en interdisant l'indexation de la page par googlebot dans robots.txt ?

Ajouter

User-agent: Mediapartners-Google*
Disallow:
 
WRInaute passionné
tu ne pourrais jamais ni enlever ftopic-XX et laisser les ftopic-XX-0 ni faire l'inverse dans robots.txt, vu qu'on n'a pas droit aux paramètres génériques (*)

La seule solution :faire en sorte que la réécriture réécrive directement -XX-0 au lieu de -XX.
 
WRInaute impliqué
Dj_Apx a dit:
tu ne pourrais jamais ni enlever ftopic-XX et laisser les ftopic-XX-0 ni faire l'inverse dans robots.txt, vu qu'on n'a pas droit aux paramètres génériques (*)

La seule solution :faire en sorte que la réécriture réécrive directement -XX-0 au lieu de -XX.

Ca j'avais compris :wink: .
Seulement, je ne sais pas comment faire :oops: .
 
WRInaute passionné
tu vas dans includes/page_header.php

et normalement au début de ce fichier tu as créé une fonction qui se charge de la réécriture.
il y a dans cette fonction une première liste des adresses à réécrire, puis une seconde liste (les adresses finales).

tu repères sur quelle ligne est viewtopic.php?t=
tu repères la ligne correspondante dans la deuxième liste; tu rajoutes un 0 et un tiret au bon endroit et le tour est joué :wink:
 
WRInaute impliqué
Dj_Apx a dit:
tu vas dans includes/page_header.php

et normalement au début de ce fichier tu as créé une fonction qui se charge de la réécriture.
il y a dans cette fonction une première liste des adresses à réécrire, puis une seconde liste (les adresses finales).

tu repères sur quelle ligne est viewtopic.php?t=
tu repères la ligne correspondante dans la deuxième liste; tu rajoutes un 0 et un tiret au bon endroit et le tour est joué :wink:

Je viens de faire comme conseillé et ça marche :D . Maintenant, attendons le référencement pour voir :wink: .
 
Discussions similaires
Haut