Index.html -> index.php par .htaccess et duplicate conten

WRInaute accro
Bonjour
Mon site a une page index.html et un script index.php à la racine, qui ont le même contenu.
Pour éviter le duplicate content, j'ai positionné la règle suivante dans le .htaccess à la racine de mon site:

RewriteRule ^index\.html$ index.php [L]

Ma question est: Est-ce suffisant pour éviter le duplicate content ?

Le test de code HTTP de Wri m'indique le code: 200 normal pour l'accès à l'url de mon site:
http://www.ortolojf-courses.com

Le serveur de mon site prend en priorité le fichier index.html quand celui-ci n'est pas spécifié dans l'url.

Merci beaucoup pour vos réponses à ma question de newbie.

En fait, celà ne m'est jamais arrivé d'avoir à résoudre un tel problème.

Bien à vous.
Amicalement.

Jean-François Ortolo
 
WRInaute accro
nickargall a dit:
Bonjour.

Tes deux adresses de pages sont elles indexées par les moteurs de recherche ?

Bonjour nickargall

Je ne crois pas.
Il me semble, que GG montre seulement dans ses résultats, pour l'url de la page d'accueil, l'url du nom de domaine, sans le fichier index.html ni le script index.php

En tout cas, avant que je mette cette redirection index.html -> index.php , c'était le cas. Je viens de mettre cette redirection avant-hier soir.

Le script index.php existe depuis quelques jours/semaines, et était à l'époque accessible seulement par des liens situés dans des pages intérieures ( à partir du premier étage, pour dire les choses comme çà. )

Mon site a une navigation très facile, on peut aller de n'importe quelle page à n'importe quelle page en un saut.

Je m'interroge simplement sur la validité du test de code HTTP de Wri, portant sur l'url avec seulement le nom de domaine, et le code rendu est: 200 OK, alors que le cookie de session est bien positionné, alors que seul le script index.php est capable de le faire.

Tout se passe comme si le test de Wri, accédait au fichier index.html ( qui est celui par défaut sur le serveur de mon site ), puis au script index.php , mais que le test considère que, comme c'est le serveur qui fait la redirection, celle-ci est transparente.

Je croyais que ce type de comportement ne marchait, qu'avec une redirection constante ( R=301 ), alors que ma redirection ne mentionne pas celà ( simple redirection [L] )

Merci beaucoup de tes réponses.

Bien à toi.
Amicalement.

Jean-François Ortolo
 
WRInaute accro
Re: index.html -> index.php par .htaccess et duplicate co

ortolojf a dit:
Bonjour
Mon site a une page index.html et un script index.php à la racine, qui ont le même contenu.
Pour éviter le duplicate content, j'ai positionné la règle suivante dans le .htaccess à la racine de mon site:

RewriteRule ^index\.html$ index.php [L]

Ma question est: Est-ce suffisant pour éviter le duplicate content ?

Le test de code HTTP de Wri m'indique le code: 200 normal pour l'accès à l'url de mon site:
http://www.ortolojf-courses.com

Le serveur de mon site prend en priorité le fichier index.html quand celui-ci n'est pas spécifié dans l'url.

Merci beaucoup pour vos réponses à ma question de newbie.

En fait, celà ne m'est jamais arrivé d'avoir à résoudre un tel problème.

Bien à vous.
Amicalement.

Jean-François Ortolo
Ne t'embête pas avec index.html ou .php: réécris les deux vers la racine ( / )
 
WRInaute accro
Re: index.html -> index.php par .htaccess et duplicate co

salva a dit:
Ne t'embête pas avec index.html ou .php: réécris les deux vers la racine ( / )


Bonjour salva

Mais... Ce sont deux fichiers d'urls différentes, de même contenu.
N'y a-t-il pas risque de duplicate content ?

Merci beaucoup de tes réponses.

Jean-François Ortolo
 
WRInaute accro
Si tu laisses les deux être indexés, oui.

Si tu rediriges les deux vers "/", non puisqu'il ne restera plus qu'un seul URL indexé ;)
 
WRInaute accro
HawkEye a dit:
Si tu laisses les deux être indexés, oui.

Si tu rediriges les deux vers "/", non puisqu'il ne restera plus qu'un seul URL indexé ;)


Bonjour HawkEye

Mais... N'est-il pas suffisant de faire une seule rule ?:

RewriteRule ^index.html$ index.php [L]


Si je redirige vers: / , à ce moment-là le serveur me redirigera par défaut vers index.html , ce qui n'est pas le but désiré.

Faut-il rajouter la rule ? :

RewriteRule ^/$ /index.php [L]

Merci beaucoup de tes réponses.

Bien à toi.
Amicalement.

Jean-François Ortolo
 
WRInaute accro
Si ton index.html contient exactement la même chose que ton index.php, et qu'il n'est pas indexé, pourquoi en avoir un ? Laisse uniquement l'index.php ...
 
WRInaute accro
nickargall a dit:
Si ton index.html contient exactement la même chose que ton index.php, et qu'il n'est pas indexé, pourquoi en avoir un ? Laisse uniquement l'index.php ...


Bonjour nickargall
C'est évident que mon fichier index.html est indexé, que GG le montre ou pas avec le ndd de mon site.

Ce fichier index.html date de novembre 2002, où a été mis en ligne mon site... Modifié plusieurs fois, mais quand même, largement le temps de le référencer... Avec pas mal de pages intérieures aussi.

Ma question, c'est seulement:

Est-ce que cette rule dans le fichier .htaccess du répertoire racine suffit, pour ne pas avoir de duplicate content:

RewriteRule ^index.html$ index.php [L]

Ou bien... Est-ce qu'il faut que je spécifie la redirection permanente ? (code de retour = 301 ), en mettant seulement cette rule:

RewriteRule ^index.html$ index.php [L,R=301]

Si, comme vous me le dites, une redirection simple ( sans R=301 ) fait apparaître à GG, l'url comme l'url résultante, la rule précédente devrait suffire, pour qu'il n'y ait qu'une seule url vue par GG.

Sinon, si spécifier R=301 ( redirection permanente ) fait apparaître l'url vue par GG, comme l'url résultante, là effectivement, n'aurais-je pas intérêt à utiliser la seconde rule, à la place de la première rule ?

Merci beaucoup de vos réponses.

Jean-François Ortolo

PS De toute façon, j'ai besoin de index.php ( pour les sessions ), mais je n'ai pas envie de dépendre des fonctionnalités de mon hébergeur ( le fait qu'il accepte index.php , et aussi qu'il l'accepte en second, après avoir essayé index.html )
 
WRInaute accro
salva a dit:
A partir du moment où ton site est accessible par deux des 3 urls ci-dessous:

http://www.example.com/
http://www.example.com/index.html
http://www.example.com/index.php

Il y a duplicate content.

Choisis une url et redirige les deux autres en 301 sur ton choix.


Bonjour salva
Je ne comprend pas très bien...

Celà voudrait dire que, pour tous les sites habituels accessibles par les urls: http://ndd/ et http://ndd/index.html

Il serait nécessaire d'y avoir une rule du type:

RewriteRule ^/$ /index.html [L]


Or, n'est-ce pas évident, qu'il n'y a pas besoin, dans un site habituel ( une seule page d'accueil index.html , et pouvant être visité par les urls: http://ndd , http://ndd/ et: http://ndd/index.html
de mettre une telle rule dans le fichier .htaccess du répertoire racine ?

Merci beaucoup pour tes réponses.

Jean-François Ortolo

PS Dans ce qui précède, le nom de domaien s'entend avec ou sans www.

C'est évident que, pour éviter le duplicate content, il faut rediriger le ndd sans www sur le ndd avec www , en 301, en gardant évidemment le(s) sous-répertoires(s).
 
WRInaute accro
A partir du moment où deux urls de syntaxe différentes pointent sur la même page, le duplicate content est avéré.

Mais ce n'est pas dramatique en soi si ce n'est un PR dilué.
 
WRInaute accro
salva a dit:
A partir du moment où deux urls de syntaxe différentes pointent sur la même page, le duplicate content est avéré.

Mais ce n'est pas dramatique en soi si ce n'est un PR dilué.


Bonjour salva

Quand je met [L,R=301] dans la règle:

RewriteRule ^index\.html$ index.php [L,R=301]

Celà me redirectionne l'url: www.ortolojf-courses.com/ ( test de code HTTP de Wri ), vers:
www.ortolojf-courses.com//index.php ( avec deux slashes ).

Quand je supprime le R=301, çà marche, et le test de Wri me donne: 200 OK.

Pourtant, celà devrait me donner le code redirection, non ? Donc 302 théoriquement.

Il est vrai que le serveur accepte les index.php directement, à condition qu'il n'y ait pas de fichier index.html, auquel cas il préfère par défaut ( sans redirection ), ce fichier index.html


Ah ! Les dessous et les finesses du webmastering !

Un eautre question: quand on veut utiliser les slashes dans une rulen faut-il les backslasher ? Par exemple:

RewriteRule ^\/index.html$ /index.php [L]

Et puis... Le test de Wri m'indique quand même, que le cache est désactivé. Donc GG va-t-il pouvoir continuer à mettre ma page d'accueil en cache ?

Merci de vos réponses.

Bien à vous.
Amicalement.

Jean-François Ortolo
 
Discussions similaires
Haut