htm et html = duplicata ? pagerank en baisse

Nouveau WRInaute
hello

Mon site était en html avec un PR de 4.
Il y a un an je l'ai modifié (css)et j'ai renommé les pages en htm mais en oubliant de supprimer les anciennes pages html.
Le pagerank est retombé à 3.

Est-ce du aux anciennes pages html considérées comme duplicata (avec quelques différences prés) ?

Il y a 15 jours j'ai enlevé toutes les pages html en ne laissant que les 3 plus fréquentées sur lesquelles j'ai juste posé un lien vers les nouvelles équivalentes en htm.
J'ai surtout supprimé l'index html qui était toujours présent (duplicata je suppose avec index.htm= index.html ).

Malgré cela il y a 2 jours le pagerank est encore tombé à 2.
Est-ce que ces modifications en sont la cause ou bien n'ont-elles pas encore été prises en compte?

:?: :roll:
 
WRInaute passionné
Bonsoir,

Moi je vois une grosse bêtise d'avoir renommé les pages en .htm à la place de .html et en plus de laisser les 2 versions en place...
Pourquoi donc ?

Evidemment que le PR est tombé… c'est index.html qui avait ce PR4
index.htm c'est une nouvelle page et en plus ça fait duplicat avec la 1er
Fallait faire des redirections 301

Mais vraiment il n'y avait aucune utilité à changer les extensions des pages :roll:
 
WRInaute accro
patchi a dit:
J'ai surtout supprimé l'index html qui était toujours présent (duplicata je suppose avec index.htm= index.html ).

le mieux est d'oter les fichiers index.(php,html,htm,asp.. indexés par les moteurs et de n'indexer que les racines

déconseillé:
Code:
<a href="http://www.site.com/index.html">accueil</a>

conseillé:
Code:
<a href="http://www.site.com/">accueil</a>

Plusieurs raisons à ca:
- la page est servie plus rapidement
- le site est plus simple à référencer
- augmentation du Trust Rank
- page rank non dilué
 
Nouveau WRInaute
Merci pour vos réponses...

Moi je vois une grosse bêtise d'avoir renommé les pages en .htm à la place de .html et en plus de laisser les 2 versions en place...
Pourquoi donc ?
En fait c'est une amie qui m'a proposé d'améliorer le site en y ajoutant du CSS et je n'ai vu qu'ensuite que les pages étaient devenues htm :?

Evidemment que le PR est tombé… c'est index.html qui avait ce PR4
Pas sur, je crois plutôt que c'était la racine du site vers laquelle Google m'indique que pointent 1470 liens.


index.htm c'est une nouvelle page et en plus ça fait duplicat avec la 1er
oui ça j'ai compris mais c'est rectifié depuis 15 jours
Fallait faire des redirections 301
je suis chez Free donc impossible.

Mais vraiment il n'y avait aucune utilité à changer les extensions des pages
Oui mais faut le savoir avant. :D

le mieux est d'oter les fichiers index.(php,html,htm,asp.. indexés par les moteurs et de n'indexer que les racines
C'est ce que j'ai cru comprendre en effet, et tout mon référencement est fait à la racine mais qu'entend tu par supprimer les fichiers index? Tu parles juste des liens internes ou externes?
car on est bien obligé de laisser la page d'accueil nommée index.htm



Merci encore.
 
WRInaute discret
En faisant des redirection 301 des pages index.htm vers le root du répertoire, en rectifiant les liens de ton site voir les liens externe quand possible pour qu'ils pointent également vers ces roots et en configurant d'autre noms de page comme page par default dans la console d'administration de ton site...
 
WRInaute accro
patchi a dit:
Fallait faire des redirections 301
je suis chez Free donc impossible.

mais non... en php tout est possible:

redirige
-http://www.tonsite.com/index.htm
vers
-http://www.tonsite.com/index.html

Code:
<?php
if($_SERVER['REQUEST_URI'] == "/index.htm")  { 
header("HTTP/1.1 301 Moved Permanently"); 
header("Location: http://".$_SERVER['HTTP_HOST']."/index.html"); } ?>

(bout de code à mettre tout en haut du script)

Ensuite pour pouvoir lire du php dans ton fichier html, ajoute cette lire dans le fichier .htaccess

Code:
AddType application/x-httpd-php .htm .html


***************

screuscreu a dit:
KOogar a dit:
le mieux est d'oter les fichiers index.(php,html,htm,asp.. indexés par les moteurs et de n'indexer que les racines

Par le robot.txt ?

oui si cela ne concerne que quelques urls, sinon il vaut mieux utiliser php ou le fichier serveur .htaccess qui permettent en plus de faire des redirections permanente (301)
 
Nouveau WRInaute
Merci Koogar pour ces infos

Mais Free suspend les sites qui utilisent des redirections 301 en général, un robot les recherche et sévit
(pour une redirection interne y a peut-être une tolérance dans certains cas mais c'est pas sur à 100%)

De toute manière j'ai supprimé l'index.html et j'ai redirigé tous les liens internes vers la racine, ce matin.

Aujourd'hui bizarre! Aprés trois jours à 2 le pagerank sur la toolbar google est repassé à 3 (en test aussi mais le marqueur sur la page reste à 2).
C'est pas aussi réactif que ça je suppose...

Le plus curieux c'est qu'alors que le PR était descendu d'un cran je suis passé de la deuxiéme place à la première dans la recherche google sur le mot clef principal
Pire! mon concurrent principal qui est passé de 2 à 3 dans le même temps en page rank a rétrogradé de 1 en 2 sur les résultats Google.

A ni rien comprendre...
 
Discussions similaires
Haut