de index.htm à index.html, [BILAN]

WRInaute impliqué
Bonjour,
J'ai créer ma page en mettant un fichier index.htm le référencement et l'indexation google se passe pas mal.
Ce matin mon hébergeur (amen), me demande de changer ma page index.htm en index.html , à votre avis:
- que va en penser google (duplicate ?)?
- Sachant que je suis sur un hébergement statique, qu'est ce que j'ai comme solutions (robots.txt)?

Ou alors ça ne va poser aucun problèmes (j'ai un doute là).

édit: pour l'instant j'ai mis index.html en noindex. Les deux pages peuvent elles cohabiter ?

merci :wink:
 
WRInaute accro
Bonjour,

Le mieux est que tous les liens internes et externes pointent vers http://www.pene-r.com/, plutôt que vers http://www.pene-r.com/index.htm ou vers http://www.pene-r.com/index.html. De cette façon, il n'y a jamais de problème et tu passes quand tu veux de /index.htm à /index.html ou même à /index.php, sans que ça se remarque.

Dans tous les cas, je n'en conserverais qu'un seul. Actuellement, la page http://www.pene-r.com/ contient
Code:
<meta name="robots" content="noindex" />
, ce qui va provoquer sa désindexation. Je supprimerais cette ligne immédiatement.

Jean-Luc
 
WRInaute impliqué
Merci pour ta réponse Jean-luc,
En fait j'ai mis index.html en noindex en attendant de prendre une décision, mais index.htm existe avec follow.

Peux tu me confirmer que enlever index.htm (et laisser.html bien sur) de mon serveur ne changera rien pour google (les liens sont sur -www.pene-r.com/), mais j'ai peut être référencer sur un ou deux annuaires en /index.htm (je suis plus très sur là :? ).

merci d'avance :wink:
 
WRInaute accro
pene-r a dit:
Peux tu me confirmer que enlever index.htm (et laisser.html bien sur) de mon serveur ne changera rien pour google
Je pense que c'est ce qu'il faut faire.

Tant pis pour les 2 annuaires avec /index.htm ou alors tu fais une page d'erreur 404 personnalisée qui récupère le visiteur.

Jean-Luc

P.S. surtout ne pas oublier d'enlever le noindex :wink:
 
WRInaute impliqué
Merci jeanluc,
Pour le noindex je l'ai fait de suite.
En fair ma crainte est qu'il y est duplicate entre index.html et index.htm sachant que c'est sous cette forme que la page est indexée.

Je vais surveiller ça on verra bien :)

merci encore :wink:
 
WRInaute impliqué
Bon ben visiblement c'est un gros problème je suis en train de disparaitre de l'index :cry: .
Si quelqu'un a une idée pour ratrapper le coup :?
 
WRInaute impliqué
Sur la majorité des datas, l'index a disparu :?
Il me reste les autres pages, mais bon elles sombrent dans le classement,
Je vais attendre demain, voir si il revient,
à moins que quelqu'un ai déjà vu le phénomène et sache quoi faire :(
 
WRInaute accro
Fait un refresh qui menera tes visiteurs de index.htm à index.html...
Tu peux faire ça dans ton index.htm :
Code:
<html> 
<head> 
<script language="JavaScript"> 
<!-- 
function MM_goToURL() { //v3.0 
var i, args=MM_goToURL.arguments; document.MM_returnValue = false; 
for (i=0; i<(args.length-1); i+=2) eval(args[i]+".location='"+args[i+1]+"'"); 
} 
//--> 
</script> 
</head> 
<body onLoad="MM_goToURL('parent','index.html');return document.MM_returnValue"> 
</body> 
</html>
 
WRInaute impliqué
Merci mais j'ai sorti la page index.htm , je ne sais pas comment ça se passe pour google si il y a deux page index ?
Si quelqu'un a une idée :p
 
WRInaute accro
Salut,

Google et MSN ont lu la page avec la META "robots" "nonindex" et , du coup, il ont désindexé la page.

Si tu as accès à tes logs, tu peux peut-être y voir s'ils sont revenus sur la page d'accueil depuis. Si c'est le cas, ils vont réindexer la page probablement aussi vite qu'ils l'ont désindexée. Si ce n'est pas le cas, je ne sais pas comment tu peux leur dire de revenir... :?

Jean-Luc
 
WRInaute impliqué
Ah p*tain j'avais pas vu msn aussi :evil:
Ils passent trois fois l'an et vlan pile au moment où il faut pas.... :?

J'ai mis des liens sur des pages un peu actives on verra bien :(


merci :wink:
 
WRInaute impliqué
Salut :wink: ,
Un petit bilan de la mésaventure, qui se termine pas mal.

L'hébergeur m'ayant demandé le changement, je m'exécute, mais je me pose des questions stupides sur ce que cela va induire (duplicate?, les bot cherchent index.htm ???).
Je décide donc de mettre mon index.html en noindex :oops: , et je laisse le .htm accessible, ceci pendant une petite heure ou deux. Naïvement je me dis que ça ne va pas changer grand chose :p .
Résultat un googlebot et un msnbot passent, prennent en compte le noindex (sans aller voir l' index.htm) et vlan hier petit à petit, mon index disparaît de gg, pour être totalement invisible (plus sur aucun data) hier à minuit. :cry:
J'ai passé la journée d'hier à resoumettre mon index à gg et msn, et j'ai mis des liens un peu partout.

Bilan réindexation totale ce matin avec récupèration des places sur google (ouf :) ). Pour msn le noindex a eu pour effet de ne faire apparaître que l'url (-http://www.pene-r.com/) dans les résultats mais j'ai gardé mes places.
Je vais surveillez, pour voir combien de temps il met à me réindexer normalement l'accueil... :? .

Merci à ceux qui m'ont filé un coup de main, vous avez gagné ma reconnaissance :lol: :wink:
 
WRInaute impliqué
effectivement tu n'as pas de chance que les robots crawle ton site avec la balise noindex, le mieux aurait été que tu renomme ta page htm en html de suite.
tiens nous au courant de l'évolution.
bon courage
caro
 
WRInaute impliqué
Surtout que comme te l'a dit Jean-Luc, index.htm ou index.html, Google ne fait pas de différence si tes liens sont sur le nom de domaine.
Pour t'en convaincre, il suffit de regarder (si cela t'est possible) tes logs : Googlebot ne demande pas à lire par exemple "/index.htm", il demande à lire "/".

En t'inquiétant outre mesure, tu as créé un problème... :)
(bon mais le pb n'est pas grave)
 
WRInaute impliqué
Salut :wink: ,

remi L. a dit:
En t'inquiétant outre mesure, tu as créé un problème... Smile
(bon mais le pb n'est pas grave)
C'est exactement ça :? , bon je suis pas un fortiche de la technique et je vais décrire un peu mieux mon raisonnement, si ça peut servir à quelqu'un :) un jour ...

Vla' donc un beau matin ma page index.htm remplacé par une page de mon hébergeur, me demandant d'afficher une page: index.html (l'assistance technique, m'a confirmé que c'est une page qui est créée automatiquement, pourquoi ?).
Mon raisonnement est le suivant: Les bots connaissent index.htm, si je change ils vont être perdu (les pov'). Donc je me dis; "mets une page index.html pour faire plaisir à l'hébergeur (et avec cette page ça marche, mon site est accessible), tu lui mets une balise <robots="noindex">, les robots si ils passent iront de toutes manières voir index.htm".
Avant de faire un changement définitf, je viens ici, je poste pour m'assurrer que la manip (passage de .htm à .html) ne posera pas de problème :p .
La suite est dans le topic.

Je me demande maintenant si les robots ont vu le <noindex> ou si ils sont passés sur la page de l'hébergeur* (j'ai pas regardé la structure de cette page et je n'ai pas accès aux logs), je croyai bêtement que les bots iraient voir index.htm, ce n'est pas le cas.
Mon conseil à 2cents (surtout si vous êtes chez amen, les autres je sais pas :? ), faites directement une page index.html , ça évitera d'être surpris un jour par une page auto de l'hébergeur. :wink:

Toujours pas de réindexation normale chez MSN :? , je ferai un Up quand ce sera revenu :p (dommage il m'envoyait de plus en plus de visiteurs :? )

*Surtout MSN, qui a toujours mon url, mais plus de snippet :roll:
 
WRInaute impliqué
y a un truc bizarre quand meme :?

quand on tape :
ww.cdiscount.com/index.htm
google affiche :
ww.cdiscount.com/

quand on tape :
ww.cdiscount.com/index.html
google affiche :
ww.cdiscount.com/

ce qui veut dire que google s'en fout de l'extension et qu'il pointe toujours sur ww.cdiscount.com/
mais alors pourquoi quand on tape :
ww.cdiscount.com/index.php
google dit que la page n'existe pas ???
si vraiment google ne regardait que la racine "/" pourquoi ca ne marche pas avec php ?


ps : j'ai enlevé un "w" à www afin que les textes se transforment pas en liens
 
WRInaute accro
S'il existe des liens vers www.cdiscount.com/index.htm et vers www.cdiscount.com/, Google indexe les deux URL, mais quand il constate que deux pages sont identiques, il choisit dans sa grande sagesse une des deux URL qui sera l'URL canonique. L'autre alors n'est plus qu'une sorte d'alias.

Jean-Luc
 
WRInaute impliqué
merci jean luc pour ta réponse mais il ne s'agit pas de cela.

c'est le cas pour TOUS les sites sur google, pas de rapport avec les liens,
site.com/ = site.com/index.htm = site.com/index.html
mais pas égal à site.com/index.php

pourquoi google sait il que index.htm et index.html sont la racine et donc site.com/ et pourquoi pas sur les autres extensions comme index.php ???
 
WRInaute accro
Je ne suis pas d'accord. :wink:

Ce que tu dis de index.htm et index.html n'est pas vérifié sur tous les sites et il existe des exemples comme celui-ci : http://rubistar.4teachers.org/index.php.

Tout dépend de ce que Google a trouvé sur le site lors de ses visites. Parfois les pages "confondues" appartiennent même à des sites différents.

Jean-Luc
 
WRInaute impliqué
pas encore tout à fait d'accord avec toi non plus :wink:

encore plus bizarre ton exemple car pour google :

si on tape : rubistar.4teachers.org
il affiche : rubistar.4teachers.org/

si on tape : rubistar.4teachers.org/index.htm
il affiche : rubistar.4teachers.org/

si on tape : rubistar.4teachers.org/index.html
il affiche : rubistar.4teachers.org/

si on tape : rubistar.4teachers.org/index.php
il affiche : rubistar.4teachers.org/

donc dans cet exemple google renvoie toujours à la racine.
j'ai essayé sur d'autres sites et meme si la page html n'existe pas google renvoie quand meme sur la racine.
on dirait que pour google, htm ou html est toujours la racine sur tous les sites sauf si il trouve une autre extension.

dans ton cas, le site est accessible par les 3 extensions,
je n'arrive pas à trouver un site qui ne marche qu'avec php en index pour voir comment google le gère.
 
WRInaute impliqué
Salut :wink: ,

ça y est msn a repasser, (cache du 9/12) :? .
J'ai vraiment pas eu de bol, pour ce qui le concerne :cry: .

Quand je disai qu'il passe deux fois l'an, j'étais pas loin :lol:

Bon, merci encore :wink:
 
Discussions similaires
Haut