Deux version de mon site en ligne et perte de l'indexation

Nouveau WRInaute
Bonjour,

Mon site était hébergé chez Sherweb et accessible depuis http://www.zonehimalaya.net. Il était relativement bien indexé par Google mais était pour le moins vieillot. J’ai développé en local une nouvelle version de mon site sans la mettre en ligne.

J’ai trouvé un nouvel hébergeur. J’ai fait transféré mon domaine chez ce nouvel hébergeur et j’ai téléchargé la nouvelle version du site chez cet hébergeur sans modifier quoi que ce soit chez l’ancien hébergeur. J’ai conservé les URL du site comme elles étaient sauf que les pages ont été réalisées en .html plutôt que .htm. De plus la nouvelle version du site est sécurisée et est accessible à https://www.zonehimalaya.net .

Le problème : les requêtes Google sur mes mots-clés font apparaître mes pages dans les pages de résultats mais le clic pour accéder aux pages donne le message « Not found on this server ». La saisie des anciennes URL complètes en http dans la barre de recherche renvoie le même message. La saisie des nouvelles URL en https accède à la page. Je conclus que l’indexation de mon site ne sert plus à rien. Je comprends que mon domaine ayant été transféré et lié à mon nouvel espace chez le nouvel hébergeur a tout bousillé.

J’ai déterminé une nouvelle propriété pour la nouvelle version. Google Search Console m’indique que j’ai 62 pages non indexées (le site en contient quelques centaines) et aucune dans l’index. Motifs : page en double sans URL canonique ou introuvables (404).

J’ai cherché des solution chez WRI et ailleurs. J’ai retenu qu’une partie de la solution passait par :

- la déclaration de pages canoniques. J’ai commencé à inscrire dans la partie head de mes nouvelles pages l’élément <link rel=canonial…/> sauf que je doute. Cet élément doit-il figurer sur les nouvelles pages ou les anciennes qui sont identiques mais dépassées ?
(exemple de l’élément dans mes nouvelles pages : <link rel="canonical" href="https://zonehimalaya.net/Everest/ascension" />)

- la création d’une sitemap. J’ai créer un fichier au format .txt comprenant toutes les URL importantes de mon site. Je l’ai nommé sitemap.txt et l’ai placé à la racine de mon site. J’ai inscrit ce sitemap via la console Google. mais ce fichier n’est pas reconnu. Résultat : /sitemap.txt inconnu… impossible de récupérer le sitemap.

J’ai l’impression que Google ne sait plus où donner de la tête pcq j’ai mis en ligne une nouvelle version au lieu de modifier la version initiale. Plus je cherche, moins je comprends.

Pourriez-vous m’indiquer si je suis sur la bonne voie pour réparer ce « bordel » c.a.d la déclaration de pages canoniques et le fichier sitemap qui me semble correct mais ne fonctionne pas.

Merci de votre collaboration.
 
WRInaute accro
Le plus important pour réparer rapidement, c'est de mettre en place un url rewriting, pour renvoyer sur les pages en .html (ou mieux, mettre une extension .htm)

Ce n'est pas ton "transfert" de domaine qui a tout bousillé, mais le changement des adresses.
 
Nouveau WRInaute
Merci pour votre réponse,
Je veux m'assurer de bien comprendre. Je devrais renommer toutes mes pages en remplaçant l'extension ".html" par ".htm" sans rien perdre au change ? Rien à modifier au niveau du "https" ?
 
WRInaute occasionnel
Bonjour,
Le problème constaté est qu'une partie des pages indexées sont encore connues avec l'ancienne url en HTTP seul.
Mais lors d'un clic le navigateur tente quand même de résoudre l'url en HTTPS car c'est le protocole privilégié. Et comme le nom de domaine existe aussi sous ce protocole, il tente donc de résoudre l'URL complète mais.. avec le htm à la fin (et non l'extension html retenue sur le site en https), d'où l'erreur.
Donc, par simplicité, il peut être opportun de renommer les extension en .html vers .htm pour ne pas obtenir cette erreur.
Mais pour éviter le duplicate content, il faudra impérativement rediriger les anciennes url en http vers les nouvelles en https.

Sinon, les deux sites seront indexés et seront identifiés comme du contenu dupliqué.
 
Nouveau WRInaute
Merci pour votre réponse,
Je comprends mieux le problème. Mais je n'ai plus accès au site en http avec extension .htm. Je ne peux plus apporter des modifications aux pages. Mon nouvel hébergeur a rapatrié mon domaine et modifié les DNS afin de mettre en ligne une nouvelle version complète de mon site. L'ancien site me semble "orphelin" et déconnecté du Web. Je n'ai même pas une copie locale de l'ancienne version sur mon ordinateur. L'erreur que j'ai fait, je crois, est de ne pas avoir migré l'ancienne version du site chez mon nouvel hébergeur puis modifier les pages dans une 2e temps.

Conséquence... les seules pages auxquelles j'ai accès sont sur la nouvelle version en https avec extension .html. Je peux facilement les renommer en .htm mais je ne peux peux pas, me semble-t-il, procéder à des redirections des anciennes pages en .htm puisque je n'y ai plus accès. De plus, Google aura accès à 2 pages en .htm presque entièrement identiques en matière de contenu textuel. Dans presque tous les cas, seul le graphisme les distingue.

J'ai l'impression que l'ancienne version du site "végète" dans les caches de Google et semble ne plus servir à rien. Un clic sur mes mots-clés dans la barre de recherche Google fait apparaître mes anciennes pages dans la page de résultats de Google mais débouche sur "Page not found on this server".

C'est pour l'instant ma compréhension des choses mais je ne suis pas certain de ce que j'avance. Ma compréhension des techniques de référencement et d'indexation par Google est très limitée. Et les pages de support de Google ne m'aident pas beaucoup.
 
WRInaute occasionnel
PAs grave pour le site "orphelin" puisqu'il n'y a qu'un nom de domaine qui répond.
Mais sur le nouvel hébergement, il faut alors mettre eu propre :
- Impérativement mettre en place les redirections HTTP vers HTTPS, ET, choisir si on souhaite avoir le www ou non mettre la redirection en place selon le cas. A date, toutes les options répondent OK : http, https, avec www, sans www. Donc on a "4" sites qui sont en fait les mêmes
- Si rien de compliqué à faire, renommer les extensions .html en.htm
 
Olivier Duffez (admin)
Membre du personnel
est-ce vraiment bien utile ? le site est à refaire je pense, car il ne peut pas être consulté sur mobile
 
WRInaute occasionnel
Exact je n'avais pas regardé ce point, mais l'investissement en temps n'est pas le même. En attendant mieux, il y a déjà des opérations simples et rapides à mener pour qu'au moins la version Ordinateur soit propre.
 
Nouveau WRInaute
est-ce vraiment bien utile ? le site est à refaire je pense, car il ne peut pas être consulté sur mobile
J'ai essayé de créer une version pour mobile via Deamweaver. Ce fut tellement laborieux pour moi que j'ai abandonné. Je ne suis pas un Pro en webdesign et encore moins en SEO. Je suis un néophyte et encore ! Je n'ai plus assez de temps pour apprendre et suivre l'évolution technologique. Je dois me satisfaire d'un site simple techniquement et graphiquement avec un contenu textuel riche toutefois. Mon site n'est pas un site commerçant. La publicité commerciale y est absente par choix. J'ai exclue cette piste dès le départ. Il n'est pas graphiquement tendance non plus. Je n'ai pas ce qu'il faut.

Je souhaite simplement mettre à disposition les résultats de ma recherche documentaire et mon expérience en trekking. Ma clientèle cible est très nichée... les passionnés de haute montagne adeptes de la marche sportive qui s'intéressent également aux aspects culturels des pays himalayens où ils pratiquent leur sport. Mon site m'a permis de nouer des contacts avec des personnes qui partagent ma passion à travers le monde. Le site a été très utile à en juger par les commentaires reçus. Ce site m'a apporté beaucoup de satisfaction. Il risque effectivement de l'être moins. La donne a changé.

Je ne vise pas un traffic exceptionnel. Je souhaite seulement être un peu lu et me faire de nouveaux contacts. Je sais qu'une version mobile est très avantageuse pour le référencement. Toutefois, je crois personnellement que le contenu de mon site se prête mal à une consultation en mobilité. Beaucoup de texte et de grandes images. Les images de l'Everest ou de l'Annapurna sur un Mac vs sur un iPhone ne livre pas les mêmes émotions. Je peux me tromper. J'ai réfléchi, j'ai fait un choix que j'assume. Pour les motifs exposés, j'ai jugé qu'investir dans le développement d'une version mobile n'en valait pas la chandelle pour moi. Je dis souvent à la blague qu'au fil des années, mon temps est devenu plus important que mon compte en banque.

Mon message est évidemment hors-champ, même contre-productive mais le commentaire m'a interpellé.
 
Nouveau WRInaute
Exact je n'avais pas regardé ce point, mais l'investissement en temps n'est pas le même. En attendant mieux, il y a déjà des opérations simples et rapides à mener pour qu'au moins la version Ordinateur soit propre.
Assurément, d'ailleurs je vais tâcher de m'inspirer de vos suggestions pour rectifier la situation. Merci.
 
Olivier Duffez (admin)
Membre du personnel
certains ici sauront sans doute te conseiller sur un bon CMS adapté à ta situation. un truc super simple à utiliser, qui soit compatible mobile
 
Nouveau WRInaute
Il m'est venu une idée que j'aimerais valider avec vous. Après un peu de lecture dans la documentation de Google relativement au contenu dupliqué. Les pistes sont les suivantes...
- utilisation d'une balise refresh permanente
- déclaration de mes pages canoniques
- balise noindex

J'ai réussi à récupérer l'ancienne version du site depuis mon ancien hébergeur
Je l'ai installée dans un répertoire distinct de ma nouvelle version en local

Exemple :
Ancienne page : <http://www.zonehimalaya.net/Carnet/bhaktapur-1.htm>
Ancienne page modifiée (head)
<meta http-equiv="refresh" content="0; url=https://www.zonehimalaya.net/Carnet/bhaktapur.html">
<link rel="canonical" href="https://www.zonehimalaya.net/Carnet/bhaktapur.html" />
<meta name="robots" content="noindex, nofollow">

Est-ce que ça tient la route pour le duplicate content et l'indexation.

Aurais-je encore besoin de régler https et les www. Je ne sais pas comment faire.

J'ai lu sur la redirection 301 et .htaccess mais c'était écrit en chinois ;)
 
Dernière édition:
Nouveau WRInaute
certains ici sauront sans doute te conseiller sur un bon CMS adapté à ta situation. un truc super simple à utiliser, qui soit compatible mobile
Oui, j'ai fait l'expérience avec WIX mais 2 pages m'on pris un temps fou. Le résultat était plutôt joli je reconnais mais la version mobile couci couça.
 
Nouveau WRInaute
Voilà !
Création d'un sitemap
Déclaration de mes pages canoniques
Création d'un fichier .htaccess pour redirection 301
Maintenant... à la grâce du Dieu Google qui n'aime pas l'absence de version pour smartphone ;)
 
WRInaute occasionnel
Les redirections 301, pour ce qui est de HTTP/HTTPS et / vs /www ne sont pas OK. Les 4 types d'URL répondent encore indépendamment.
 
Discussions similaires
Haut