Procédure pour migrer son site de HTML à PHP

Nouveau WRInaute
Pour simplifier, disons que je viens de renommer toutes les pages .html de mon site en .php, sans en changer le code.
Tous mes backlinks sont dirigés soit vers l'URL de mon site http:\\www.monsite.ext\ , soit vers une page .html du site, principalement index.html, qui redistribuait son "jus de lien" à d'autres pages .html du site.

Voici donc comment j'ai procédé :
- j'ai renommé tous mes fichiers .html en fichiers .php
- j'ai évidemment modifié tous les liens internes .html en liens .php
- j'ai effectué une redirection permanente dans le fichier .htaccess
- j'ai supprimé les anciens fichiers .html
- j'ai généré un nouveau sitemap.xml que j'ai soumis à Google

Est-ce la bonne méthode ? Vais-je conserver le bénéfice des backlinks qui pointaient vers des fichiers .html qui n'existent plus ? Googlebot "préfère-il" l'ancien sitemap.xml (vers des pages .html, qui va le rediriger à chaque page parcourue) ou le sitemap actuel, vers des pages .php, qui correspond à la réalité ? NB : les pages .html avaient du PageRank, une durée d'existence, etc.

Merci d'avance de vos réponses,
Crèvecoeur
 
WRInaute accro
crevecoeur a dit:
Pour simplifier, disons que je viens de renommer toutes les pages .html
...
- j'ai supprimé les anciens fichiers .html
Ton explication n'est pas claire. En effet, comment ferais-tu pour renommer tes fichier .html et les supprimer après ?
Je suppose donc que lorsque tu écris "supprimé les anciens fichiers .html", tu veux dire que tu les as supprimé des SERPs ?

Si c'est le cas, ta démarche n'est pas la bonne car les moteurs de recherche n'ont plus de lien redirigé (backlink) à suivre.
 
WRInaute accro
Moi ce que je ne comprend pas c'est le pourquoi de la manipe 8O
Si s'était pour inclure du code php dans les fichiers html ça prenait une ligne dans un htaccess sans rien changer.
Si s'était pour faire plus "je sais pas quoi" c'est une mauvaise idée.
 
Nouveau WRInaute
salva a dit:
crevecoeur a dit:
Pour simplifier, disons que je viens de renommer toutes les pages .html
...
- j'ai supprimé les anciens fichiers .html
Ton explication n'est pas claire. En effet, comment ferais-tu pour renommer tes fichier .html et les supprimer après ?
Je suppose donc que lorsque tu écris "supprimé les anciens fichiers .html", tu veux dire que tu les as supprimé des SERPs ?

Si c'est le cas, ta démarche n'est pas la bonne car les moteurs de recherche n'ont plus de lien redirigé (backlink) à suivre.

Tu as raison, à me relire, ce n'est pas très clair. En local, j'ai renommé mes fichiers .html en fichiers .php, en modifiant également les liens internes .html de ces fichiers en liens .php.
Je les ai uploadés sur mon serveur et en ai testé les bon fonctionnement. Sur le serveur, cohabitaient alors les fichiers .html, qui étaient indexés, listés dans le sitemap.xml que j'ai soumis à Google, et les tous nouveaux fichiers .php. J'ai donc détruit ces fichiers .html, et regénéré un nouveau sitemap.xml, qui liste les fichiers .php, mais plus les fichiers .html.
Quand le moteur de recherche tombe sur le fichier toto.html, mon .htaccess lui indique aussi une redirection permanente vers toto.php, d'un point de vue navigation, aucun souci, mais en terme de référencement, la démarche est-elle correcte ?
J'espère avoir été plus clair.
 
Nouveau WRInaute
zeb a dit:
Moi ce que je ne comprend pas c'est le pourquoi de la manipe 8O
Si s'était pour inclure du code php dans les fichiers html ça prenait une ligne dans un htaccess sans rien changer.
Si s'était pour faire plus "je sais pas quoi" c'est une mauvaise idée.

Mon intention n'était pas de justifier pourquoi PHP et non HTML, c'est bien pour ça que j'ai utilisé le terme "pour simplifier". En réalité, mes nouveaux fichiers ont en commun des include de code php (header.php / nav.php / footer.php), ce qui rend beaucoup maintenables ces fichiers "structurels", et lisible le code des pages (on ne voit que le contenu éditorial).
Le .htaccess en redirection permanente, je l'ai fait. En réalité j'ai gardé quelques anciens .html, donc la redirection permanente prend une ligne par fichier redirigé.

Selon toi, j'aurais dû laisser sur mon sites les anciens fichiers .html (qui étaient redirigés et dont je n'avais plus besoin), et l'ancien sitemap.xml décrivant uniquement des fichiers .html ? C'est toute mon interrogation... Et en corollaire : aujourd'hui, est-ce je risque de voir mon positionnement dégringoler ? Et si oui, comment corriger ? Merci d'avance.
 
WRInaute accro
Il y a une règle dans le .htaccess qui permet de faire exécuter du code php dans un fichier ayant l'extension .html. De fait, si c'était dans cette optique que tu as changé toutes tes extension, ce n'était pas nécessaire. Le cas échéant, via le .htaccess, tu peux réécrire tes url en .php en .html. Ce qui de fait ne nécessitait aucun changement.

Parce que pour le coup, je rejoins zeb : il est de bon ton de changer le moins possible ses url.
 
WRInaute passionné
UsagiYojimbo a dit:
Il y a une règle dans le .htaccess qui permet de faire exécuter du code php (...)

Parce que pour le coup, je rejoins zeb : il est de bon ton de changer le moins possible ses url.

Pas mieux.

En réalité, mes nouveaux fichiers ont en commun des include de code php (header.php / nav.php / footer.php)
Tu aurais pu donc garder tes URL en .html tout en ayant tes fichiers en .php
 
Nouveau WRInaute
patapon87 a dit:
UsagiYojimbo a dit:
Il y a une règle dans le .htaccess qui permet de faire exécuter du code php (...)

Parce que pour le coup, je rejoins zeb : il est de bon ton de changer le moins possible ses url.

Pas mieux.

En réalité, mes nouveaux fichiers ont en commun des include de code php (header.php / nav.php / footer.php)
Tu aurais pu donc garder tes URL en .html tout en ayant tes fichiers en .php
Merci pour vos remarques instructives. Je ne savais pas qu'on pouvait exécuter du code php en conservant l'extension .html, a posteriori je réalise que je me suis bien compliqué la vie :( ... et je suis d'accord avec vous, qu'il vaut mieux changer le moins possible ses url; bon, je pense qu'il est trop tard pour mon site de revenir en arrière, mais comme j'envisageais de faire la même chose avec le site de ma compagne, la règle .htaccess dont tu parles, patapon87, m'intéresse... je veux bien que tu m'en dises plus, ça me ferait gagner du temps...
 
WRInaute accro
Selon toi, j'aurais dû laisser sur mon sites les anciens fichiers .html (qui étaient redirigés et dont je n'avais plus besoin), et l'ancien sitemap.xml décrivant uniquement des fichiers .html ?
Oui ne rien rediriger mais programmer le serveur pour que les fichiers html soit envoyés au parseur php (plus propre).
Ensuite libre a toi de modifier le fichier html pour bénéficier d'includes si tu en as besoin et dans ton cas, je comprend, c'est justifié, mais tu ne touchais pas au plan d'url du site.

C'est toute mon interrogation... Et en corollaire : aujourd'hui, est-ce je risque de voir mon positionnement dégringoler ? Et si oui, comment corriger ? Merci d'avance.
dégringoler non si les 301 sont bien faites mais c'est jamais anodin de changer un plan d'url (là tu viens de perdre toute l'ancienneté de tes pages) et c'est ça que je trouve dommage. Dans le principe il est préférable d'adopter une solution technologique qui est transparente de l'extérieur.

Maintenant pourquoi ne rien changer car tu va aussi un jour changer de système (tu va vite te rendre compte que tes includes c'est mignon mais limité) et là en passant sous un CMS ou un autre pour encore plus de confort, tu va de nouveau changer tes urls ...
 
Nouveau WRInaute
tu viens de perdre toute l'ancienneté de tes pages
Bon, mes pages .html n'étaient pas très anciennes, créées en mars 2014. Sauf index.html, de 2001 :? . Sachant que j'ai fait la manip il y a une dizaine de jours, mon index.html est-il "récupérable" ?
En tout cas, en quelques posts, j'ai appris beaucoup. Merci à tous ceux qui ont pris le temps de me répondre. :D

Crèvecoeur
 
WRInaute accro
crevecoeur a dit:
AddType application/x-httpd-php .html .htm?
Oui (de mémoire) ça passe sur certains serveurs genre 1&1 pas chez OVH en revanche ou j'ai du passer par des règles de réécriture comme suggéré par patapon.

Sachant que j'ai fait la manip il y a une dizaine de jours, mon index.html est-il "récupérable" ?
Si il a pas été crawlé (l'accueil) c'est réversible, mais j'en doute. Si tu utilisais partout une url sans "index" ce sera transparent (pour l'accueil)
 
Nouveau WRInaute
@patapon87 : merci pour le tutoriel sur l'URL rewriting, c'est totalement nouveau pour moi, mais je vais le lire attentivement ...et tâcher de bien comprendre ! Je serai bientôt confronté au problème d'URL canonique, afin que des URLs comme monsite.ext / http://www.monsite.ext / monsite.ext/ / http://www.monsite.ext/ / monsite.ext/index.html / http://www.monsite.ext/index.html qui pointent évidemment sur la même page, puissent être considérées (en terme de référencement) comme une même URL. J'ai cru comprendre que, dans le cas contraire, Google [ risquait de considérer | considérait ] qu'il se trouvait en présence d'URLs différentes et donc de "duplicate content", apparemment (très) pénalisant pour le positionnement. Mais c'est une autre histoire...

@zeb :
1) j'ai testé dans le .htaccess la ligne "AddType application/x-httpd-php .html .htm?" qui fonctionne sur un serveur Online en hébergement mutualisé
2) je viens de regarder dans le cache associé à mon site, dans la SERP de Google où il apparaît : trop tard, il a été crawlé, je ne vais pas faire machine arrière; la plupart des URLs fournies pour les liens étaient bien de type http://www.monsite.ext/ , je n'utilisais en général la forme http://www.monsite.ext/index.html que lorsqu'elle m'était imposée; les autres URLs du site n'avaient pas été soumises en liens, étaient récentes, et n'apportaient pas de positionnement particulier sur des requêtes travaillées, donc pas de problème à ce niveau.

Je vous remercie encore, vous 2 et tous les autres contributeurs. En quelques heures, vous avez clairement répondu à ma demande, et vous m'avez appris beaucoup, à commencer par le fait que j'aurais dû poster ma question avant d'agir :oops: .
Si c'est effectivement en faisant des erreurs que l'on avance, je vais progresser rapidement :lol: !
 
WRInaute accro
zeb a dit:
Oui (de mémoire) ça passe sur certains serveurs genre 1&1 pas chez OVH en revanche ou j'ai du passer par des règles de réécriture comme suggéré par patapon.
Release3 OVH: un brol ou plus rien ne fonctionne (j'ai passé des dizaines d'heures pour de simples formulaires d'envoi de mail style contact: serveur chez OVH passé en release3).
Et bizarement (parle sécurité) pas de blocages d'accès de mes sites à partir 1&1 et quasiment toutes les plages d'OVH.

Ca fait 10 ans que je suis chez OVH mais je commence à regarder ailleurs.
 
Discussions similaires
Haut