Référencer sur Google après réécriture?

Nouveau WRInaute
Bonjour,

Je viens de réécrire certains de mes ulrs grâce au mod_rewrite d'apache.

Mes anciens urls étaient du type /Path/script.php?page=ma_page_a_inclure.
Maintenant elles sont du type /Path/ma_page_a_inclure.html

Ma question est: est-ce-qu'il faut que je dois resoumettre de nouveau le site à Google pour qu'il prenne en compte les nouveaux changements?
Ou que j'attende son prochain passage?

Merci de vos réponses.
 
Olivier Duffez (admin)
Membre du personnel
si tu as bien pensé à changer tous les liens internes de ton site pour qu'ils soient au nouveau format, Google va s'en rendre compte dès son prochain passage.

de toute façon ça ne sert à rien de soumettre à Google... passe ton temps à développer ton site plutôt ;-)
 
WRInaute impliqué
T'attends son passage par contre attention à la duplication de contenu (car pour lui tes anciennes et nouvelles URL seront considérés comme physiquement différentes).

Donc assure toi que tes anciennes URL balancent toutes sur les nouvelles et ça suivra.
 
Nouveau WRInaute
Re,

Pour The Jedi: mon but c'était juste de réécrire les urls du type repertoire/ma_page.html en repertoire/script.php?page=ma_mage, c-a-d que seul existe physiquement script.php et ma_page.inc sur le serveur et que ma_page.html n'est là que pour les moteurs de recherche qui ne peuvent pas suivre les liens dynamiques du type script.php?var1=1&var2=2&... :!:
Mais le contenu de la page est scritement le même avec les deux urls.

Alors pourquoi dois-je en changer le contenu ? :?:

Ou ai-je mal compris le but de la réécriture des urls? 8O

Peux-tu développer plus tes recommandations :p

Merci. :wink:
 
WRInaute impliqué
Ben en fait si tu veux, Google va indexer tes nouvelles pages réécrites. Jusque là tout baigne.

Disons qu'avant tu avais une page A dont l'url était repertoire/script.php?page=ma_mage.
Maintenant elle est réécrite et devient pour Google une page B dont l'URL est repertoire/ma_page.html.

Le truc c'est que ta page A, Google quand il cherchera à la revisiter, elle existera toujours à ses yeux. De même, quand il revisitera la page B elle existera aussi.

La duplication de contenu c'est contenu page A = contenu page B avec 2 URL différentes.
En gros, il indexera ton site en double.

Si tu fais de l'URL rewriting, faut que tes anciennes pages ne soient plus accessibles (redirection vers les nouvelles) sinon tu seras pénalisé à terme.
 
WRInaute occasionnel
Je viens de vérifier sur le google. Après avoir mis en place l'url-rewriting sur mon forum phpbb, les anciens liens sont toujours référencés et je peux accèder au forum avec ceux-ci.
Donc il y a bien un risque de déduplication.
Est-il possible de supprimer ces anciens liens pour repartir sur une indexation propre au niveau du moteur google ?
 
WRInaute impliqué
J'ai fait un petit truc tout simple sur ma page index.php. Avant de faire quoique ce soit, je fais une détection d'url

Code:
<?php
if( preg_match("/(index.php|\/?)/i", $_SERVER['REQUEST_URI']) )
   { require('mon/script/de/conversion/d/url.php'); }

// ... reste de la page

Je détecte la présence d'un index.php et/ou /? (au cas où le mec ferait urdusite.com/?parametre=valeur
Et en fonction des paramètres, je construis l'URL rewritée (surtout parce que le faire par .htaccess étaient trop chiant, dans la mesure où j'avais des translations d'ID (passage d'ID numériques en chaines de caractères) et je redirige en 301.

Comme ça tu fais d'une pierre 2 coups :
- pas de duplicate content
- tous les anciens liens redirigeront vers les nouveaux

C'est fortement appréciable surtout quand tu as des liens externes postés sur des forums qui mentionnent l'ancienne écriture de tes pages.

PS : en tous cas ça marche du tonnerre, j'ai fait comme ça et je n'ai aucun soucis, j'ai pu conserver et améliorer mon positionnement sans pénaliser les visiteurs.
PPS : à partir de là, les anciennes URL disparaissent progressivement de Google et sont remplacées par les nouvelles, réécrites.
 
Nouveau WRInaute
Bonjour,

Une autre question :oops: "récurrente" :oops: que l'on a dû vous poser plusieurs fois: comment détecter le passage de Google sur une page grâce à un script PHP ?

Il n'y a pas une histoire de l'@IP ou de l'User Agent de Google à tester dans le script? :?:

Merci encore votre patience. :wink:
 
WRInaute occasionnel
Par contre, Google ne va t'il pas plutôt via son robot dérouler toutes les pages du site et remettre à jour les liens qui ont été modifiés via l'url-rewriting dans sa base ?
 
WRInaute impliqué
@ Toan > si y'a bien une histoire de User Agent mais le mieux est d'agir avec Google comme si c'était un utilisateur lambda (enfin c'est ma devise)

@e-atlantide > heu, si j'ai dis le contraire ? pour lui anciennes URL > nouvelles URL
 
Nouveau WRInaute
Je pencherai bien vers cette analyse aussi! 8O

Quelqu'un pourrait me l'affirmer avec certitude et preuves à l'appui(liens par ex.) :?:

Donc en attendant de rediriger mes anciennes urls vers les nouvelles grâce peut-être au script de The Jedi, je laisse les choses telles quelles sont.

J'attends avec impatience vos confirmations ou démentis sur la mise à jour des liens par Google. :p

A tout de suite.

Toàn
 
WRInaute occasionnel
Depuis que j'ai mis en oeuvre l'url-rewriting sur mon annuaire et mon forum, je constate que google référence mes liens en double.

Y-a-t'il une astuce pour supprimer de la base d'indexation google les liens avec les variables pour ne garder que les liens réécrites ?
 
Nouveau WRInaute
En utilisant un fichier .htaccess avec la directive: RedirectPermanent.

Ou utiliser le script de The Jedi.

@+
 
WRInaute occasionnel
J'ai essayé avec la commande RedirectPermanent dans le fichier .htaccess qui est stocké dans /annuaire/

J'ai ajouté cette ligne à la fin après les règles RewriteRule :
RedirectPermanent index.php?cat_id=42 /annuaire/egypte-42.htm

La redirection ne fonctionne pas (sûrement un problème de syntaxe).
J'ai 162 catégories dans mon annuaire. Cela signifie que je dois saisir 162 lignes RedirectPermanent. N'y a t'il un impact sur les temps de réponse d'affichage de la page ?

Merci de m'aider. :(
 
WRInaute occasionnel
J'ai trouvé l'information et j'ai effectué des tests.
A priori, la règle RedirectPermanent ne fonctionne pas avec des liens contenant des variables !

:arrow: The Jedi : tu mets quoi dans ton script dans le fichier { require('mon/script/de/conversion/d/url.php'); }

D'avance merci

Michaël
 
WRInaute occasionnel
Merci pour ce lien.

Je me suis rendu compte que la même page de mon site pouvait être indexée trois fois dans google et yahoo : le lien avec les variables, le lien réécrit et un lien avec un sous-domaine !

J'ai opté de supprimer ce sous-domaine -> donc il y a un code 404

En ce qui concerne les liens dynamiques, je n’ai pas le temps de faire du développement (car je n’ai pas suffisamment de compétence pour le faire rapidement), je pense agir directement dans la base de données est remplacer les variables par des nouvelles. Les liens avec les anciennes variables vont recevoir une réponse 404 (not found). J’ai créé une page spécifique (pour les 404 not found) pour rediriger ces liens vers ma page d’accueil.

Je pense ainsi que les moteurs vont supprimer les liens dédupliqués pour aboutir à une indexation de mes pages de manière seine.

Je te remercie de m’avoir sensibilisé sur ce risque d’être pénalisé par les moteurs. J'espère que je ne vais pas encore découvrir d'autres problèmes de ce type !

A+

Michaël
 
WRInaute impliqué
Si tu veux j'ai aussi une partie où j'ai aussi appliqué une translation anciennes variables => nouvelles variables.
Je l'ai appliqué notamment car je passais d'ID numériques vers des ID en texte.
 
WRInaute occasionnel
Je suis intéressé par ton script.

La solution de contournement que je présentais ne fonctionne pas.
La variable cat_id dans le index.php?cat_id=xxx ne retourne pas de page d'erreur même si ce numéro catégorie n'existe pas : une page apparaît en indiquant "Pas encore de sites dans cette catégorie !".

Je suis maudit !

Je veux bien essayer avec ton script.
 
WRInaute occasionnel
The Jedi a dit:
Si tu veux j'ai aussi une partie où j'ai aussi appliqué une translation anciennes variables => nouvelles variables.
Je l'ai appliqué notamment car je passais d'ID numériques vers des ID en texte.

Je suis preneur de ton code.

D'avance merci.

Michaël
 
WRInaute occasionnel
C'est bon, j'ai trouvé une solution à mon problème au moins pour google.

Google propose un système automatique de suppression d'URL en 24 heures.
J'ai enfin réussi à supprimer mes anciens liens avec variables.
 
Nouveau WRInaute
e-atlantide a dit:
C'est bon, j'ai trouvé une solution à mon problème au moins pour google.

Google propose un système automatique de suppression d'URL en 24 heures.
J'ai enfin réussi à supprimer mes anciens liens avec variables.

Salut, ce thread concerne mon cas.
e-atlantide, j'aimerais savoir comment tu as fait pour supprimer les doublons des pages référencées dans Google. Est-ce que c'est Google lui-même qui les a fait sans ton intervention ?

Mon problème est le suivant:
- Toutes mes urls étaient sous la forme h*t*t*p://www.mondomaine.com/index.php?page=xxx&id=yyy....
- J'ai utilisé un soft OpenSef qui me permet de réecrire toutes les urls de mon site sous la forme h*t*t*p://www.mondomaine.com/titre-de-la-page.html .

- Les anciennes URLs avec des variables fonctionnent toujours, mais en cliquant dessus, ils sont automatiquement réécrits. Et puis, je ne peux pas m'amuser à les inhiber, car dans mon Forum ces liens sont toujours là.

- Les répercussions n'ont pas encore été faites dans Google, mais, je me demande si Google ne va pas me créer des duplicatas des pages et si le pageRank des anciennes pages vont être perdues.

Je ne peux pas utiliser la solution de "The Jedi", car, mes urls ne sont pas écrites en suivant une règle bien précise.
Merci beaucoup de votre aide.
 
Nouveau WRInaute
besoin d'un chtit conseil

BOnjour à tous, j'ai utilisé sous spip un système de rewriting virtuel http://www.spip-contrib.net/Urls-Rewriting-ou-Urls-propres#forum392836

Et donc le problème si j'ai bien compris c'est quand les anciennes url ne disparaissent pas ce qui est mon cas.

par exemple , mon site affiche:
http://www.shinmanga.com/article.php?id ... to-episode
mais http://www.shinmanga.com/article.php?id_article=1494 marche toujours


Qqun aurait un petit conseil? sachant que la encore si j ai bien compris, mon site risque de finir dans la sand box avec ces histoires
 
Discussions similaires
Haut