URL Rewriting, Multilangue et google

slash031

WRInaute discret
Bonjour,

Je possède un site trilingue constitué comme ceci :

1 domaine par langue (.com, .es, .us, .it)
1 seul serveur

$_SERVER['HTTP_HOST'] => $_SESSION["lang"] => affichage différent du contenu de la page

Pour une même page, l'url rewriting permet de donner un nom correspondant a la langue :

Exemple Pour une page "photos.php"
- FR : monsite.com/photos.html
- EN : monsite.us/pictures.html
- ES : monsite.es/fotos.html
- IT : monsite.it/foto.html

Mon menu renvois sur les pages "renommées" en fonction du pays (logique...).

Mon problème est que (je ne sais pas comment) google m'affiche des noms de pages qui ne correspondent pas forcement :
ex : monsite.es/photos.html

Ce qui fait beaucoup de duplicate content !!!!

- Avec robots.txt je ne peux pas entrer de domaine et c'est le même pour mes 4 domaines
- Pour faire un script qui récupére le nom de la page avec des variables d'environnement, ça récupere le nom de la page en .php mais pas moyen de récupérer le nom de la page "renommée"...

Ma question : comment devrais je m'y prendre pour supprimer les pages qui ne correspondent pas de l'indexation google ?
 

duplex13

WRInaute discret
J'avoue que je suis dans la même situation que toi au niveau des sites multi langues : 3 sites, 3 noms de domaines différents et 3 langues. Les 3 sites utilisent les mêmes règles de réécriture d'URL, mais je n'ai jamais eu de problème de pages "monsite.fr/calendar.html" qui se retrouvent dans l'index de Google malgré plusieurs dizaines de milliers de pages indexées et plusieurs années d'indexation.

À mon avis, il est d'abord urgent pour toi de comprendre comment des pages "monsite.es/photos.html" peuvent se retrouver dans l'index de google. Ensuite, il suffit de corriger le problème et les pages sortiront de l'index si plus aucun lien ne pointe vers ce type de page.
 

Discussions similaires

Haut