GG indexe mes pages en double ??

Nouveau WRInaute
Bonjour à tous,

Par la commande site: , je me rend compte que GG indexe chaque page de mon site en double de la manière suivante:

www.monsite.com/?task=page1&lang=fr
www.monsite.com/?lang=fr&task=page1

Il inverse l'ordre des variables, mais il s'agit bien la même page...
Tous les liens internes de mon site ont pourtant bien tous la même syntaxe, d'ailleurs ni Yahoo, ni Live ne créent ces doublons.

J'ai peur d'être pénaliser pour cause de duplicate content, et ça aussi complique la lisibilité des stats dans GG Analytics.

Avez-vous une explication :?:
Un URL-rewriting pourrait p-ê régler ce problème, mais je ne m'y suis jamais essayé.
 
WRInaute discret
Je reste septique que google te change tes parametres, est tu sur qu'il y a aucun endroit où on peut dabord choisir sa langue puis sa page, et dans la meme logique choisir la page puis la mettre dans la langue de ton choix. ?
 
WRInaute occasionnel
Kijer a dit:
Je reste septique que google te change tes parametres, est tu sur qu'il y a aucun endroit où on peut dabord choisir sa langue puis sa page, et dans la meme logique choisir la page puis la mettre dans la langue de ton choix. ?
C'est le point essentiel à vérifier avant que de songer à l'URL rewriting.
 
WRInaute accro
Je plussoie l'idée de Kijer. Télécharger Xenu Link Sleuth, passes en un coup sur ton site et étudie l'ensemble des url qui ont été crawlées, tu trouveras sans doute réponse à ton souci.
 
WRInaute discret
Kijer a dit:
Je reste septique que google te change tes parametres, est tu sur qu'il y a aucun endroit où on peut dabord choisir sa langue puis sa page, et dans la meme logique choisir la page puis la mettre dans la langue de ton choix. ?

créer des sous-domaines pour la langue du genre en.monsite.com, c'est une bonne idée ou pas ?
 
WRInaute discret
En attendant de trouver le problème, tu peux toujours mettre cette ligne dans ton robots.txt

Code:
Disallow: /?lang=fr&task=
 
Nouveau WRInaute
Victor BRITO a dit:
Et sur la page d'accueil en "?lang=fr", y a-t-il un lien dont la valeur du href est "?task=page1" ? :wink:

Malheureusement non Victor, rien de cela...

Ce qui est curieux, c'est même Google Analytics fait la distinction entre ces différentes formes d'URL dans ses stats.

genre
www.monsite.com/?task=page1&lang=fr : 100 visites
www.monsite.com/?lang=fr&task=page1 : 15 visites

et ce, pour chacune les pages.

Google s'amuserait-il à parler en verlen de temps en temps ?!

Mon pb n'est pas si grave en fin de compte, j'aimerai juste comprendre pourquoi.
 
WRInaute accro
nickargall a dit:
...soit d'un site externe.

C'est le plus probable.

--> code toi un petit script de vérification d'URL, c'est pas la mort.

Code:
<?php
if($_GET['lang'] && $_GET['task']) 
 {
 $good_uri == '/?task='.$_GET['task'].'&lang='.$_GET['lang']'; 

 if($_SERVER['REQUEST_URI'] != $good_uri) 
  {
  header("Status: 301 Moved Permanently", false, 301);
  header("Location: http://www.monsite.com".$good_uri."");
  exit; 
  }

 }
?>
 
WRInaute impliqué
Bobi La Pointe a dit:
Ce qui est curieux, c'est même Google Analytics fait la distinction entre ces différentes formes d'URL dans ses stats.

genre
www.monsite.com/?task=page1&lang=fr : 100 visites
www.monsite.com/?lang=fr&task=page1 : 15 visites

et ce, pour chacune les pages.

Google s'amuserait-il à parler en verlen de temps en temps ?!

Mon pb n'est pas si grave en fin de compte, j'aimerai juste comprendre pourquoi.

Continue avec analytics, il peut te dire les chemins pris pour arriver sur chacune de tes pages :
"détail des pages par URL", puis utilise le menu "segment", choisit "source".

Vap
 
Nouveau WRInaute
Vap a dit:
Continue avec analytics, il peut te dire les chemins pris pour arriver sur chacune de tes pages :
"détail des pages par URL", puis utilise le menu "segment", choisit "source".

Vap

Bien vu Vap ! :wink:

Il s'avère en effet que toutes ces URL aux variables inversées, sont exclusivement visités en provenance de Google.
Très bizarre puisque sur certains mots-clés Google retourne la page
www.monsite.com/?task=page1&lang=fr

et sur d'autres il va retourner :
www.monsite.com/?lang=fr&task=page1

Il semble alors que GoogleBot se mélange les pinceaux et indexe 2 fois chaque page en inversant les variables.

Peut être vais-je empêcher l'indexation dans le Robot.txt comme il a été proposé plus haut.

...et soumettre la question à mon hébergeur, p-ê aura-t-il une explication.

Merci bien pour votre aide en tous les cas.
 
WRInaute accro
En tout cas Google n'a pas créé ces URL tout seul, et ton hébergeur non plus, ça c'est sur. Un lien interne ou externe a surement été fait vers cette URL. Peut être que ce ne fut que momentané, mais en tout cas Google l'a indexé et continuera à le suivre longtemps si rien n'est mis en place pour lui dire que cette URL doit être redirigée ou a été supprimée.

Plutôt que d'en interdire l'indexation, moi je mettrais une redirection 301 de l'URL "impropre" vers l'URL "propre".
 
WRInaute impliqué
nickargall a dit:
Plutôt que d'en interdire l'indexation, moi je mettrais une redirection 301 de l'URL "impropre" vers l'URL "propre".

Je suis d'accord, et c'est ce que fait le script proposé par hawkeye.

Vap
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut