A quoi sert cette commande?

WRInaute occasionnel
Bonjour,
Je viens de voir un post sur un site disant que Google voudrait arrêter de tagger les pages qui se trouvent dans son index complémentaire : ici
Voici la commande :
Code:
site:monsite.com *** -asdf
Si j'ai bien compris cette page afficherait toutes les pages indexées, c'est bien ça?
Dans l'article il est dit que cette commande aide (par exemple) à trouver les pages proposant un contenu proche d'une autre page, mais je ne vois pas comment. Je viens d'utiliser la commande, effectivement j'ai plus de résultats qu'avec la commande site de base, mais je ne vois pas sur quoi je peux m'appuyer pour trouver les pages susceptibles d'être en DC.
Quelqu'un pour m'aider?
 
WRInaute passionné
Elle sert à voir les pages en résultats complémentaires (il y a la mention 'résultats complémentaires' à côté de l'URL) :

-http://www.moteurs-news.com/blog/index.php/2007/07/10/136-google-requete-trouver-pages-resultat-complementaire
 
WRInaute occasionnel
Bon, j'avais déjà lu l'article, mais je ne comprends pas comment cela peut aider à trouver des problèmes de DC ou de "liage interne".
Pourrais-tu m'expliquer plus en détail comment détecter les problèmes de son site via cette commande?
 
WRInaute passionné
Grosso modo, une page "tombe" dans l'index supplémentaire parce qu'elle n'a pas assez de liens entrants, par déficit de PR (pour faire court)

C'est souvent dû au fait que certaines pages intérieures ont du mal à obtenir des BL, la plupart arrivant sur la home. Un moyen d'y remédier et de disposer d'une bonne structure de liens interne pour redistribuer ce "poids" vers les pages intérieures.

Et c'est pratique de voir rapidement grâce à cette commande le ratio de pages en résultat complémentaire : pages en RC/pages indexées, ca permet notamment d'identifier ce genre de problèmes.

Un ratio trop élevé révélant souvent un mauvais liage interne.

Mais apparemment, si on en crois Google, l'index complémentaire est amener à évoluer, mise à jour plus rapide, apparition plus fréquente de ces pages dans les résultats...
 
WRInaute occasionnel
Ok, je commence à comprendre.
En fait mon site a un très mauvais linking interne, puisque je dois avoir 95% de mes pages qui ressortent sur cette requête.
Or, si j'ai bien compris, les pages ressortant sur cette requête sont celles qui sont "mal linkées" (pour faire court aussi).
Le site parfait ne devrait pas avoir de résultat sur ce type de requête, c'est bien ça?
 
WRInaute passionné
Je pense que c'est difficile de n'avoir aucune page marquée résultats complémentaires, surtout sur un gros site avec un grand nombre de pages.

Mais une bonne structure de liage interne aide. Sur un site ayant + de 25% des pages en RC, en modifiant uniquement la façon de les lier, je suis tomber à ~7/8% assez rapidement, sans autre modification (apport de liens frais, blocage par robots.txt...)

Après avec ce genre de pages :
-http://www.magasins-paris.com/arrondissements/19/categories/vetements-femme/createur/
-http://www.magasins-paris.com/arrondissements/19/categories/vetements-femme/grand-couturier/

faut pas espérer de miracles non plus, il n'y a aucune raison qu'elles sorte de l'index complémentaire, parce qu'il n'y a aucune raison qu'elle soit même indexées, elles sont vides
 
WRInaute occasionnel
Donc, il vaudrait mieux que je fasse des 404 sur les pages qui n'ont pas de résultat. Ce qui en plus paraît plus "honnête" vis à vis des visiteurs.
Si tu me confirmes, je mets en place de suite (je pense que tu vas me confirmer, enfin, je l'espère...) :wink:
 
WRInaute passionné
La question n'est pas : faut-il renvoyer une 404 sur les pages vides ? La question c'est : Pourquoi créer des pages vides ?

-http://www.magasins-paris.com/arrondissements/19/

Tu sais que tu n'as pas de magasins dans le 19ème, mais tu créer une page pour le 19ème et pareil pour toutes ses séquelles (par marque, catégorie, par créateur...)
-http://www.magasins-paris.com/arrondissements/19/marques/A/

pourquoi les créer ?
En plus des AdSenses sur des pages vides, c'est moyen
 
WRInaute occasionnel
Les pages ne sont pas créées, mais générées à la volée.
Je ne vais pas commencer à mettre des exceptions (à la main) pour chaque page vide (bien que je puisse les détecter).
Ce que je vais faire, c'est générer des 404 pour les pages vides (histoire de les désindéxer), et transformer les liens vers les pages vides en texte, juqu'à ce qu'il y ait du contenu dans ces pages.
Non?
 
WRInaute passionné
chtipepere a dit:
Les pages ne sont pas créées, mais générées à la volée.

Oui, je me doute ;)
C'est bien les sites dynamiques, mais c'est bien aussi de pouvoir contrôler le contenu créé.

Sinon, si tu ne peux pas t'empêcher de les les générer, tu peux les bloquer via le fichier robots.txt
 
WRInaute occasionnel
Finalement, il ne faut pas que les pages soient présentes dans les moteurs, ni qu'elles existent (leur url doit donc renvoyer une 404) tant qu'elles n'ont pas de contenu.
Ca va ça?
 
WRInaute passionné
Une 404 est une page qui n'a pas été trouvée, ie, qui n'existe pas.
Donc c'est OK, mais il ne faut pas non plus qu'elles aient des liens qui pointent vers elles ou ton site sera plein de liens vers des pages inexistantes, ce qui n'est pas forcément bon non plus.
 
WRInaute impliqué
j'ai remarqué personnellement que lorsque les pages ont une balise meta description similaire, ou lorsque que le contenu en haut des pages est important et similaire, Google a tendance à placer les pages du site dans cet index secondaire.

Me trompe-je ?
 
Discussions similaires
Haut