Connaitre votre nombre réel de pages indexées !

Nouveau WRInaute
avec le foutoir de google en ce moment pas facile de connaitre lespages indexées de son site :

mais voici une solution

tapez sur la search box de google : site:lenomdevotresite.com *le*

n'oubliez pas le "*le*"
 
WRInaute occasionnel
Merci pour tes lumieres au combien efficaces Yves...
Ce que je demande c'est la différence reelle entre le fait de mettre ou non *le*.

Vu la différence enorme des resultats proposés avec l'une ou l'autre commande, j'aimerais savoir ce que ca veut dire. Ou il a trouvé ca, ou de quelle maniere. Parce que "Pour connaitre le reel nombre de pages indexées" c'est un peu court.
Je me dis, et pourquoi le nombre reel ne serait pas obtenu avec la commande site: classique?
 
WRInaute accro
En fait il semble que cette commande *le* permette de faire le distingo entre :

- les pages répertoriées par Google mais pas encore vraiment indexées (elles apparaissent avec la commande site normale)
- les pages effectivement indexées (celles qui surviventavec le *le*)

Vous pouvez tester sur mon www ou c'est dans un rapport de 1 a 10 vu que le site est en pleine reindexation suite a son transfert free --> com et vous verrez que toutes les pages sans texte disparaissent avec le *le*

Edit : A la réflexion et apres verif sur plusieurs site, ca ressemble a rien de ce que tu dis sahara ... sur un site assez ancien avec des milliers de page indexées (et elle le sont bien vu les visteurs qu'elles apportent par google), avec la commande *le* il n'affiche de 50 pages !!! Et vu les pages, ca ressemble plus à un lot de "dernieres pages indexees" ... le mot "dernières" changeant tout ...

sahara, si tu peux expliquer ce que *le* fait a ton avis ?
 
WRInaute discret
visiblement de mettre juste "*" suffit

site:url *

la différence que je verais et que dans le cas sans étoiles ça liste toutes les urls qu'ils ont dans leur base sans distingo de texte référencé ou pas alors qu'avec une étoile ça fait une recherche des pages référencées AVEC un contenu...
 
WRInaute accro
smrhp a dit:
visiblement de mettre juste "*" suffit

site:url *

la différence que je verais et que dans le cas sans étoiles ça liste toutes les urls qu'ils ont dans leur base sans distingo de texte référencé ou pas alors qu'avec une étoile ça fait une recherche des pages référencées AVEC un contenu...
Non cela N'EST PAS le spages indexées ... fait le test avec ce site :

site:beaute.webduluxe.free.fr

avec et sans *le*

Les 50 pages qui résistent sont des pages qui n'existaient même pas dans la premiere phase du site ... donc je persiste a dire que ce sont probablement simplement les dernieres pages indexées
 
WRInaute accro
Eu, sur le peu de test que j'ai fait, le "site:url *le*" affiche les pages de url contenant le mot "le" ou un mot approché (enfin je ne sais plus trop comment Google gère les *), normal quoi.

Après il est vrai qu'il y a des très fortes probabilités pour que toute page avec du contenu contienne "le", mais ce n'est pas une généralité, enfin je ne suis pas trop convaincu :lol: ...
 
WRInaute accro
Surprenant, j'ai une énorme différence entre mon site:monannuaire
(où pas de cache et rien que la ligne url) alors qu'avec
site:monannuaire*le* apparait 2x plus de réponses, et les métas descriptions, cela voudrait dire que google serait en train d'indexer mes pages correctement.
C'est une trouvaille (pour moi spectaculaire ;) )
 
WRInaute accro
wullon a dit:
Eu, sur le peu de test que j'ai fait, le "site:url *le*" affiche les pages de url contenant le mot "le" ou un mot approché (enfin je ne sais plus trop comment Google gère les *), normal quoi.

Après il est vrai qu'il y a des très fortes probabilités pour que toute page avec du contenu contienne "le", mais ce n'est pas une généralité, enfin je ne suis pas trop convaincu :lol: ...
Bingo c'est bien cela :

test fait avec

site:ruesdemaville.com *angers*

(le site a 100.000 pages environ ... et regardez les 14 pages trouvees ...)
 
WRInaute accro
Zecat tu sembles avoir raison pour ton exemple, mais pourquoi autant de différence entre : -site:www.smilchat.net 1350
-site:www.smilchat.net*1350*
(1350 est l'ancien nombre de smileys, donc dans l'ancienne version du site , il devrait y avoir aujourd'hui beaucoup moins de pages dans google puisque, ces pages n'existent plus)
 
WRInaute discret
Zecat a dit:
smrhp a dit:
visiblement de mettre juste "*" suffit

site:url *

la différence que je verais et que dans le cas sans étoiles ça liste toutes les urls qu'ils ont dans leur base sans distingo de texte référencé ou pas alors qu'avec une étoile ça fait une recherche des pages référencées AVEC un contenu...
Non cela N'EST PAS le spages indexées ... fait le test avec ce site :

site:beaute.webduluxe.free.fr

avec et sans *le*

Les 50 pages qui résistent sont des pages qui n'existaient même pas dans la premiere phase du site ... donc je persiste a dire que ce sont probablement simplement les dernieres pages indexées

ben oui... mais ce que je dis c'est que tu peux mettre "*" à la place de "*le*" ça fait pareil !

et que la différence que je vois dans les pages qui résistent c'est que par exemple :
http://beaute.webduluxe.free.fr/ALPHA/b ... R-M015.htm

n'a pas l'air d'avoir de texte référencé chez eux (aucune description ou extrait de texte dans le sommaire du résultat google) alors que la seule page qui reste affiché est celle avec du texte quand on met "*"
 
WRInaute discret
Zecat a dit:
wullon a dit:
Eu, sur le peu de test que j'ai fait, le "site:url *le*" affiche les pages de url contenant le mot "le" ou un mot approché (enfin je ne sais plus trop comment Google gère les *), normal quoi.

Après il est vrai qu'il y a des très fortes probabilités pour que toute page avec du contenu contienne "le", mais ce n'est pas une généralité, enfin je ne suis pas trop convaincu :lol: ...
Bingo c'est bien cela :

test fait avec

site:ruesdemaville.com *angers*

(le site a 100.000 pages environ ... et regardez les 14 pages trouvees ...)

ben oui ! sur google on peut chercher avec l'étoile... donc avec site ça filtre les pages contenant *bidule* au sein d'un mot...

avec "*" tout court, ça te prendra toutes tes pages avec contenu référencées, je pense... et effectivement, des url où google semble avoir eu du mal à avoir pigé le contenu sont quand même listée... sûrement celles que le robots à dans sa todolist à explorer pour les décortiquer ;)
 
WRInaute accro
oui ca semble etre un "sous produit" ....

la fonction *xxx* sert a afficher pages du site contenant le mot xxx et si xxx est vide alors ca affiche le spages qui contiennet "quelquechose" (vu sous l'angle de l'index google)

Je dis le mot xxx parce que c'ets pas une recherche full-text sur une chaine (un morceau de mot) mais bien sur des mots entiers.
 
Nouveau WRInaute
OUi les mais vous avez presque les bonne réponces !

le "*le*" permet simplement de voir les pages indexées mais pas encore visiblent au visiteurs !

le "*le*" permet de cherche toutes les pages ou pourais exister un "le" qui est utilisé dans presque toutes les pages (le maroc, le football...)

le "*le*" peut être remplacer par * simplement ;)
 
Nouveau WRInaute
je retire ce que j'ai dit en partie !!

le "*le*" c'est ce qui marche le mieu l'utilisation de * uniquement
ne permet pas d'avoir toutes les pages ( une différence de 20000 pour moi en tous cas )

donc utilisez site:lenomdevotresite.com *le* c'est top
 
WRInaute accro
12.000 résultats:
Code:
site:www.example.com *

12.000 résultats:
Code:
site:www.example.com *le*

9.525 résultats:
Code:
site:www.example.com -dezkablu

la première c'est "toutes les pages du domaine" et tout
la seconde c'est "toutes les pages du domaine" sauf terme "dezkablu"
la seconde c'est "toutes les pages du domaine" et terme "le" et tout (ce qui ne veut rien dire...)
 
Nouveau WRInaute
site:www.example.com *

il faut tester
Code:
site:www.example.com *
et
Code:
site:www.example.com *le*
sur plusieurs sites avant de voir qu'il ya une grande différence amigo ;)

Pour l'un de mes sites par exemple site:www.example.com * affiche 30% moin de résultats que site:www.example.com *le* :roll: [/code]
 
Nouveau WRInaute
Selon mes analyse la google dance et pour bientôt ! dites moi que je me trompe ;)

Car le "*le*" sert pour voir les nouvelles pages qui serons integrées dans l'indexe google aprés la google dance !
 
WRInaute occasionnel
en fait site:url ne donne pas toutes les pages depuis quelques temps.
site:url xxx donnes toutes les pages répondant à la recherche xxx même celles ne figurant pas dans site:url.

je crois que les pages en plus sont des pages "en cours d'indexation"
 
WRInaute discret
pour moi :

site:domaine.tld 649 pages
site:domaine.tld -sdfghfds 649 pages
site:domaine.tld *le* 93 900 pages :d

ca fait une sacré difference non ??
 
WRInaute discret
Dites-moi si je me trompe. La requête :
site:www.lesite.com wri
est une interrogation de la base de données Google pour demander tous les documents inclus dans la BD contenant le mot clé "wri".

J'ai bon ou pas ? (car dans tous les posts que j'ai pu lire ici, cela ne semble pas être précisé...)
 
WRInaute discret
allinurl:
est pour chercher uniquement dans l'url
"site:www.lesite.com wri" est pour chercher dans tout le document url comprise (selon mes observations mais je demande confirmation)
 
WRInaute accro
oui, tu as raison, j'avais interprété "tous les documents" comme "tous les fichiers"...

En gros si tu tapes "site:www.WebRankInfo.com echangens-liens" tu tomberas sur tous les topics ou tu as participé, plus les pages spéciales (liste de tes posts, ton profil, etc...)

NB: Evidemment avec ton pseudo les résultats peuvent différer :mrgreen:
 
WRInaute discret
Si vous faites de la réécriture d'url (rewriting) allinurl est vraiment très pratique pour vérifier son job dans la bd Google, surtout quand le site a plusieurs milliers de pages ;-)
Un outil sert à qui en a besoin et allinurl est très apprécié...
 
WRInaute occasionnel
Salut, pour ma part :
(tout en "web")

site:example.com
32400 réponses

site:example.com *le* :
18300 réponses

site:example.com *la* :
32200 réponses

site:example.com -troudibou :
32200 réponses

Ce que je constate là dedans : toutes les pages en duplicate disparaissent avec *le* ...
 
WRInaute accro
Pour moi :

site:www.monsite.ne= 52800
site:www.monsite.ne *le* = 23200
site:www.monsite.ne *la* = 23300

allinurl:monsite.ne site:monsite.ne = 52800
allinurl:monsite.ne = 52800
"monsite.net" = 55400

Il peut même m'en faire 100 000, si elles ne sont pas en première page cela ne sert pas à grand chose :-D
 
WRInaute accro
Vell a dit:
Ce que je constate là dedans : toutes les pages en duplicate disparaissent avec *le* ...
c'est normal, n'ayant pas de contenu, elles ne sortent pas sur ce genre de requètes ...

au fait "site:ndd.com *le*" revient tout simplement à rechercher toutes les pages du dmiane "ndd.com" qui contiennent un mot avec "le" dedant (quel que soit le début ou la fin du mot) ... :wink:
 
WRInaute occasionnel
Merci pour la précision Cendrillon.
Logique donc les résultats différents vu que les pages en question ne contiennent pas forcément "quelque chose le quelque chose".
 
WRInaute discret
Perso sur recherche web :
site:www.p***s.com = 795
site:www.p***s.com * =9340
site:www.p***s.com *le* =9340

Bon ce que je peux dire aussi c est que j ai des pages aved des id
catalog/popup_image.php?pID=536
et que gg dans la recherche
site:www.p***s.com
ne les met pas toutes alors que
site:www.p***s.com *
les comprend toutes .
Si ca peut aider....
 
Discussions similaires
Haut