692000

WRInaute occasionnel
GG est toujours d'une précision quand aux résultats ... mais parfois j'ai tout de même quelques doutes sur sa précision réelle.

quand on fait une recherche sur gg avec les backlink sur yahoo... pile poile 692000 tout rond...

Si cela amuse quelqu'un à vérifier les 692000 liens vers yahoo... pas de souci... mais statistiquement cela métonne un peu... non ?

Pendant qu'on y est ... les erreurs 404 .... il y en a aussi ... faites une recherche par exemple sur loft story (le groupe de planqué, dont plus personne ne parle (ou presque)) un lien sur deux HS...

Alors je me pose une question meta physique... est ce que ca vaut le cout que je m'achete 10.000 ordinateurs, 150 mb de bande passante pour faire de deepindex le gg français, juste pour pouvoir annoncer 3.000.000.000 de pages dans mon index...?

Bon je crache sans doute un peu de venin, un grain de jalousie peut etre, quoiqu'il en soit je l'aime bien quand même et je l'utilise aussi comme beaucoup d'entre vous... mais parfois je trouve les ricains pas aussi chirugicale que cela... en tous les cas je ne suis pas sur de vouloir aller dans leur hopitaux...

C'etait la pensée du jour...
 
WRInaute passionné
:?:
Ils pourraient bien afficher 692821 que ce serait pareil... on ne peut accéder qu'aux 1000 premiers. :lol:
 
WRInaute occasionnel
je suis bien d'accord avec toi. Mais tu es sans doute d'accord avec moi que derrière gg c'est de l'informatique... et à priori, sauf dans certains cas, que seul MSoft connait bien, l'informatique est précise.

Que l'on ne puisse voir que les 1001 premiers résultats... sur le fond c'est bien... mais ... ca me laisse perplexe quand même... pas vis à vis de deepindex... mais vis à vis de gg lui même.

Cela sous entend aussi, qu'il ne reindexe pas souvent sa base, et certainement pas complêtement, logique tu me dira aussi, ca ne vaut pas le cout... vu ce que l'on peut trouver dedans.

Mais tu vois ca me casse un peu l'image de précision que j'attachais à gg... et je trouve que ca vaut peut être le coup d'en discuter;.. ici ou au café... ;-)
 
WRInaute discret
Bonjour Gilbert,

Le degre de precision est aussi un facteur en informatique, corrigez moi si je me trompe mais compter en milliers permet de sauver dix bits inutiles. Multiplié par le nombre de queries que google met en cache chaque jour j'imagine que ca peut faire une difference interessante... 8O

Ben
 
WRInaute occasionnel
Vu sous cette angle... :) bien que le mot yahoo soit très recherché sur google :) sont ils vraiement pret à épargner pour quelques "mb" ?

... l'argument est certainement intéressant et d'une certaine manière logique, mais me laisse tout de même un peu sur ma faim... quand on regarde leur domination et suprématie...
 
WRInaute discret
pile poile 692000 tout rond...
Plus exactement, google écrit "of about 692,000"
Donc ce n'est qu'approximatif. Google doit penser que le commun des mortels se moque de savoir si il y en a 692,412, et ne donne qu'un ordre de grandeur.
Evidemment, pour ceux qui aiment la précision...

pour faire de deepindex le gg français
Non, il faut faire de Deepindex plus que cela! Google a pris de l'avance côté innovation, mais nous en France, on a pas de pétrole, mais on a des idées! :lol:

Je suis sur que la communauté francophone t'en a déja donné bcp, et continuera en voyant DeepIndex progresser et prendre une certaines plas des le paysage des outils de recherche francophones.

Pendant qu'on y est ... les erreurs 404 .... il y en a aussi ... faites une recherche par exemple sur loft story (le groupe de planqué, dont plus personne ne parle (ou presque)) un lien sur deux HS...

Pour ça, j'ai une idée, que j'ai déja mis en application, mais pour un moteur comme DeepIndex, ça peut demander des ressources conséquentes: vérifier a chaque clic vers une page le code qui est retourné dans l'entete HTTP. Si c'est 404, boom, tu vire la page, ou du moins tu la met de coté pour une réindexation prochaine...
Un moteur garanti sans erreurs 404, ça serait vraiment innovant!
 
WRInaute occasionnel
Salut David,

merci de ta proposition... je te reponderais en mp la dessus.


Ce que je n'aime pas en fait chez GG (mais je l'aime bien quand même) mais aussi chez d'autres outils... c'est leur prétention, leur manière de jetter de la poudre aux yeux...

Ce qui me gène aussi voir surtout c'est cette dépendance des uns et des autres vis à vis de gg et de ses danses. GG plante sa mise à jour... "la moitié du monde pleure" :)

Pour ce qui est de deepindex, il est incontestable, que l'on m'a beaucoup aidé et soutenu, sauf au tout début, et je l'espère que cela continuera ainsi... en particulier depuis wri... ceci dit ce n'est pas l'objet de ce forum consacré au GGBot.

Ce qui m'a "énervé" hier, ce que je regardais en bruit de fond m6 hier soir, et que ma femme et moi même on se disait, mais que ce sont devenu les "lofteurs" et les autres produits de la télé... Réaction de ma femme, tiens voyons sur internet... en allant sur gg... et la mauvaise surprise... 404, page datant de plus de deux ans, erreur 404 et autres ... Alors que la GGdanse devrait servir à cela... rentrer les nouvelles pages, sortir celles inexistantes...

Encore une fois ce n'est pas pour dénigrer GG et mettre en avant deepindex sur son dos...
 
WRInaute discret
Ce que je n'aime pas en fait chez GG (mais je l'aime bien quand même) mais aussi chez d'autres outils... c'est leur prétention, leur manière de jetter de la poudre aux yeux...

C'est l'inconvénient de sa position dominante: 59% sur le dernier baromètre Xiti/1ere Position!

J'ai mis ces derniers temps un sondage sur mon site: Pensez-vous qu'un nouveau moteur de recherche puisse supplanter Google en 2003?
Le oui affiche un score de 47%!
Pour moi c'est clair:
1) Certains internautes en ont marre de la suprématie de Google
2) Du coup, il y a de la place a prendre pour de nouveaux outils performants et novateurs comme DeepIndex!
 
WRInaute occasionnel
gg doit bien le faire de temps en temps le menage
j'ai un site chez wanadoo dont j'ai change une partie de l'url (perso.wanadoo.fr/antiquitesxxxxx est devenu perso.wanadoo.fr/bordeauxantiquites ) il y a 4 ou 5 mois et bien il n'existe plus dans la base google
la nouvelle url a pris la place
 
WRInaute occasionnel
Ca fait plaisir :p

Allez je vais dans mon magazin informatique préféré... m'acheter quelques machines... un peu de bricolage... et le tour est joué... non la je déconne.

En tous les cas ton sondage fait plaisir et conforte l'opinion/sentiment que j'avais quand à l'ouverture (pas l'overture) du marché... et franchement, que ce soit deepindex, now!, exalead,antidot, et quelques autres... j'aurais beaucoup de plaisir à ce que un français ou un belge ( :lol: ) sorte du lot...

Je conforterais aussi ton sondage... en effet j'en ai un peu discuté avec d'autres, ici, mais aussi à l'étranger (us/uk/...), et ils ont la même tendance...

quand à moi, yakafokon, je vais rajouter 24 h à ma montre, pour bosser encore plus et mieux, et d'offrir un outil peut etre pas parfait, mais plein de bonnes idées...

J'en rajoute une couche ? Dans le forum deepindex, il y a une rubrique "boite à idées"... n'hésitez pas, c'est fait pour.

En attendant, il reste une page ou deux à ajouter dans le poste sur la ggdanse pour battre le record... ;-)

Bonne journée à toutes et à tous...

Gilbert
 
WRInaute discret
Je ne suis pas intime avec les strateges de google, mais tout le monde le sait Google possede le plus gros index de tous les moteurs de recherche et cela lui donne tout de même une certaine notoriété. Tout cela pour dire que Google ne remet pas totalement sa base à jour peutèetre de maniére intentionnel pour lui permettre d'avoir chaque jour un peu plus de pages dans son index.

Ceci n'est qu'un avis personnel, mais si j'etais a la place de Google je ferais la même chose...
 
WRInaute discret
Je ne suis pas intime avec les strateges de google, mais tout le monde le sait Google possede le plus gros index de tous les moteurs de recherche et cela lui donne tout de même une certaine notoriété. Tout cela pour dire que Google ne remet pas totalement sa base à jour peutèetre de maniére intentionnel pour lui permettre d'avoir chaque jour un peu plus de pages dans son index.

Je suis d'accord avec toi, il n'est peut-être pas utile de rafraichir tous les jours toutes les pages de Google.
Je pense qu'un moteur devrait rafraichir sa base entierement au moins une fois par mois. C'est le miminum qu'on peut attendre d'un moteur. Mais ces derniers temps, sur Google, les mois ont tendance à allonger... 8O

Mais plus on a de données a gérer, plus elles sont difficilement manipulables... :?
 
WRInaute occasionnel
apocalx a dit:
Je suis d'accord avec toi, il n'est peut-être pas utile de rafraichir tous les jours toutes les pages de Google.
Je pense qu'un moteur devrait rafraichir sa base entierement au moins une fois par mois. C'est le miminum qu'on peut attendre d'un moteur. Mais ces derniers temps, sur Google, les mois ont tendance à allonger... 8O

Mais plus on a de données a gérer, plus elles sont difficilement manipulables... :?

Il n'est pas utile de reindexer toutes les pages tous les mois. Mais au vue de certaines pages trouvées dans gg... on ne parle pas en mois... :-C

D'autres part, gg devrait pouvoir détecter les errreurs 404 et autres... Lorsque je fais une indexation, je détecte aussi les codes reponses des serveurs...

Je suis vraiement perplexe quand à la methode de travail de gg....

Bon fo que j'aille bosser un peu... à plus tard...
 
WRInaute occasionnel
apocalx a dit:
2) Du coup, il y a de la place a prendre pour de nouveaux outils performants et novateurs comme DeepIndex!

ok pour avoir de nouveau moteur concurrent direct de google, mais je viens de faire un tour sur deepindex ... bah un moteur qui demande 29euros pour etre present dans la base face a d'autre comme gg ou c gratos ... mloi je dis non ... faut pas deconner ... tout deviens payant sur le web et c de l'abus!
 
WRInaute occasionnel
zehunter a dit:
bah un moteur qui demande 29euros pour etre present dans la base face a d'autre comme gg ou c gratos ... mloi je dis non ... faut pas deconner ... tout deviens payant sur le web et c de l'abus!

Ce n'est pas de l'abus ! C'est une participation aux frais nombreux dont la montre qui contient 48 heures dans une journée. Et contrairement aux autres payants :

L'indexation est pratiquement complete (pas une page, mais un site complet !)

Par ailleur, si tu as regardé correctement il existe aussi des passages (portes d'entrées) gratuits...
 
WRInaute occasionnel
Gilbert Wayenborgh a dit:
zehunter a dit:
bah un moteur qui demande 29euros pour etre present dans la base face a d'autre comme gg ou c gratos ... mloi je dis non ... faut pas deconner ... tout deviens payant sur le web et c de l'abus!

Ce n'est pas de l'abus ! C'est une participation aux frais nombreux dont la montre qui contient 48 heures dans une journée. Et contrairement aux autres payants :

L'indexation est pratiquement complete (pas une page, mais un site complet !)

Par ailleur, si tu as regardé correctement il existe aussi des passages (portes d'entrées) gratuits...

il est vrai qu'apres avoir bien regarde, je me suis referencer sur deepindex ... en anglais ... :-( .. pour les sites francais j'ai pas trouve de porte d'entrees .. en sont cahcees?

sinon je comprends qu'il faut rentabiliser la bete qu'est un moteur de recherche .. mais honnetement en parlant tout a leur de concurrence et d'une envie a 47% d'avoir autre chose que google, je trouve qu'un moteur de recherche qui fait son argent sur un referencement payant c illogique ...

selon moi je me dirais une chose simple:
tu veux que ton moteur soit populaire? bien fournis? qui rammene des resultat ? bah agis en sorte que tous les webmaster se reference sur ton site ... et si on peu le faire gratos, alors met le en avant car ca se vois pas du tout du tout ...

sinon j'ai rien contre ce principe mais d'avoir lu plus haut que deepindex pourrai remplacer gg ma fait rire sur le principe .... on peux pas cocurrencer le gratuit ...
 
WRInaute discret
Ah mon avis, ça doit etre un choix difficile:
-soit y a une soumission gratuite, et les webmasters sont contents, mais tu ténère peu de profits pour faire fonctionner ton moteur, et le faire progresser.
-soit tu met un soumission gratuite, les webmaster sont pas trop contents, mais tu peux continuer a faire grossir le moteur, et en plus ça doit limiter les ardeurs des spammeurs de formulaires de soumission...

Ca doit pas etre evident comme dilemne... 8O
 
Nouveau WRInaute
Il faudrait aussi pense a corriger ca :
Code:
Warning: Address is not in a.b.c.d form in /home/httpd/vhosts/deepindex.com/httpdocs/index.php on line 9
 
WRInaute occasionnel
apocalx a dit:
Ah mon avis, ça doit etre un choix difficile:
-soit y a une soumission gratuite, et les webmasters sont contents, mais tu ténère peu de profits pour faire fonctionner ton moteur, et le faire progresser.
-soit tu met un soumission gratuite, les webmaster sont pas trop contents, mais tu peux continuer a faire grossir le moteur, et en plus ça doit limiter les ardeurs des spammeurs de formulaires de soumission...

Ca doit pas etre evident comme dilemne... 8O

bah au mieux pour moi, je pense qu'une soumission gratuite et payante peuvent faire bon menage .. a savoir une indexation complete si tu paye et sommaire sinon .. de plus tu peux mettre en avant les site qui te paye par rapport aux autre (normal) ... et justifier encore plus de payer .. mais les sites qui debute et qui ont pas un rond (euh .. je parle de moi la ..vous aviez compris? :p) sont penaliser sur un moteur de recherche qui a pour but premier de trouver ce que vous chercher ... sinon c un club prive de membres d'un annuaire non???

voila mon avis .. sinon oui y a des soucis sur deepindex, je viens de les voir aussi ...
 
WRInaute passionné
Pour revenir "on topic", une réponse plausible serait que Google ne donne jamais plus de 3 chiffres significatifs sur ses réponses.

Le calcul des backlinks ou le nombre de pages donnent toujours ce même niveau de précision (ou d'imprécision :wink: ).

Que ce soit avec:
Code:
allinurl:www.yahoo.com
link:www.yahoo.com
site:www.yahoo.com -xxyyzzut

Cela marche aussi avec des sites ayant moins de pages dans l'index, mais tout aussi célèbres, WebRankInfo par exemple ! :lol: (ou le mien!)

Dan
 
WRInaute occasionnel
Je me doute bien que à partir d'un certain niveau on arrondissent... je vais faire pareil ;-)
il ne s'agissait par ailleurs de parler du chiffre en soit, de la dépendance de gg, et pas de deepindex, il y a comme qui dirait un petit dérappage...

assez dérappé... je retourne sur l'autre post qui doit être à la douzieme page... ;-)
 
WRInaute impliqué
Quelques questions/remarques :

D'accord avec Dan sur la "notion d'arrondi" des 692000 BL, cela ne concerne pas que Yahoo, mais tous les sites, la notion d'arrondi intervient au millier.

Link: est une commande et non une simple query, et son résultat ne varie pas d'une Dance à l'autre. On peut donc supposer que Google le connait et ne le recalcule pas. Donc pourquoi cette arrondi ?

La limitation technique ne me semble pas tenir debout pour une commande (pour une query, à la rigueur, puisque l'index est toujours différent, et encore !).

En plus, Google sait être précis lorsque il le souhaite : sur les réponses < 1000, c'est le cas et cela semble confirmé par les API qui fournissent un code en retour (<EstimateIsExact> - A Boolean value indicating that the estimate is actually the exact value) indiquant si le résultat est estimé ou pas.

Le mot "environ" est fixe dans la "Statistics Bar" de Google, que le résultat soit juste ou pas, on peut donc presque en déduire que c'est "volontaire" de leur part.
 
Olivier Duffez (admin)
Membre du personnel
de toute façon concernant cet opérateur link:, il est évident depuis longtemps que Google le bride. AMHA ils pensent que le reverse coding serait trop simplifié s'ils fournissaient trop d'infos (car je pense que le PR ne dépend que des liens pris en compte par Google)
 
WRInaute occasionnel
WebRankInfo a dit:
de toute façon concernant cet opérateur link:, il est évident depuis longtemps que Google le bride. AMHA ils pensent que le reverse coding serait trop simplifié s'ils fournissaient trop d'infos (car je pense que le PR ne dépend que des liens pris en compte par Google)

Y aurait-il de la parano chez gg ?? Au cas ou quelqu'un découvrirais quelque chose ?
 
Olivier Duffez (admin)
Membre du personnel
ce n'est que mon humble avis...
d'ailleurs je me demande ce qu'en pensent ceux qui sont assez motivés pour faire des tests approfondis sur les requetes dans Google : pourquoi Google ne permet d'afficher que 50% des résultats indiqués par la requete link ? Et quand je dis 50%, c'est souvent exactement la moitié... J'ai souvent donné mon avis là-dessus mais peut-être que certains ont leur propre idée ?
 
WRInaute occasionnel
comme je suis d'une humeur massacrante, comme d'hab quand je poirotte pour que gg danse avec moi...

hypothèse 1: GG n'a que 1.500.000.000 de pages au lieu de 3...
hypothèse 2: GG gère une grosse base de données et envoi une partie de la requete dans le cache, afin d'économiser des ressources sytèmes (ce qui serait assez logique)

Cependant l'hypothèse 2 n'est pas valide car à priori ce type de recherche (link:) n'est utilisé que par des gens qui connaissent et que se traccassent pour leur backlink. L'utilisateur moyen n'utilise pas des commandes un peu spécifique. donc il n'y pas de raison d'impliquer grandement le cash, à moins d'économiser sur le cash sur ce type de requete pour le réserver au cash standard...


J'ai encore d'autres hypothèses, mais je les sortirais seulement si la danse n'est pas bonne... bon en attendant cette danse, je vais me piquer un petit roupillon
 
Haut