test d'indexation

zarlboro

WRInaute occasionnel
Voici un test d’indexation que je développé pour tester le référencement de notre site, je l’ai un peu adapté, pour pouvoir vous en faire profiter. :

http://www.yagoort.org

Les tests ne sont exécutés qu’un par un (toutes les minutes avec une crontab) pour éviter que mon ip soit banni par Google.
(cf post : https://www.webrankinfo.com/forum/t/nombre-de-requete-google-maximum-par-minute.24375/ )
Cela génère donc une file d’attente…qui j’espère ne deviendra pas trop longue..

J’aimerais à partir des résultats de ce test générer un score unique en pourcentage, mais je sais pas trop quel poids donné à chaque critère dans le calcul du score.
Qu’en pensez vous?
 

Madrileño

Membre Honoré
L'ancien post n'existe plus sinon les sources du test et la manière dont tu fais cela sont disponibles ? :wink:
J'ai essayer de mettre un site il me l'enregistre pas ...
 

exoteric

WRInaute discret
Bonjour,

Ce ne marche pas non plus pour moi avec un .fr, je pense que tu attends une extension en 3 lettres et il considere la troisieme lettre (qui n'existe donc pas) comme un caractere interdit.

Eric.
 

zarlboro

WRInaute occasionnel
exoteric a dit:
Bonjour,

Ce ne marche pas non plus pour moi avec un .fr, je pense que tu attends une extension en 3 lettres et il considere la troisieme lettre (qui n'existe donc pas) comme un caractere interdit.

Eric.

effectivement y'a un problème avec les .fr qui rentre ne conflit avec le systeme de gestion de langue..
je m'en occupe..
 

Madrileño

Membre Honoré
Sympa sinon le site
itm.gif
(post effacer)
 

zarlboro

WRInaute occasionnel
Cela venait du fait que sur certains lien vers le cache dans les pages de resultats de google n'existe plus...
cela renvoyait une date en 1970.

ç'est ok maintenant.. j'ai relancé le test pour ocsima
 

WebRankInfo

Olivier Duffez (admin)
Membre du personnel
peux-tu préciser ce que tu appelles des liens "pertinents" ? ça a un rapport avec le filtre d'affichage ?
 

zarlboro

WRInaute occasionnel
Tout à fait!

Les liens pertinents sont le nombre de liens affiché avec filter=1

L'age moyen du cache est calculé sur les 100 premiers résultats. Le reste des chiffres sur toutes les pages de resultats (traités avec num=100)..

Je vais rajouter dans la journée ou ce soir le critère "Nombre de domaines différents" pour la commande link:
 

webbrain

WRInaute occasionnel
zarlboro a dit:
J’aimerais à partir des résultats de ce test générer un score unique en pourcentage, mais je sais pas trop quel poids donné à chaque critère dans le calcul du score.
Qu’en pensez vous?

Super outil, merci.
Pour le score unique, difficile d'uitliser un pourcentage a mon gout = il faudra que le score de 100% soit le site modèle, mais de quel site partiras tu ?
Il faudrait créer un indicateur qui n'existe pas (un peu comme les Yoovi de -Yooda.com). Difficile de donner un score, parce que tu devras dès lors justifier le poids des critères et cela sera plus discuté que l'outil lui-même.
Par contre, tu peux donner a titre indicatif des exemples pour des sites très connus / peu connus...
 

webbrain

WRInaute occasionnel
et peut etre aussi prévenir l'internaute que le rapport de l'adresse saisie sera visible de tout le monde (ou alors laisser le choix afficher le rapport ou non).

Tous les autres outils d'audit de referencement ne listent pas les requetes precedemment executées.
 

zarlboro

WRInaute occasionnel
webbrain a dit:
Super outil, merci.
Merci à toi
webbrain a dit:
Pour le score unique, difficile d'uitliser un pourcentage a mon gout = il faudra que le score de 100% soit le site modèle, mais de quel site partiras tu ?

Google, Yahoo, et les autre en PR10..


webbrain a dit:
Il faudrait créer un indicateur qui n'existe pas (un peu comme les Yoovi de -Yooda.com). Difficile de donner un score, parce que tu devras dès lors justifier le poids des critères et cela sera plus discuté que l'outil lui-même.

Pas de souçis pour discuter :wink:

webbrain a dit:
Par contre, tu peux donner a titre indicatif des exemples pour des sites très connus / peu connus...

Ce que je voudrais c'est trouver une formule qui sans utiliser le PR donne un resultat proche du PR dans la majorité des cas, rien qu'en utilisant les resultats de site: et link:
C'est clair que ça devrait pas marcher dans tous les cas, mais si on arrive à 70-80 % de reussite avec une marge de 1 PR ça serait cool!

je suis trop optimiste peut-être ? :idea: :?:
 

zarlboro

WRInaute occasionnel
webbrain a dit:
et peut etre aussi prévenir l'internaute que le rapport de l'adresse saisie sera visible de tout le monde (ou alors laisser le choix afficher le rapport ou non).

Tous les autres outils d'audit de referencement ne listent pas les requetes precedemment executées.

J'ai ajouter un avertissement en dessous du bouton "tester".

Tous le monde peut avoir ces chiffres pour n'importe quel domaine, et sans Yagoort..il n'y a donc rien de confidentiel dans ces rapports..

En plus effacer les raports enleverais du même coup le lien en dur vers le domaine testé qui s'y trouve dans chaque rapport :wink:
 

jeromek

Nouveau WRInaute
Bonne idée d'outil...
Je viens de tester avec un site client, et j'ai deux remarques:
1) le pagerank annoncé est de 0... j'ai comme un doute là...?
2) les délais de mise en cache : il ne correspondent pas à ce qu'on peut vérifier manuellement!
 

zarlboro

WRInaute occasionnel
jeromek a dit:
Bonne idée d'outil...
Je viens de tester avec un site client, et j'ai deux remarques:
1) le pagerank annoncé est de 0... j'ai comme un doute là...?

Aucune idéee pourquoi, mais la requête pour le PR donne quelque chose de different quand on l'appelle d'un browser ou d'un script PHP.
C'est pour ça que j'ai rajouter le lien avec à droite du PR avec le cheksum, pour verifier le PR affiché.
J'ai l'impression que ça vient du paramètre "client=navclient-auto" de la requête..
si quelqu'un à une idée...
en attendant j'ai mis une petite remarque à côté du PR :

http://www.yagoort.org/report/www.pages ... om.fr.html

jeromek a dit:
2) les délais de mise en cache : il ne correspondent pas à ce qu'on peut vérifier manuellement!

Donne un exemple que je regarde..parce que j'ai tester pas mal de fois et ça à l'air de correspondre..
Pour verifier manuellement il faut utiliser les paramètres num=100&filter=0 qui ne donne pas toujours la même chose que num=10&filter=0
 

zarlboro

WRInaute occasionnel
zarlboro a dit:
Je vais rajouter dans la journée ou ce soir le critère "Nombre de domaines différents" pour la commande link:

c'est fait, vous pouvez maintenant connaitre le nombre de domaine diiférents parmis les liens externes renvyés par la commande link:
 

togne

Nouveau WRInaute
merci beaucoup pour cet outil très efficace!

une question:
quand j'utilise le lien pour vérifier le PR grace au checksum je vois des valeurs de ce type:
Rank_1:1:7 Rank_1:1:6 Rank_1:1:6 Rank_1:1:3 Rank_1:1:3 Rank_1:1:3 Rank_1:1:4 Rank_1:1:5 Rank_1:1:4 Rank_1:1:6 Rank_1:1:5 Rank_1:1:3 Rank_1:1:3 Rank_1:1:3 Rank_1:1:4

il s'agit bien du PR en fonction du data center?
Et si oui comment expliquer de telles variations?
 

zarlboro

WRInaute occasionnel
togne a dit:
merci beaucoup pour cet outil très efficace!
c'est moi!

togne a dit:
une question:
quand j'utilise le lien pour vérifier le PR grace au checksum je vois des valeurs de ce type:
Rank_1:1:7 Rank_1:1:6 Rank_1:1:6 Rank_1:1:3 Rank_1:1:3 Rank_1:1:3 Rank_1:1:4 Rank_1:1:5 Rank_1:1:4 Rank_1:1:6 Rank_1:1:5 Rank_1:1:3 Rank_1:1:3 Rank_1:1:3 Rank_1:1:4

il s'agit bien du PR en fonction du data center?

je ne pense pas, je pencherais plutôt pour le PR des différente pages de ton site, mais une confirmation d'un spécialiste ne serait pas inutile :wink:
 

togne

Nouveau WRInaute
Alors, est ce qu'un spécialise a la réponse?
A quel PR correspondent ces valeurs: les valeurs des PR selon les différents datacenters, ou les PR de diverses pages?
 

zarlboro

WRInaute occasionnel
J'ai trouvé pourquoi le script ne trouve le PR de ton site.

Pour récuperer le PR j'utilise dans le script :

https://www.google.com/search?client=nav ... france.com

avec le info: devant l'url.

Par contre dans le rapport j'avais oublié le info: du coup ça renvois pas la même chose :
https://www.google.com/search?client=nav ... france.com

Et je crois même que les pageRank affichés sont ceux des resultats de la requete q="http://www.page-france.com", je pense ça parce que si tu enleve le paramètre features=Rank, tu obtient une sortie XML avec le resultat de cette recherche et pour chacun le PR, ça à l'air intéressant comme renseignement :

https://www.google.com/search?client=nav ... france.com

toujours à confirmer par un spécialiste
:wink:
 

togne

Nouveau WRInaute
je reste intéressé pour comprendre la signification des diférents valeurs indiquées sur ces lignes:
Rank_1:1:7 Rank_1:1:6 Rank_1:1:6 Rank_1:1:3 Rank_1:1:3 Rank_1:1:3 Rank_1:1:4 Rank_1:1:5 Rank_1:1:4 Rank_1:1:6 Rank_1:1:5 Rank_1:1:3 Rank_1:1:3 Rank_1:1:3 Rank_1:1:4


j'ai tendance a penser que c'est la valeur du PR trouvée grace au checksum mais je n'en suis pas sur
et je n'arrive pas a vérifier car l'outil d'Olivier permettant de determiner le PR par le checksum ne fonctionne pas (chez tout du moins).

Quelqu'un aurait il une réponse?
 

zarlboro

WRInaute occasionnel
ce que je te disais c'est que je pense que quand tu ne met pas

q=info:URL_DU_SITE

mais juste

q=URL_DU_SITE

c'est pas le PR de URL_DU_SITE que tu obtiens, mais les PR des 10 premiers résulats google pour une recherche classique avec q="URL_DU_SITE"
si ton site est premier pour cette requete ça serait bien ton pr sinon non.

Dans ton cas je n'ai aucune idée pourquoi on obtient un forbidden quand on utilise info: ce qui empeche au script de trouver ton PR.
si je change le script pour enlever le info: je ne serais plus sur d'avoir le PR pour les autres, donc vaut mieux que je laisse ainsi pour l'instant...
 

WebRankInfo

Olivier Duffez (admin)
Membre du personnel
zarlboro, tu peux même mettre q=DES MOTS CLES au lieu de l'URL
et là... surprise :) (attention, ceci est un scoop mondial)
 

zarlboro

WRInaute occasionnel
:) merci du scoop...

Je parlais bien sûr en combinaison avec les parametres :

features=Rank&ch=checksum&q=URL_DU_SITE

sinon ça fait une reqûete classique bien entendu!
 

zarlboro

WRInaute occasionnel
:)
très intéressant!

cette commande peut même s'utiliser en combinaison avec start=N
si le site qu'on recherche n'est pas en première page!
et pour moi aussi ça donne un PR de 5 alors que que je suis à 4 dans googlebar.

Y'a des chances que ce soit le futur PR...?

ce que tu disais tout à l'heure c'est quand calculant le checksum pour un mot je peux donc avoir la même chose pour n'importe quel mots clé! ca serait génial! du xml avec en plus les PR et sans API google!

la j'ai plus temps, mais je sais ce que vais tester cette nuit :)
 

WebRankInfo

Olivier Duffez (admin)
Membre du personnel
Effectivement comme le dit olivieri, nous tenons effectivement un scoop (mondial j'ai l'impression, mais bien entendu j'ai pu rater un épisode)

d'ailleurs ce serait mieux d'ouvrir un nouveau fil, tu t'en charges olivieri ? dans le forum "PageRank"
 

fredwat

WRInaute accro
@zarlboro
très sympa ton outil :)
Merci
Ne penses tu pas risquer des ennuis auprès de GG
Je m'explique: en voulant vérifier le "pr" sur le rapport je suis tombé sur une page 'forbidden" :?
J'espère que non en tout cas..
Fred :wink:
 

zarlboro

WRInaute occasionnel
fredwat a dit:
@zarlboro
très sympa ton outil :)
Merci
merci :wink:
fredwat a dit:
Ne penses tu pas risquer des ennuis auprès de GG
j'espère que non c'est pour ça que j'ai mis une file d'attente

fredwat a dit:
Je m'explique: en voulant vérifier le "pr" sur le rapport je suis tombé sur une page 'forbidden" :?
J'espère que non en tout cas..
Fred :wink:

dans ce cas y'a rien à craindre pour moi puisque que c'est toi qui lance la requête :wink:
 

zarlboro

WRInaute occasionnel
:D
ben moi j'ai un souçis!
google à banni mon ip..ça m'est déjà arriver ça devrait rentrer dans l'ordre dans quelques heures..
 

Olargues

WRInaute passionné
Absolument, je me joins a mes camarades, c est un excellent outil, simple a utiliser, convivial, sans publicite ca c est bon, ca fait du bien aux yeux.
Merci beaucoup de partager ton outil avec nous !

Une petite question: comment tu determines le pourcentage de liens pertinents et d abord qu est ce qu un lien pertinent, je veux dire dans ta definition ou celle de Google, merci
 

zarlboro

WRInaute occasionnel
zygomar a dit:
Absolument, je me joins a mes camarades, c est un excellent outil, simple a utiliser, convivial, sans publicite ca c est bon, ca fait du bien aux yeux.
Merci beaucoup de partager ton outil avec nous !

Encore merci à toi! je suis flatté :lol:
c'est un plaisir de le partager, il n'aurait pas était possible sans d'autres qui partagent!

zygomar a dit:
Une petite question: comment tu determines le pourcentage de liens pertinents et d abord qu est ce qu un lien pertinent, je veux dire dans ta definition ou celle de Google, merci

quand tu fait une recherche Google et que tu vas à la dernière page, tu as lien en bas qui te permet d'afficher encore plus de pages.. celles que Google ne considèrent pas comme pertinentes.
En fait quand tu clique sur ce lien ça fait simplement rajouter un filter=0 à la fin de l'url, ce qui pour effet de desactiver le filtre.

EDIT : dès que j'ai un peu de temps je rajouterais une page avec l'explications de tous les chiffres.
 

Bobez

WRInaute impliqué
Malgré plusieurs utilisations de ton site, je ne t'ai même pas encore félicité :wink: Bravo !
 

Nodh1

WRInaute discret
Merci pour ces fonctionnalités. Je débute là dedans, ca m'aide un peu à savoir où j'en suis (c'est pas glorieux...)

Bonne continuation et merci
 

Discussions similaires

Haut