|
Voir le sujet précédent :: Voir le sujet suivant
|
| Auteur |
Message |
| |
|
WebRankInfo Administrateur du site

Inscrit le: 19 Avr 2002 Messages: 13854 Localisation: Toulouse
|
Posté le : Mar Oct 15, 2002 23:10 Sujet du message: nouvel outil : calcul d'indice de densité |
|
|
Voilà la version beta (version de test) tout juste sortie...
Je vous laisse l'essayer et me lister tous les problèmes que vous rencontrez.
N'hésitez pas non plus à faire des remarques, cet outil sera le vôtre alors autant qu'il corresponde à vos besoins
http://www.webrankinfo.com/outils/indice-densite.php |
|
| |
|
 |
Mirgolth WRInaute passionné

Inscrit le: 14 Oct 2002 Messages: 618 Localisation: Variable - Wifi 802.11g Powered
|
Posté le : Mer Oct 16, 2002 9:38 Sujet du message: nouvel outil : calcul d'indice de densité |
|
|
Petit pb de gestion des erreurs:
Je me suis trompé en tapant mon URL et j'ai eut les warning suivant :
Warning: php_network_getaddresses: getaddrinfo failed: Name or service not known in /home/webranki/www/lib/indice-densite.lib.php on line 86
Warning: file("http://ldvelh.free/fr/") - Bad file descriptor in /home/webranki/www/lib/indice-densite.lib.php on line 86
Warning: Bad arguments to join() in /home/webranki/www/lib/indice-densite.lib.php on line 86
Warning: php_network_getaddresses: getaddrinfo failed: Name or service not known in /home/webranki/www/lib/strings.lib.php on line 94
Warning: get_meta_tags("http://ldvelh.free/fr/") - Bad file descriptor in /home/webranki/www/lib/strings.lib.php on line 94
Mirgolth
L'encyclopédie des Livres dont vous êtes le Héros |
|
| |
|
 |
Julien WRInaute discret

Inscrit le: 04 Sep 2002 Messages: 66 Localisation: Paris
|
Posté le : Mer Oct 16, 2002 11:15 Sujet du message: nouvel outil : calcul d'indice de densité |
|
|
J'ai effectué un test simple avec
url: http://www.lnf.fr
mots: untitled document (qui n'apparait q'une unique fois dans le titre)
résultats:
Global Titre Description Page
untitled 14.3% 50.0% 0.0% 9.1%
document 14.3% 50.0% 0.0% 9.1%
untitled document 4.08% 50.00% 0.00% 1.65%
les résultats devraient plutot être:
Global Titre Description Page
untitled 14.3% 50.0% 0.0% 0%
document 14.3% 50.0% 0.0% 0%
untitled document 4.08% 100.00% 0.00% 0%
car ces 2 mots n'apparaissent jamais dans la page (entre les balises body)
je crois que tu as oublié de diviser par {nombre mots total - nombre de mots cherchés} comme l'avait expliqué jeanNo avant.
Sinon, ça marche assez bien, c'est encourrageant!
Julien |
|
| |
|
 |
WebRankInfo Administrateur du site

Inscrit le: 19 Avr 2002 Messages: 13854 Localisation: Toulouse
|
Posté le : Mer Oct 16, 2002 12:48 Sujet du message: nouvel outil : calcul d'indice de densité |
|
|
| OK je regarderai dès que possible pourquoi j'obtiens ces résultats... |
|
| |
|
 |
WebRankInfo Administrateur du site

Inscrit le: 19 Avr 2002 Messages: 13854 Localisation: Toulouse
|
Posté le : Mer Oct 16, 2002 23:16 Sujet du message: nouvel outil : calcul d'indice de densité |
|
|
| Julien a écrit: |
| je crois que tu as oublié de diviser par {nombre mots total - nombre de mots cherchés} comme l'avait expliqué jeanNo avant. |
J'ai corrigé le pb sur le calcul de la partie "body", par contre je ne comprends pas pourquoi tu veux diviser par autre chose que le nombre de mots total ?
j'ai relu notre discussion sur http://www.webrankinfo.com/forums/viewtopic.php?t=308&postdays=0&postorder=asc&h...
prenons l'exemple du calcul de l'IDM de "document" pour http://www.lnf.fr/
il apparait 1 fois dans le titre, sur 2 mots.
Son IDM est donc 1! * 1 / 2 = 0.5 = 50%
Si tu divises par {nombre mots total - nombre de mots cherchés}, tu trouves 1! * 1 / (2-1) = 1 = 100% ce qui ne va pas !
par contre pour l'exemple "untitled document", je pensais trouver 100% mais le calcul donne : 2! * 0.5 * 0.5 = 0.5 = 50% |
|
| |
|
 |
Julien WRInaute discret

Inscrit le: 04 Sep 2002 Messages: 66 Localisation: Paris
|
Posté le : Ven Oct 18, 2002 12:05 Sujet du message: nouvel outil : calcul d'indice de densité |
|
|
ça dépend de ce que l'on cherche
soit "mot1 mot2" soit mot1 mot2 (pas d'ordre)
Dans le cas de l'ordre respecté, on avait établi que:
P("google référencement" | X) = {nombre de fois où "google référencement" apparait} / ({nombre total de mots} - 1)
qu'il faut limité à un nombre de mots >1
le 1 est en fait le nombre de mots recherchés - 1
soit la formule générale:
P("mot1 mot2 motN" | X) = {nombre de fois où "mot1 mot2 motN" apparait} / ({nombre total de mots} - {N-1} )
prenons l'exemple du calcul de l'IDM de "document" pour http://www.lnf.fr/
il apparait 1 fois dans le titre, sur 2 mots.
Son IDM est donc 1 / (2 - {1-1}) = 0.5 = 50%
par contre pour l'exemple "untitled document", le calcul donne :
1 / (2 - {2-1}) = 1 = 100%
La proba donnée par jeanNO correspond à un evenement different:
| Citation: |
| par contre pour l'exemple "untitled document", je pensais trouver 100% mais le calcul donne : 2! * 0.5 * 0.5 = 0.5 = 50% |
C'est la probabilité d'obtenir "untitled document" a partir de duplet { untitled, document } qui est bien 0.5, car l'autre unique possiblité de proba 0.5 est "document untitled"
on retouve donc bien somme (proba(evenement)) = 1 |
|
| |
|
 |
WebRankInfo Administrateur du site

Inscrit le: 19 Avr 2002 Messages: 13854 Localisation: Toulouse
|
Posté le : Ven Oct 18, 2002 13:01 Sujet du message: nouvel outil : calcul d'indice de densité |
|
|
| Julien a écrit: |
soit la formule générale:
P("mot1 mot2 motN" | X) = {nombre de fois où "mot1 mot2 motN" apparait} / ({nombre total de mots} - {N-1} ) |
C'est donc cette formule que je vais utiliser. Pour l'instant je divisais par {nombre total de mots}.
Vous avez trouvé d'autres problèmes avec cet outil ?
Vous avez des idées d'amélioration ? |
|
| |
|
 |
WebRankInfo Administrateur du site

Inscrit le: 19 Avr 2002 Messages: 13854 Localisation: Toulouse
|
Posté le : Ven Oct 18, 2002 19:37 Sujet du message: nouvel outil : calcul d'indice de densité |
|
|
en fait ce que je comptais proposer, c'est plutôt la version qui ne respecte pas l'ordre.
on avait parlé de cette formule :
P({mot1, mot2, ..., motn} | X) = n! {nbre mot1}.{nbre mot2}...{nbre motn} / {nbre total de mots}^n = n! IDM_mot1 * IDM_mot2 * ... * IDM_motn
mais apparemment ce n'est pas encore ça ? |
|
| |
|
 |
| |
|
|