Petit script pour compter les mots

WRInaute passionné
Petit script pour compter les mots; j'ai vu des lignes sur un site anglais ... à tester sur
http://www.surf4all.org/compte.php
(avec -www.webrankinfo.com ca déconne.. je pige pas et avec mon site, ca déconne pas...)

le code est à mettre dans un fichier compte.php dans votre site:
Code:
<?php

echo "<h3>Compter les mots</h3>";

print "<form action=\"compte.php\" method=\"post\">";
echo "<input type=\"text\" name=\"site\" value=\"http://\" size=\"100\" maxlength=\"255\">";

print "<input type=\"submit\" value=\"Submit\"></form>";

if ($site)
{
$fp = fopen($site, "r"); 

$file= str_replace("&nbsp", " ", strip_tags(fread($fp, 100000)));
$file= str_replace("&quot", " ", $file);

$file=ereg_replace("[0-9]"," ", $file);

fclose($fp);



//compte les mots
$words_to_count = strip_tags($file);
$pattern = "/[^(\w|\d|\'|\"|\.|\!|\?|;|,|\\|\/|\-\-|:|\&|@)]+/";
$words_to_count = preg_replace ($pattern, " ", $words_to_count);
$words_to_count = trim($words_to_count);
$total_words = count(explode(" ",$words_to_count));

print "Il y a $total_words mots dans <a href=\"$site\" target=\"_blank\">$site</a>.<br>Les plus communs sont:";

$string = $words_to_count;

$arr = spliti("[^a-z0-9]+",$string);

$idx = array();
foreach($arr as $word) {
    trim($word);
    if(strlen($word)<1) continue;
    $word = strtolower($word);
    $idx[$word]++;
}

echo "<table>";

arsort ($idx);

foreach($idx as $word=>$cnt) {
if ($cnt >3 and strlen($word)>3){
    echo "<tr><td><a href=\"https://www.google.fr/search?sourceid=navclient&hl=fr&q=$word\">$word</a></td><td>($cnt)</td></tr>";
}
}

echo "</table>";

}

?>
 
Olivier Duffez (admin)
Membre du personnel
j'ai pas tout bien compris... qu'est-ce qui ne marche pas sur WRI ? Car je n'ai pas de script qui sert à compter les mots ? A part l'outil de calcul de densité, qui ne semble pas toujours marcher c'est vrai.

j'ai essayé ton outil, il me trouve seulement 54 mots sur www.webrankinfo.com
à quoi correspondent-ils vraiment ?
(j'avoue ne pas avoir examiné tout le code de ton script...)
 
WRInaute passionné
je me suis mal exprimé...
je ne dis pas que l'outil d'ici ne fonctionne pas, je dis que l'outil que je montre ne fonctionne pas si l'on rentre l'url de webrankinfo...
mais qu'avec mon url ca marche assez bien ( http://www.surf4all.org/compte.php?site ... rf4all.net ) ...
il y a des petites erreurs dans le script (les accents par exemple) et il prend les mots de 3 lettres et plus...

En conclusion, j'en parle si ya un webmaster qui veut offrir un outil en plus pour ses visiteurs... comme je n'avais jamais vu de code à ce sujet auparavant (j'ai jamais cherché non plus)
 
WRInaute passionné
ben il compte les mots qui ont au moins 4 lettes et qui ont été cités 4 fois...
if ($cnt >3 and strlen($word)>3){
faudrait seulement rajouter le truc pour prendre en charge les accents et voir pourquoi avec ton url ca déconne... ca peut faire un bon truc au final
 
WRInaute passionné
Il ne marche pas non plus sur mon site il bloque à la ligne 12 sur le fopen

Warning: fopen() [function.fopen]: php_hostconnect: connect failed in /home/surfall/www/compte.php on line 12


$fp = fopen($site, "r");
des problèmes de droits ? de fichier par défaut ? de configuration du serveur (ovh aussi) ?
 
WRInaute passionné
C'est rigolo ! Chez moi le mot le plus courant est "eacute" :lol:
"egrave" est pas mal non plus, ce qui fait que "immobilière" est comptabilisé une fois pour "immobili" et une fois pour "egrave".

C'est manifestement un script fait par un programmeur qui raisonne en "plain ASCII".

Dan
 
WRInaute passionné
absoluteweb>faut plus faire avec mon site car depuis ce matin mon hebergeur a coupé l'acces comme j'ai été à mes 15go de traffic mensuel.. et j'ai pas envie de les payer pour 1go en plus comme on est le dernier jour du mois... (je change d'hebergeur dans 10jours si tout va bien)

hetzeld>le code a été fait par un anglais... et vu que ya pas d'accents en anglais..


edit: ah oui au fait, j'ai le .net et .org
 
Nouveau WRInaute
faut plus faire avec mon site car depuis ce matin mon hebergeur a coupé l'acces comme j'ai été à mes 15go de traffic mensuel

J'hallucine y a des hébergeurs qui te coupe comme ca ton accés ! En tous ca c sur j'irais pas chez eux !
 
Nouveau WRInaute
merci j'avait vu :)
mais c'est à Mitirapa de décider si oui ou non on peut le publier sur notre site, question de principe.

A+
 
WRInaute passionné
ce script vient d'un module phpnuke et par conséquent tout le monde peut l'utilser..moi j'ai seulement viré des trucs avant et apres le script pour que ca marche sans phpnuke...

tu peux donc le réutiliser comme tu veux... (enfin à la sauce gpl)
 
Discussions similaires
Haut