Générateur d'expressions

  • Auteur de la discussion Auteur de la discussion KOogar
  • Date de début Date de début
WRInaute passionné
Après 2 lectures rapides et un essai, j'ai pas compris ce qu'était ton outil. Peux-tu éclaire ma lanterne ?
 
WRInaute impliqué
c'est le WE, j'dois pas être très en forme moi non plus... mais je voudrais bien en savoir plus egalement
 
WRInaute impliqué
C'est pour analyser une contenu et connaitre quels sont les mots qui ressortent le plus, ainsi que les expressions.
 
WRInaute accro
le form ne sert pas a grand chose et j'ai pas fait fort dans l'explication, mais l'algo lui peut etre fort utile.
Une application directe : (que je viens d'installer en 1 minute car l'algo est 100% portable)
http://www.phpsources.org/page-annuaire-cat-26.htm
(Voir: ressources - menu de gauche)

Me reste a ameliorer la gestion des doublons, de certain mots qui devraient etre bannis en debut d'expression. Je n'ai pas tenu compte des fin de phrase et ca se ressent. Mais dans l'ensemble, c'est encourageant. Je me suis basé sur le fait que les ressources a analyser sont de qualités. Si la pertinance de mon algo avance, je pense pouvoir liés des pages entres elles avec ce script de maniere intelligente.
 
WRInaute impliqué
un fois compris, je trouve cela bien interessant, tu parles de partager tes sources, c'est toujoujours d'actu ?
 
WRInaute accro
Vu le nbre de demande :
Envoyez moi un mail que je puisse vous transmettre le script:
ressourcesAROBASEphpsourcesDOT.org :D

Je l'aurais terminé mercredi (debut de semaine tjrs hyper busy), je veux le commenter un maximum pour que vous puissiez le parametrer sans difficulté et je voudrais encore supprimer les doublons au debut et a la fin des expressions trouvées. Pour avoir un algo encore plus pertinant :wink:
 
WRInaute passionné
Ok, je vois à peu près.
Il faudra que tu expliques quels traitements tu fais pour qu'on cerne un peu mieux les utilisations possibles. ;)
 
WRInaute passionné
Dommage que les mots anglais (comme The) ne soit pas automatiquement supprimé, car dans mon cas un site en français je cite beaucoup de titre en anglais et du coup The sort en tête.

Je pense que "ici" serait à bannir aussi.
 
WRInaute accro
>> Il faudra que tu expliques quels traitements tu fais pour qu'on cerne un peu mieux les utilisations possibles

c'est succin, mais c'est mon premier:

1° place tous les mots d'une chaine dans un tableau
2° enleve les mots bannis
3° groupe les mots identiques
4° compte et trie par ordre croissant des mots
5° NOYAU : cherche pour chaque mot l'expression qui lui appartient
6° NOYAU : dans mon code, je pointe sur le mot du texte original et je prend 1 mot devant et 2 mots derrriere pour une tentative de trouver une expression avec 4 mots.
7° FILTRE: enleve les mots bannis des expressions
8° FILTRE: enleve les doublons en debut et fin d'expression
9° FILTRE: enleve les doublons dans les expressions

>> Je pense que "ici" serait à bannir aussi.

oui bien sur... j'ai ajouté 40 mots anglais, let's have a look! :wink:
 
WRInaute accro
Un ptit up :D


Il manque la gestion des accents + la gestion de la ponctuation + la gestion de la semantique +++. Si l'un d'entre vous est interressé de poursuivre avec moi, je suis ouvert a toute suggestion.
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut