Critère qualitatif proposé : la richesse lexicale

Discussion dans 'Référencement Google' créé par Jean-Yves Willmann, 21 Octobre 2008.

  1. Jean-Yves Willmann
    Jean-Yves Willmann WRInaute discret
    Inscrit:
    16 Mars 2007
    Messages:
    82
    J'aime reçus:
    0
    Innovation qualitative proposée (à Google et Cie) : un bonus pour la richesse lexicale !

    Bonjour à tous,

    Je suppose qu'il doit être possible de proposer à Google and Co des innovations pour améliorer encore leur pertinence et j'imagine que certains d'entre vous savent comment les contacter à cet effet.

    C'est pourquoi je vous invite à suggérer à (au moins) Google et Yahoo d'intégrer un nouveau critère dans leurs calculs, cette fois-ci qualitatif (ce qui nous changera du tout quantitatif...) : la richesse du vocabulaire.

    En effet, s'il peut paraître difficile de juger de la qualité d'un texte, surtout pour un robot, il y a tout de même cet élément objectif : sur cent mots, combien de mots différents ?

    Par exemple, sur les trois paragraphes ci-dessus il y a justement... 100 mots. [Je compte pour un mot : "qu'il", "s'il" ; pour deux mots : "fois-ci".] Et sur ces 100 mots, j'en ai comptés environ 80 différents. Admettons que ce soit un pourcentage assez bon pour un très court texte. Mais bien sûr, plus le texte sera long, plus certains mots reviendront, et donc plus le pourcentage baissera (à qualité de texte égale). Ce nouveau critère, s'il était un jour adopté, devrait donc prendre la forme d'un pourcentage variable (selon la longueur du texte), une sorte de courbe qui s'aplanirait de plus en plus à mesure que le texte s'allonge – un peu comme la courbe de poids moyenne d'un bébé pendant les premières années, sauf qu'ici au lieu de poids moyen il serait question de diversité des mots – ce qui permettrait de donner un petit bonus à ceux qui s'en approchent ou un petit malus à ceux qui s'en écartent trop.

    Google aurait ainsi la faculté de juger – objectivement ! – que cette phrase :

    [Diversité lexicale : environ 97 %]

    est sans doute de meilleure qualité que celle-là :

    [Diversité lexicale : environ 58 %]

    …et qu'il doit donc un peu mieux noter la première.

    --------------

    Pourquoi est-ce que je propose ça ? Parce qu'actuellement la richesse lexicale, hélas, pénalise... Si vous dites "voiture" puis "automobile" puis "moyen de locomotion" puis "véhicule" puis "ma Peugeot" puis "ma charrette", vous ne serez positionné nulle part ; tandis que celui qui écrit 36 fois "voiture", sous réserve de ne pas dépasser un certain plafond d'occurrences, sera beaucoup mieux positionné que vous à [voiture]. En somme, on est obligé de restreindre son vocabulaire (en fait de répéter toujours les mêmes mots) pour gagner des places, ce qui tend à beaucoup appauvrir toutes les langues du monde, à tirer le niveau vers le bas à l'échelle planétaire !

    Le nouveau critère que je propose permettrait donc de contrebalancer un peu tout cela.
     
  2. Michel
    Michel WRInaute passionné
    Inscrit:
    22 Décembre 2002
    Messages:
    1 334
    J'aime reçus:
    0
    Bonsoir,

    Je suis bien d'accord, mais Google travail beaucoup sur cela, et utilise, comme beaucoup d'autres parametres, la richesse ou non des textes, mais ce n'est pas aussi facile que de le dire.
     
  3. Bigb06
    Bigb06 WRInaute impliqué
    Inscrit:
    21 Mars 2007
    Messages:
    790
    J'aime reçus:
    1
    Vous pensez sérieusement pouvoir apprendre quelque chose à l'armée d'ingénieurs surdiplomé de Google travaillant sur les algorithmes?
     
  4. carole heinz
    carole heinz WRInaute passionné
    Inscrit:
    28 Février 2007
    Messages:
    2 417
    J'aime reçus:
    0
    ce n'est pas vrai. en fait, ce que vous proposez est déjà en place depuis longtemps. google sait que "agence web" par exemple est la même chose que "web agency". quand vous montez sur le premier, vous montez sur le second et vice versa.

    il y a des milliers d'autres exemples. on appelle ça la LSI (Latent Semantic Indexing) ;)

    https://www.google.fr/search?hl=fr&q=lsi+google
     
  5. Michel
    Michel WRInaute passionné
    Inscrit:
    22 Décembre 2002
    Messages:
    1 334
    J'aime reçus:
    0
    Effectivement, ils sont plusieurs centaines de très haut niveaux, Google sait séduire les meilleurs dans tous les domaines de travail, tous ce qui peut-être réalisé pour améliorer le système Google sera fait, ce n'est qu'une question de temps…
     
  6. blogger
    blogger WRInaute occasionnel
    Inscrit:
    24 Novembre 2006
    Messages:
    359
    J'aime reçus:
    0
    La richesse lexicale d'un texte est déjà récompensée par l'augmentation des combinaisons de mot clé.
     
  7. malvina14
    malvina14 WRInaute discret
    Inscrit:
    5 Janvier 2007
    Messages:
    210
    J'aime reçus:
    0
    Ce n'est vrai qu'en partie, pour ma part je dirai qu'il va rapprocher "voiture" et "auto" mais il ne va pas beaucoup plus loin. Mais les moteurs ne savent pas lire, juste compter.
     
  8. carole heinz
    carole heinz WRInaute passionné
    Inscrit:
    28 Février 2007
    Messages:
    2 417
    J'aime reçus:
    0
    disons que ça devient tout de même de + en + performant et que Google ne se borne certainement pas aux synonymes:

    https://www.google.fr/search?hl=fr&q=rpr

    google propose sur cette requête des résultats RPR bien sûr, mais aussi UMP et propose un peu d'UDF. c'est un cas particulier, mais c'est tout de même un peu + performant que la simple synonymie voiture/auto ;)

    pour rester sur l'exemple "voiture" je pense que Google a largement les moyens de comprendre que "peugeot" ou "citroën" ou "308" sont des voitures. pour exemple, voir les colonnes "also visited" et "also searched for" ici:
    http://trends.google.com/websites?q=peu ... all&sort=0
     
  9. ybet
    ybet WRInaute accro
    Inscrit:
    22 Novembre 2003
    Messages:
    7 419
    J'aime reçus:
    1
    :wink: mieux vaut être troisième sur 10 requêtes que premier sur une très ciblée. D'abord c'est plus facile, deuxièmement, ca apporte finalement plus de visiteurs.
     
  10. ybet
    ybet WRInaute accro
    Inscrit:
    22 Novembre 2003
    Messages:
    7 419
    J'aime reçus:
    1
    Ce qui est marrant en plus, c'est le site officiel d'un parti politique français en .org
     
  11. popov
    popov Nouveau WRInaute
    Inscrit:
    6 Décembre 2005
    Messages:
    45
    J'aime reçus:
    0
    et que 404 et 301 n'en sont pas :lol:
     
  12. Jean-Yves Willmann
    Jean-Yves Willmann WRInaute discret
    Inscrit:
    16 Mars 2007
    Messages:
    82
    J'aime reçus:
    0
    J'entends bien toutes les réponses mais je reste dubitatif...

    Tout d'abord, ne confondons pas : je ne parle pas de synonymes mais de richesse lexicale.

    Sur les synonymes il me semble que les robots sont encore loin d'être au point. J'ai pu tester qu'en 2007-2008 s'il y a dans une page les mots suivants : élèves - professeurs - collèges - établissement scolaire - directrice d'école - etc., les moteurs semblent incapables de comprendre que l'on parle d'éducation. Il faut donc absolument que le mot "éducation" figure assez souvent (le fameux critère des occurrences) pour être répertorié dans des combinaisons comprenant "éducation".

    Ce sujet ne concerne donc pas les synonymes, critère linguistique encore peu accessible aux robots. En revanche, l'idée que je suggère est à 100% mathématique, donc a priori assez facilement accessible aux robots :

    - calculer le pourcentage de mots différents dans une même page (voire dans un site tout entier...) ;
    - puis appliquer à ce pourcentage un barème rectificateur en fonction de la taille du texte (ou de la somme totale des écrits du site).

    Au risque de vous apparaître très naïf, êtes-vous vraiment sûr que les ingénieurs ont sérieusement pensé à cette idée très précise ?
     
  13. serval2a
    serval2a WRInaute accro
    Inscrit:
    21 Mars 2005
    Messages:
    2 550
    J'aime reçus:
    0
    Bonjour,
    Moi j'appelle ça du verbiage et en effet je l'emploie non sans un certain bénéfice SEO sur mes sites ;)
     
Chargement...
Similar Threads - Critère qualitatif proposé Forum Date
SONDAGE : les critères qualitatifs importants pour les annuaires Annuaires et moteurs 12 Janvier 2010
Critères de tri en GET et budget crawl Référencement Google 25 Février 2021
Cibler un mot clé par critère personnalisé adsense AdSense 21 Octobre 2019
Critères exclusion Loi Darmanin Droit du web (juridique, fiscalité...) 6 Juillet 2019
Sur quels critères se baser pour passer à un serveur dédié ? Administration d'un site Web 2 Juillet 2019
Masse de pages en noindex, nouveau critère pénalisant ? Débuter en référencement 30 Septembre 2018
Critère de classement régional Google trends YouTube, Google Images et Google Maps 14 Juin 2018
Nombre de visiteurs venant d'un BL = critère important? Netlinking, backlinks, liens et redirections 15 Septembre 2017
Critères de l'algo de Google Référencement Google 18 Septembre 2016
Savoir les critères du sitelink Problèmes de référencement spécifiques à vos sites 18 Septembre 2015
Le lieu de recherche critère déterminant ? Problèmes de référencement spécifiques à vos sites 25 Mars 2015
Le critère #mobilefriendly n'a pas d'impact sur le fixe Référencement Google 25 Mars 2015
SEO : le critère Mobile Friendly est évalué page par page Référencement Google 6 Mars 2015
Critères de positionnement Débuter en référencement 21 Octobre 2014
Ce que vous regardez à la TV, critère SEO ? Référencement Google 17 Septembre 2014
Moteur de recherche multi critère Développement d'un site Web ou d'une appli mobile 18 Mai 2014
Différences de critères de référencement entre GG et autres moteurs de recherche Débuter en référencement 14 Janvier 2014
Hummingbird (colibri) utilise-t-il des critères sociaux ? Référencement Google 12 Novembre 2013
Principaux critères SEO pour Bing Référencement Bing 27 Août 2013
requete sql avec critère provenant d'un formulaire Développement d'un site Web ou d'une appli mobile 3 Juillet 2013