Petits mots pas si ignorés que ça !

  • Auteur de la discussion Auteur de la discussion MisterYo
  • Date de début Date de début
Nouveau WRInaute
Salut !

j'ai remarqué que Google n'ignore par totalement les à,le,la...

par exemple les réponses pour 'sortir paris' et 'sortir à paris' ne sont pas les mêmes (sans guillements biensur), le site qui affiche le terme complet passe devant et donc ces petits mots de liaison sont quand pris en compte !
 
WRInaute passionné
Ce qui est surtout pris en compte entre sortir paris et sortir a paris c'est la combinaison des mots. Dans le premier cas tu fais une requete avec les deux mots "collés" et dans l'autre tu mets un mot entre. Même si ce mot n'est pas pris en compte tu as un résultat différent car les mots sont séparés.
Logiquement si tu prend un autre mot ignoré lors de la recherche, "le" par exemple, tu as le même résultat entre sortir a paris et sortir le paris.
 
WRInaute impliqué
Re: petits mots pas tant ignorés que ca !

MisterYo a dit:
Salut !

j'ai remarqué que Google n'ignore par totalement les à,le,la...

par exemple les réponses pour 'sortir paris' et 'sortir à paris' ne sont pas les mêmes (sans guillements biensur), le site qui affiche le terme complet passe devant et donc ces petits mots de liaison sont quand pris en compte !
On en a parlé une centaine de fois, fais une recherche sur mots vides
Il ressort que c'est une question d'une distance entre mots
Vague souvenir : Un indexeur met dans son index (inversé) le mot, le fichier dans lequel il est trouvé, l'endroit dans le fichier. Dans le temps jadis (j'ai de la bouteille) la difficulté était de trouver la 'pomme de terre' parmi les fichiers qui parlaient de la pomme (le fruit sucré) et plus loin de la terre (là où poussent les pommiers). Mais maintenant on peut mémoriser beaucoup plus de choses.
Edité : j'ai fouillé ma mémoire et je fus moins rapide
 
WRInaute passionné
Les cas: "sortir paris" et "sortir à paris" ni "pomme de terre" ne sont à mon sens pas très probant car ce sont deux mots analysés séparéments. En revanche, je pense que mon cas est un peu plus explicite et confirme qu'il y a des divergences de résultats avec ou sans le mot neutre "de".

Je parle de "carte fidélité" et "carte de fidélité", ce sont deux expression qui renvoient au même sujet certes, mais qui se disent toutes les deux dans la vie de tous les jours !

je ne sais pas si je suis assez clair dans mon explication mais en tout cas, j'analyse quotidiènement les résultats sur ces deux requêtes et il y a des différences. :!:
 
WRInaute impliqué
@ "oli004"
Pourrais-tu expliciter ?
Pour ton exemple il semble plus facile de se positionner sur les deux expressions, dans la mesure où elles peuvent être employées toutes les deux sans que cela soit trop choquant (comme tu le dis : "vie de tous les jours")
Par contre "éplucher les pommes terre" ou "demain je vais sortir paris", semblent plus difficles à placer
 
WRInaute accro
pour répondre à ta question, les mots qui sont "ignorées" ne le sont pas totalement (differences de nombre de resultats, de positionnement, etc...)
maintenant savoir pourquoi... no sabé
 
WRInaute passionné
Pourrais-tu expliciter ?
Pour ton exemple il semble plus facile de se positionner sur les deux expressions, dans la mesure où elles peuvent être employées toutes les deux sans que cela soit trop choquant (comme tu le dis : "vie de tous les jours")

Je sous-entends dans ma réponse postée précédemment que les petits mots ne seraient pas ignorés (j'utilise le conditionnel car je ne peut pas affirmer) si et seulement si ils font partie de l'expression "clé" car là il ne s'agirait pas de deux mots clés mais d'un mot clé composé, et je dis bien 1 mot clé. (peut-être résultant d'un filtrage préalable sur l'un des deux mots, je ne dis pas le contraire).

En quelque sorte, vis à vis des résultats affichés par Goog, "carte de fidélité" serait considéré comme 1 seule variable plutôt que d'une combinaison de "carte" et "fidélité"

Je pense qu'il serait intéressant de faire des comparaison sur différentes expressions analogue ou le "de" serait optionnel.

PS:
il semble plus facile de se positionner sur les deux expressions
J'aimerai bien :wink:
 
WRInaute accro
Il y a une belle bataille sur "l0cation de vacances" et "l0cation vacances" qui montre bien que les deux requetes sont traitées de manière différente. Pourtant on pourrait penser que ces deux requête vise la même chose et qu il serait "normal" qu´elles renvoient vers les memes résultats.
 
WRInaute passionné
maintenant savoir pourquoi

et bien peut être bien parceque dans cetains cas le "petit" mot ne sert à rien et dans d'eutre cas il a son utilité.

exemples avec les villes :Vic le comte, la Rochelle, etc. ne donnent pas les mêmes résultats que Vic comte et rochelle.
 
H
Haq
Guest
Netsys a répondu de manière parfaitement correcte et en premier... à sa place, je serais un peu désespéré d'être suivi par une cohorte de réponses approximatives voire erronées. Courage, netsys ! ;-)

Par ailleurs, squawk et moi-même avions déjà répondu à cette question il y a moins d'une semaine dans un autre fil de ce forum.
 
H
Haq
Guest
Sorry, mais au risque de me répéter, la manière dont Google traite les mots "stopwords" est connue et se résume en une phrase: Google ignore ces mots, mais tient compte de leur position au sein de la requête.

Il ne sert à rien de construire des hypothèses quand l'explication est disponible...
 
WRInaute impliqué
oli004 a dit:
En quelque sorte, vis à vis des résultats affichés par Goog, "carte de fidélité" serait considéré comme 1 seule variable plutôt que d'une combinaison de "carte" et "fidélité"
perso je n'y crois pas trop, mais je n'ai aucune thérorie.
oli004 a dit:
Je pense qu'il serait intéressant de faire des comparaison sur différentes expressions analogue ou le "de" serait optionnel.
Pour commencer les requêtes 'carte de fidélité' et 'carte la fidélité' conduisent à des résultats moins différents / requête 'carte fidélité' (confirmation de la notion de distance entre mots)

oli004 a dit:
il semble plus facile de se positionner sur les deux expressions
J'aimerai bien :wink:
Si tu fais une page ayant comme titre 'Pomme terre, manger une pomme terre', tu as de grandes chances d'être premier sur 'pomme terre'
 
WRInaute accro
Netsys, squawk, Ak, expliquez moi alors les differences entre "kiwi" et "le kiwi" avant de parler de "cohorte de réponses approximatives voire erronées"
là y a plus de position ou de mots cote a cote, y en a qu'un , et pourtant les resutlats sont réellements differents

-na- :-)
 
WRInaute passionné
tu as de grandes chances d'être premier sur 'pomme terre'
Entièrement d'accord avec toi, sauf que les internautes moyens ne tappent pas 'pomme terre' mais 'pomme de tere' lors d'une recherche. Donc c'est un choix, soit tu mets le 'de' soit tu ne le mets pas mais t'es tu déja dis :"mmh elle sont sont bien bonnes tes pommes terre chérie" :wink:

Je dis ça sous le ton de la plaisanterie mais ne doit-on pas d'abord raisonner "internaute" plutot que "robot" pour le contenu de ses pages ?
 
WRInaute accro
aK a dit:
Sorry, mais au risque de me répéter, la manière dont Google traite les mots "stopwords" est connue et se résume en une phrase: Google ignore ces mots, mais tient compte de leur position au sein de la requête.

Il ne sert à rien de construire des hypothèses quand l'explication est disponible...

exact.

Mais je crois que la question reposait aussi sur le "pourquoi" d´une telle démarche. Peutetre tout simplement pour des raison de calcul, pour essayer de ne pas faire "exploser" la machine si google devait prendre en compte tous ces termes de manière différente.
 
WRInaute passionné
@e-kiwi

Netsys, squawk, Ak, expliquez moi alors les differences entre "kiwi" et "le kiwi"
Tu ne m'as pas nommé dans ton post mais je me permets de te donner mon avis:

"le kiwi" me semble renvoyer vers un site supposant décrire le fruit sous quelque forme que se soit alors que "kiwi" peut très bien me renvoyer à un ingrédiant pour de la confiture ou un cocktail, ou à la marque de cirage.

Pour moi, il y a une différence. Pour google je l'espère aussi.

c'est pas logique ce que je dis ?
 
H
Haq
Guest
e-kiwi a dit:
Netsys, squawk, Ak, expliquez moi alors les differences entre "kiwi" et "le kiwi" avant de parler de "cohorte de réponses approximatives voire erronées"
là y a plus de position ou de mots cote a cote, y en a qu'un , et pourtant les resutlats sont réellements differents

-na- :-)

Ben... je ne vois pas trop la différence. Kiwi est en position n°1 dans la première requête, et en n°2 dans la deuxième... je suppose que ça doit suffire pour induire ces différences dans les résultats, même si pour un "humain" ça semble aberrant.

Disons que ce que je n'aime pas trop dans cette escalade d'hypothèses et contre-hypothèses, c'est qu'elles s'échaffaudent de plus en plus au détriment de ce qu'on a la chance de savoir de ces algos. On en arrive à ne plussavoir ce qui est étayé par des déclarations officielles de Google, par des études sérieuses, ou par n'importe quel ado de 15 ans qui croit savoir comment faire fonctionner un moteur de recherche de 8 milliards de pages (ce dont je m'avoue humblement incapable).

Dans ce cas précis, un livre comme l'excellent "Google and the Mission to map meaning and make money" de Bart Milner donne l'explication que netsys, squawk, moi-même et beaucoup d'autres avons donnée. Ca me semble une source beaucoup plus intéressante qu'une hypothèse de cerveau humain (ou alors, on crée un fil dans le forum "tests et études de cas" et on écrit un protocole afin d'avoir des éléments tangibles.
 
H
Haq
Guest
herveG a dit:
je crois que la question reposait aussi sur le "pourquoi" d´une telle démarche. Peutetre tout simplement pour des raison de calcul, pour essayer de ne pas faire "exploser" la machine si google devait prendre en compte tous ces termes de manière différente.

Tout à fait, c'est également ce qui est expliqué par Bart Milner.
 
WRInaute accro
oli004> c est logique si le mot "le" n etait pas ignoré

ak> cela veut dire qu'un mot ignoré compte qd meme pour un mot, et donc kiwi devient le mot numéro 2 ? je ne savais point. sacré googeul
 
H
Haq
Guest
e-kiwi a dit:
ak> cela veut dire qu'un mot ignoré compte qd meme pour un mot, et donc kiwi devient le mot numéro 2 ? je ne savais point. sacré googeul

C'est exactement ce que netsys a écrit ;-)
 
WRInaute impliqué
e-kiwi a dit:
Netsys, squawk, Ak, expliquez moi alors les differences entre "kiwi" et "le kiwi" avant de parler de "cohorte de réponses approximatives voire erronées"
là y a plus de position ou de mots cote a cote, y en a qu'un , et pourtant les resutlats sont réellements differents

-na- :-)
Pas tant que cela, et regarde les résultats non français avec 'le kiwi'
L'interface filtre le 'le' avant de l'envoyer
fais la recherche '+le kiwi'
 
WRInaute passionné
oli004> c est logique si le mot "le" n etait pas ignoré
Que le mot ne soit pas ignoré ne veut pas dire non plus qu'il soit privilégié parce que c'est le premier mot de la requête. Il est bien évident que ce qui est le plus important est bien kiwi (que l'on soit humain ou robot car je pense que google réagit de la même manière dans sa manière de traiter la reqête)
 
H
Haq
Guest
oli004 a dit:
Que le mot ne soit pas ignoré ne veut pas dire non plus qu'il soit privilégié parce que c'est le premier mot de la requête.

Le mot "le" est ignoré (sauf à considérer que prendre en compte sa présence est une manière de ne pas l'ignorer... mais pour la bonne compréhension des explications, mieux vaut utiliser le vocabulaire de Google).
 
WRInaute impliqué
Il est plus prudent de dire ignoré par l'interface qui envoie une requête à (comment l'appeler ?) l'index : l'interface ignore le 'le' mais pas les positions
 
WRInaute accro
oui oui pour ma part je suis ok avec vote theorie :

quelquesoit le mot "ignoré" avant kiwi (le kiwi, a kiwi, de kiwi, etc...) les résltats sont les memes. il retient donc juste que la position est 2, mais le mot ignoré ne rentre pas en compte dans ses recherches

merci, je dormirai moins bete :-)
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut