L'algo de GG et le classement des sites sur une actu

  • Auteur de la discussion Auteur de la discussion ideezik
  • Date de début Date de début
WRInaute impliqué
Attention, ce n'est absolument pas une affirmation mais une interrogation de ma part.

Sur un de mes sites développé en xhtml je suis inscrit sur GG Actu. Force est de constater qu'il aime bien mes news. Sur une news avec environ 20-30 sites complémentaires (plus gros et consistants que le mien) quand je poste, dans l'heure je suis 1er sur la news. Attention, c'est pas de la magie ca arrive pas à chaque fois. Mais cette semaine, 3 jours de suite. Donc ce n'est pas non plus un phénomène exceptionnel.

Je m'interroge donc sur le pourquoi du comment car c'est interressant. Ce site n'a pas un traffic exceptionnel et vous vous en doutez un passage en une de GG Actu explose les stats.

La seule chose que je remarque en comparaison avec les "concurrents" est le xhtml. Qui n'apporte rien en soi mais qui empeche la dilution du contenu de la news dans la tonne de <tr><td> de certains autres sites. Or je me souviens avoir lu dans la faq de GG Actu que parmis les critères, il fallait que la taille de la news soit significative par rapport à la taille de la page entière.

Vous en pensez quoi ? Ca peut jouer ? D'autres pistes pour etre GG Actu Friendly ?
 
WRInaute discret
J'aurais tendance à confirmer... Sur mon site valide xhtml stricte (ou presque ^^), en tout cas tableless, ma breve est en première position sur "egypte ancienne" (thematiques des actus et du site) dans les minutes qui suivent (je reçoit une google alert environ 10 minutes apres)

Maintenant je sais pas si les site avec mise en page par tableau ou des problemes...

ça semblarait logique car un site xhtml respecte la semantique et donc l'algo a moins de mal de voir que tel lien fait partie d'un bloc d'actu.. Mais en même temps il n'y a pas de différence de classement (ou tres peu) dans la recherche web, alors on peux pas dire que c'est sur à 100% ta theorie
 
WRInaute impliqué
Un autre truc qui parait évident mais y'a un autre crawler et un autre algo pour Google Actu non ? Genre la je poste un news, 27 min apres elle est sur GG Actu. Or bien sur elle n'est pas indexée dans Google (le moteur).

C'est totalement indépendant ? Ou bien la page news d'un site (utilisée pour GG actu) a des chances d'etre tout de meme crawlée plus vite aussi pour le moteur ?
 
WRInaute accro
Question à 20 centimes : vous avez un gros moteur dont le but est d'être pertinent.
A - vous favorisez les sites qui contiennent un contenu directement lié à la requête
B - vous favorisez le site du névrosé qui ne pense qu'à son code source ?
 
WRInaute impliqué
Je paie mes 20 centimes et je réponds :

Ici la question de pertinence est différente que sur le moteur car tous les articles sont pertinents (on parle de Google Actu hein). Mais parmis ces articles il y'a tout de meme un classement et sur ce classement que je m'interroge.
 
Olivier Duffez (admin)
Membre du personnel
juste une remarque en passant (mais pitié par de troll) : on peut faire un site en XHTML avec des tableaux...

sinon j'aimerais savoir si tu peux nous dire combien tu produits d'actus par semaine ? j'ai cru repérer que Google News favorise les gros producteurs de news.

autre remarque : ton site arrivais en page d'accueil de GG News ? ou en page d'accueil de rubrique ? le restait-il toute la journée ou seulement quelques heures ?
 
WRInaute impliqué
on peut faire un site en XHTML avec des tableaux

Tout à fait d'accord. Du moment que les tableaux sont utilisés pour afficher un tableau (genre comparatif de prix, caddie virtuel etc...) et non pour organiser un design.

OK un peu plus de précisions. Je produis une dixaine de news par semaine ce qui est pas énorme du tout comparé aux autres sites de la rubrique (science et technique).
Les news arrivent généralement sur la page science et technique et quelques fois sur la home de GG Actu si elles sont dans les premières de science et technique. Il me semble que pour ca c'est juste qu'il reprend juste les premiers de chaque rubrique.
Moi ce qui m'interesse de comprendre, c'est vraiment le classement des sites sur une meme actu. Il est possible qu'il y'est un facteur de temps aussi. Les plus récentes sont avantagées il me semble mais c'est pas un facteur unique et dominant.
Pour ce qui est du xhtml c'est bien sur pas une histoire de standards (on s'en tape) mais de dilution du contenu de la news dans le contenu total de la page.

Voila ou j'en suis :roll:
 
WRInaute impliqué
Les news les plus récentes arrivent directement en première position sur d'une "catégorie" (sujet), et elle sont remplacées ensuite par celle qui suivent, peu importe leur provenance.

(C'est pour ça qu'il ne sert à rien d'être le premier sur un "scoop", soit dit en passant il vaut mieux attendre que tout le monde et pondu son article dessus; en arrivant le dernier on a plus de chance de rester le plus longtemps en tête de catégorie CQFD...)

Je ne sais pas si le XHTML peut aider dans Google-News...
 
WRInaute impliqué
Tu es certain à 100% de ca :?:

Car j'ai vu des exemples contraire ou alors j'avais passé trop d'heures sur le pc et j'avais les yeux collés :lol:

Au moins ca metterais fin à mes interrogations :wink:
 
WRInaute accro
C'est faux, il n'y a pas de recette miracle pour google news. La position de premier n'est pas le dernier arrivé, ça se saurait sinon...

Tu peux très bien avoir une news qui date de 3-4, voire même une semaine qui déboule en page d'accueil de google news.
 
WRInaute impliqué
achtungbaby a dit:
Tu peux très bien avoir une news qui date de 3-4, voire même une semaine qui déboule en page d'accueil de google news.

Tu m'étonnes un peu là... (un lien a était rajouté qq part alors...)
 
WRInaute impliqué
Il me semble aussi avoir vu des changements dans les positions sans qu'un site (nouveau) arrive. Après y'a peut-être aussi des datacenters non synchros sur GG Actu :lol:
 
M
Machin
Guest
Je ne crois pas que le code Xhtml soit mieux pris en compte que du vieux code. C'est plutôt la composition de l'article qui compte, titre, chapeau, fréquence des mots-clés, longueur, et tout le bazar algorytmique comme pour le moteur de recherche, plus le facteur temps dans la durée de vie de cette actualité (variable car dépendant de tous les sites qui la font ou pas) par rapport aux autres. Et aussi, et surtout même je crois, il y a un PR pour chaque site. Le Monde, Libé, etc. écrasent les petits sites à faible PR. Leurs articles restent beaucoup plus longtemps affichés en Une. Ils sont même affichés sur les lignes "Actualités" qui sortent en haut des pages du moteur de recherche normal, alors que les petits sites même premiers sur la Une de Google News ne le sont pas.
 
WRInaute impliqué
achtungbaby a dit:
C'est faux, il n'y a pas de recette miracle pour google news. La position de premier n'est pas le dernier arrivé, ça se saurait sinon...

Ok, je te démontre le contaire en spammant GN tout de suite (page d'accueil) sur "Cécile de France à Cannes" (Catégorie Culture), le temps de faire l'article, parution dans 40 mn.. :?
 
WRInaute impliqué
Machin a dit:
Ils sont même affichés sur les lignes "Actualités" qui sortent en haut des pages du moteur de recherche normal, alors que les petits sites même premiers sur la Une de Google News ne le sont pas.

Interessante cette remarque. Je n'ai pas encore effectué de tests la dessus. Je vais y songer. Essayer de tirer une regle sur le PR par exemple.
 
WRInaute accro
¥€$ a dit:
achtungbaby a dit:
C'est faux, il n'y a pas de recette miracle pour google news. La position de premier n'est pas le dernier arrivé, ça se saurait sinon...

Ok, je te démontre le contaire en spammant GN tout de suite (page d'accueil) sur "Cécile de France à Cannes" (Catégorie Culture), le temps de faire l'article, parution dans 40 mn.. :?

ah mon avis tu vas de vautrer (c'est pas méchant), il y a déjà 23 articles connexes !
 
WRInaute impliqué
Justement c'est interessant pour la démarche scientifique.

Si vos deux articles apparaissent en premier, la théorie de ¥€$ gagnera des points :wink:
 
WRInaute impliqué
Une news que j'ai posté ce matin est toujours en tete alors que deux nouveaux articles ont été ajoutés.
La théorie perts des points :roll:
 
WRInaute impliqué
Oui mais quand tu regardes mon post plus haut tu vois que c'est pas automatique.

10000 exemples ne suffisent pas à construire un théorème mais 1 contre exemple suffit pour prouver qu'il est faux :wink:
 
WRInaute accro
Bon, bah un autre test sur celui-la alors :

-http://www.lefigaro.fr/eco-medias/20050322.FIG0192.html

en plus ça parle de google actualité.
 
WRInaute impliqué
Bon on peut dire que le facteur date de parution prend une grosse part dans le classsement. Mais apparemment, il y'a l'air d'avoir des exceptions.

Au passage j'ai modifié le titre du topic
 
WRInaute impliqué
D'ou l'intéret de choisir des "news" en fin de vie... le week-end ou le soir quand les rédactions des grands sites sont au point mort...
 
WRInaute impliqué
C'est un peu pour ca que j'ai lancé le post hein...

Pour y voir un peu plus clair et optimiser l'utilisation de cet outil :wink:
 
WRInaute accro
26 minutes, et tu n'es toujours pas placé ! :wink:

(moi j'étais placé en 22, mais j'ai été débouté au bout de 35...).
 
WRInaute impliqué
J'en avais déjà plusieurs :wink:

Comme je l'ai dit sans changement sur le nombre d'articles il arrive que les positions soient modifiées. Ce qui casse la théorie sur le order by date desc :roll:

Néanmoins, la dite théorie est tout de meme assez bien respectée donc elle reste interessante à exploiter :P
 
M
Machin
Guest
¥€$ a dit:
le temps de faire l'article, parution dans 40 mn.. :?

Putain, 40 mn pour recopier mot à mot 3 lignes d'une dépêche d'agence et "oublier" le copyright, tu ne fera pas carrière à l'AFP toi. :wink:
 
WRInaute impliqué
gn.gif

L'article se retrouve bien en 1ere position de la catégorie visée, malheureusement celle-ci vient de disparaitre de la page d'accueil de GNews... Domage... il faut compter 3500 visiteurs / 24 heures de présence dans les 3 titres principaux de catégorie.
Précision, le site à un fil xml.
 
WRInaute impliqué
Machin a dit:
¥€$ a dit:
le temps de faire l'article, parution dans 40 mn.. :?

Putain, 40 mn pour recopier mot à mot 3 lignes d'une dépêche d'agence et "oublier" le copyright, tu ne fera pas carrière à l'AFP toi. :wink:

Ah non ! si tu fait du mot a mot tu finis dans les liens "relancer la recherche en incluant les pages ignorées." :wink:
 
WRInaute accro
3500 visites pour 24 heures ? en page d'accueil ?

Ben j'ai fait beaucoup mieux, beaucoup, beaucoup mieux... je suis déjà monté à plus de 8000 lectures par GG news sur un articles en 24h.
 
WRInaute impliqué
Le but du sujet n'était pas un qui qu'a la plus grosse :lol:

Mais il est évident qu'un passage sur la home + la page thematique du sujet donne un trafic bien plus important
 
Olivier Duffez (admin)
Membre du personnel
donc si je résume, on est d'accord pour dire que :
- la date de l'article est un critère majeur (les plus récents en général en premier)
- il peut être astucieux de publier un article sur un sujet d'actualité seulement une fois que les "gros" ont publié le leur, on peut ainsi rester en haut du regroupement d'articles
- il existe peut-être une sorte de popularité attribuée par Google à chaque site repris dans Google News. Difficile de dire si cette popularité est liée au PR ou à autre chose (moi j'avais pensé au nombre d'articles publiés par mois, par exemple)

on n'a pas parlé de l'éventuel avantage (en positionnement) des articles qui incluent des images. Qu'en pensez-vous ?

la taille des articles influe-t-elle ?

Olivier
 
Olivier Duffez (admin)
Membre du personnel
c'est l'intérêt d'un forum comme ça non ?
si on pouvait faire + de discussions qui font avancer le schmilblick, ce serait cool

ça pourrait même faire un article pour mon blog (repris dans GG news of course) !
 
WRInaute impliqué
Oui c'est aussi un facteur dont il faut tenir compte. Sur un article qui n'a pas encore d'image si un nouveau est publié avec image il peut prendre la tete ou l'actuel reste en tete mais l'image est ajouté à gauche et le lien sur l'image pointe sur le nouvel article et non sur celui en tete.

Pour la taille de l'image, je pense plutôt aux proportions qu'a la taille car Google génère une image a partir de celle d'origine (un peu comme GG image) mais si l'image fait 500 sur 25 je pense pas qu'elle puisse aparaitre.

Il faudrait faire des tests là dessus aussi.
 
Olivier Duffez (admin)
Membre du personnel
je confirme, Google News n'aime pas les images rectangulaires et il adore les carrées.
je n'ai pas encore trouvé la taille minimum à utiliser (ni la max) mais un carré 150x150 sera très bien pris
 
WRInaute impliqué
WebRankInfo a dit:
donc si je résume, on est d'accord pour dire que :
- la date de l'article est un critère majeur (les plus récents en général en premier)
C'est ce que j'ai remarqué.
- il peut être astucieux de publier un article sur un sujet d'actualité seulement une fois que les "gros" ont publié le leur, on peut ainsi rester en haut du regroupement d'articles
Oui et avant que la news se défraichisse trop pour ne plus apparaitre en bonne position (ce qui est arrivé dans l'exemple).
Je pense que le nombres de clics font rester une news plus longtemps en haut de tableau (Vous remarquerez que les articles sur les virus, par exemple ou tiens, le toast grillé avec la tête de Jésus vendu sur eBay qui est resté excessivement longtemps sur GN bien qu'il ne soit plus "alimenté" en articles, simplement parce que tous les médias en avaient parlé)
- il existe peut-être une sorte de popularité attribuée par Google à chaque site repris dans Google News. Difficile de dire si cette popularité est liée au PR ou à autre chose (moi j'avais pensé au nombre d'articles publiés par mois, par exemple)
Possible...
on n'a pas parlé de l'éventuel avantage (en positionnement) des articles qui incluent des images. Qu'en pensez-vous ?
Jamais réussi à faire passer une image sur GN, c'est plus délicat pour Google et il préfére peut-être privilégié les images provenant de sources réputées fiables, celles qui sont publiées proviennent souvent de repertoire ayant des noms bien ciblés (Ex : img, images, media, photos) et comporte plutôt une suite de chiffres plutôt qu'un nom significatif, mais comme c'est pas une généralité...
la taille des articles influe-t-elle ?
Quels articles ? :lol:
 
M
Machin
Guest
WebRankInfo a dit:
la taille des articles influe-t-elle ?

Oui, il faut qu'ils soient normands, c'est-à-dire ni trop courts ni trop longs. Un dépêche trop courte sera rapidement passée à la trappe même si elle arrive en dernier. Ce sera l'article plus développé publié juste avant sur le même sujet qui reprendra le top. Voire Google News ne l'incluera même pas dans le topic. Quant à article trop long, dont plus difficile à cerner, Google risque de ne pas l'inclure dans le topic qui se trouve à la Une mais d'ouvrir un nouveau topic avec qui lui restera isolé. On ne le trouvera qu'en effectuant une recherche sur les mots-clés. Mais là encore tout est dans l'algo avec pertinence et fréquence de mots-clés sur le longueur totale du texte, etc,..
Au total, l'algo de Google News est au moins aussi complexe à déchiffrer que celui du classement sur le moteur de recherche et ça bouge probablement autant. Au boulot, les spécialistes, dans quelques années vous apercevrez peut-être vu quelques bouts de l'équation qui régit tout ça.
 
WRInaute impliqué
Dans l'histoire, il y'a encore un cas que nous n'avons pas traité et qui viens d'etre évoqué par Machin : un nouvel article.
En gros la question est : qu'est-ce qui fait qu'il va apparaitre ou non sur GG Actu. Je parle sur la page sans avoir besoin de faire une recherche.
 
WRInaute impliqué
Machin a dit:
Oui, il faut qu'ils soient normands, c'est-à-dire ni trop courts ni trop longs.

D'accord avec Machin sur ce point et J'ajouterai que Google News aime bien les liens en rapport avec l'article.
 
M
Machin
Guest
WebRankInfo a dit:
- il existe peut-être une sorte de popularité attribuée par Google à chaque site repris dans Google News. Difficile de dire si cette popularité est liée au PR ou à autre chose (moi j'avais pensé au nombre d'articles publiés par mois, par exemple)

J'intuitionne (sans preuves) qu'il y a une sorte de PR spécial Google News. Il est peut-être détérminé en fonction du PR normal du site mêlé à la notoriété réelle de l'organe car il semble clair que les vrais médias de presse écrite ou audiovisuelle (télés, agences de presse, journaux et magazines vendus en kiosques,...) sont bien mieux cotés que les simples sites de news publiés uniquement sur le web.
 
WRInaute accro
L'image n'est pas un plus, d'ailleur le plus souvent il prend une image sur un site, et l'article sur un autre.

La date est un critère mais pas systématique.

Etre le dernier sur le sujet n'est pas forcement une bonne idée, car si trop d'articles alors on passe à la trappe.
 
Olivier Duffez (admin)
Membre du personnel
oui mais connais-tu le taux de clic sur les images et celui sur les liens texte ? donc celui qui a une image peut obtenir des visiteurs même si son article n'est pas mis en avant par un lien texte.
 
WRInaute impliqué
Oui ca arrive souvent meme.

Les visiteurs pensent (à tort) que l'article et l'image sont du meme site et que peut importe ou ils clickent ils arriveront au même endroit. Ce qui n'est pas toujours le cas et ca peut faire des visites pour le site dont l'image est issue.

Avoir une image est donc un plus.
 
WRInaute accro
WebRankInfo a dit:
oui mais connais-tu le taux de clic sur les images et celui sur les liens texte ? donc celui qui a une image peut obtenir des visiteurs même si son article n'est pas mis en avant par un lien texte.

Je ne vais pas donner de chiffre, car je suis incapable d'en donner. Mais j'ai eu l'expérience d'une image et pas de lien texte une fois, et ça me semble-t'il rapporter autant de visites qu'un lien en première position. A mon sens pas plus, pas moins.

Si tu as l'image et le lien, alors c'est jackpot !

:wink:
 
WRInaute impliqué
Dans le but de faire avancer le test. Observations sur un article aujourd'hui :

Posté sur un de mes sites.
30 min après 1er sur l'article avec image
Au bout d'une heure, je passe second mais l'image reste
20 min après je repasse premier toujours avec l'image
10 min après, je repasse second l'image s'acharne

On peut donc dire qu'il y'a une sorte de round dans c't'histoire quand meme... Apres, il faut voir si oui ou non il y'a une stabilisation des positions au bout d'un certain temps.
 
WRInaute accro
Il n'y a pas de règle j'ai l'impression.

Exemple, j'ai placé une info sur France télécom et le limousin, j'ai posté mercredi matin vers 10heures.

J'ai été en tete pendant presque toute la journée, puis détroné par un autre site, puis réapparu en tete.

Hier Jeudi, l'article était encore la, avec un autre site, et moi en second, quelques incursions en tete, breves...

Aujourd'hui l'info est toujours présente avec un autre site. Je suis toujours en lien vers apparement (ça rapporte très peu de visiteurs).

En résumé, une info que je qualifierais de secondaire et peu intéressante est présente dans google news depuis trois jours.

On peut vraiment se demander ce qui fait laisser cette info aussi longtemps cette info en page d'accueil de google news.

Mon article a fait près de 5300 lectures, donc la majorité mercredi.
 
M
Machin
Guest
achtungbaby a dit:
Il n'y a pas de règle j'ai l'impression.

Non, puisqu'il y a un algorithme. Les règles sont relatives à cause de tout un ensemble de paramètres qui s'annulent ou s'enrichissent les uns les autres. En l'occurence ce qu'on mesure sur un topic de news n'implique pas du tout que le suivant sera pareil puisqu'il n'y aura pas le même nombre de news sur le sujet, les mêmes éditeurs, le même délai entre les publications, le même degré d'actualité d'autres sujets qui viennent prendre la place, etc...
 
WRInaute accro
Tout le probleme se situe ou google va cherher son degés d'actualité, et surtout la pertinance d'un site par rapport à un autre.

J'ai fait 2 tentatives aujourd'hui pour placer une news en page d'accueil, et je ne passe pas. Je suis "recalé".

Mon sentiment est que google news tien compte du fait que tu as fais une "Une" récemment, et dans ce cas, il te mets dans une espèce de quarantaine pour quelques jours, voires même plusieurs semaines.

J'ai ce phénomène régulièrement, une espece de monté en puissance, avec un démarrage léger, puis la grosse cavalerie avec la une toute une journée, des effets secondaires le lendemain, voire le surlendemain.

Puis après, la quarantaine pour 15 jours à trois semaines. Un effet sandbox en gros.

Et ce shéma se répète chez moi depuis que je suis référencé sur google news.
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut