Spamdexing

WRInaute impliqué
Une sorte de spamdexing que je n'ai pas bien compris :?
Pourtant tout les sites de vente de logos et de sonneries pour portable (enfin la plupart (les mieux placés surtout) ) utilisent cette technique :

Le site principal, qu'ils référencent un peu, fais un lien vers une centaine de liens externes... Qui de chacun de ces liens externes font des liens vers les autres...

Mais j'ai une question là dessus :
Comme personne ne fait de lien vers les autres url que la principale, à quoi cela và-t-il servir (au niveau du pr surtout !) ? (à part se faire blacklister je ne sais pas trop)
 
WRInaute impliqué
Fire Wolf, Tu peux être plus précis, c'est pas très clair ?
Donne nous aussi l'es URLs des sites concernés, celui qui émet les liens ceux qui les reçoivent, etc...
 
WRInaute impliqué
Ben tu cherche sur google tu ce qui est en rapport avec les téléphones portables :

sonnerie
sonneries
logos
portable
mobiles

Tu trouve tout lol.. (comme exemple je dirai [url supprimée pour ne pas trop avoir de probs])
 
WRInaute impliqué
Mais tu ne nous donnes toujours pas plus d'explications sur la technique utilisée si ce n'est ce que tu indiquais dans ton premier post:

Le site principal, qu'ils référencent un peu, fais un lien vers une centaine de liens externes... Qui de chacun de ces liens externes font des liens vers les autres...

Tu peux être plus clair et fournir un exemple...si tu veux qu'on essaye de fournir une réponse à ta question.
 
WRInaute discret
google calcule le pr avec un matrice. sauf qu'elle est trop grosse la matrice pour faire le calcul sur toute la matrice. alors il fait la calculs sur des sous matrices. donc si ton sites + tes faux sites sont assez gros pour faire la taille d'une de ses sous matrices, alors tu peux etre isolé du reste sans qu'aucune page ne pointe vers une de tes tienne, et avoir un pr de 10. bon tout ca est presque vrai car apres ils regardent les liens entre sous matrices, il faut donc que dans ta sous matrice ou tu tombe, il y ait aussi pas mal de lien qui pointent dessus. Exemple. La taille des sous matrices de google est 1.000.000 de pages. Toi tu en geres 500.000 et aucune page ne pointent dessus. les 500.000 autres sont des pages de yahoo avec pas mal de pages qui pointent dessus. google va attribuer en gros un pr moyen à la sous matrice de 1.000.000 de pages de pr_moyen=5 disons. puis il va voir dans la sous matrice de 1.000.000 comment les liens ont lieu. et la il va voir que la 1/2 des pages font un lien vers ta page d'index, il va donc attribuer a ta page d'index un pr de 8 disons, et les autres pages normales, en gros un pr de 3. (pour qu'en moyenne ca fasse 5 on avait dit). donc les pages de yahoo se retrouvent avec un moyenne de 3, toi avec un pr de 8, sans que tu n'es aucun lien qui pointe vers une des pages quetu geres. ! et voila !
 
WRInaute impliqué
Excuse moi Sergi mais je ne vis pas le rapport entre la question de FireWolf et ton explication.
Dis moi, tu as l'air très bien renseigné, d'où sors tu toutes ces infos ?
Perconnellement,j'ai entendu parler du blockrank...ça ressemble un peu à tes "matrices" mais tu as l'air d'en savoir plus.
 
WRInaute discret
ca sort d'un tres vieux papier des createurs de google qui doit s'intituler 'anatomie of a search engine' oubien un papier qu'ils ont publié peu apres...
PS une matrice c'est juste un concept formel qui aurait pu dans mon texte etre remplacé par 'block de pages web' effectivement ou 'groupe de pages web' au lieu de sous matrice.

En ce qui concerne la question de firewolf, il decrit un site qui a plein de pages web liées les unes aux autres (pour que google les trouve). mais il y a surtout plus de lien vers la page d'index que vers les autres. et il y en a plein. le but est qu'il y ait en tout, un nombre significatif de pages au total non négligeable par rapport à la 'taille' des sous matrices, ou des sous blocks de l'algo de google.
 
Olivier Duffez (admin)
Membre du personnel
le calcul du PR par matrices me semble être seulement la théorie (les équations de base du PR s'expriment très facilement de façon matricielle : trouver le PR de chaque page revient à diagonaliser une matrice. Le pb est que cette matrice représente tous les liens entre les documents indexés par Google).
Je pense que GG fait plutôt des calculs itératifs (sans matrices) qui aboutissent à une approximation du calcul matriciel.

Par contre j'ai un peu oublié le sujet de cette discussion... Sergi va nous expliquer mieux le rapport ;-)
 
WRInaute discret
admettons que ce soit iteratif comme tu le decris, ca ne change en rien. l'iteration n'est pas infinie, donc ils s'arretent au bout de 1000 iterations. Hors au bout de 1000 iterations, en commencant par exemple sur une des pages que tu geres, tu vas rester dans le lot de 500.000 pages que tu geres, et donc tu es seul maitre du pr que google t'attribueras suivant la structure de liens de tes 500.000 pages...

d'ou on colle toujours au sujet: comment avoir un bon pr avec pas ou peu de lien entrant, mais avec un nombre de page enorme.
 
WRInaute impliqué
oui des fois ce site ne marche pas... c'est pas grave vu que la plupart des sites de chargement de logos/sonneries trichent... donc voila un autre exemple :

-http://www.logo-max.com (pour pas augmenter leur positionnement >D)

vous voyez en dessous des logos des petits points... Du texte avec des liens vers d'autres sous domaines...

Pour une explication plus précise, voila :

Un site, le principal, se fait un peu référencer... Ce même site fait des liens externes par centaines... Et ces centaines de liens externes ont des interconnexion entre eux... Est-ce que cela servirai-t-il pour la popularité si personne ne fait de lien sur les autres sites externes identique au principal ? Moi je crois que non... (et surtout google n'indexe pas bien les pages qui dépassent les 100liens comme précisé)
 
WRInaute impliqué
OK FireWolf, maintenant je vois de quoi tu parles.
En fait, il s'agit de sous-domaines du même site et non pas de sites différents, et chaque sous domaine est optimisé sur une requête ou sur un groupe de requête , selon l'ancienne technique de la requête dans le nom de domaine.
Ainsi un des sous domaines reprendra la requête "logos couleurs", un autre, "logos noir et blanc", un autre "sonneries polyphoniques" et un autre "sonneries monophoniques", etc...mais le site qui apparaît est toujours le même (même contenu, même logo, même charte graphique).
C'est le système des pages satellites ou A...s (je mets des points car c'est une marque déposé par une société de référencement, mais pour ceux qui ne voient pas, pensez à la série dans laquelle la charmante héroïne s'appelle Sydney Bristow).
Pour ceux qui vont jusqu'au bout de cette technique, chaque sous site traite un pan entier de requêtes et pas seulement une requête.
Si on prend l'exemple du site "sonneries polyphoniques", la page d'accueil est optimisé pour la requête principale "sonneries polyphoniques", mais ensuite, un site entier se "déroule" sous ce sous domaine, avec au 1er niveau les requêtes "sonneries polyphoniques nokia", "sonneries polyphoniques motorolla", etc...soit la requête principale + marque
Ensuite, au niveau 2 s'ajoute le modèle, ce qui donne "sonneries polyphoniques nokia 7650", "sonneries polyphoniques nokia 3650", etc...pour la partie Nokia, et enfin au dernier niveau, tu auras des requête de type télécharger, télécharger gratuitement, downloader, etc...qui viennent se rajouter à la requête précédente, ce qui donne "télécharger sonneries polyphoniques nokia 7650"
Tu comprendras qu'ainsi chacun de ces sous domaines peut avoir plusieurs milliers de pages référencées, et avec une quinzaine de sous domaine, tu atteint le chiffre hallucinant de 100.000 pages référencées pour 1 site sur 1 seule langue (voir plusieurs sites si les sous domaines sont remplacés par des vrais noms de domaine, mais cela ne change rien, car il n'y a qu'un seul contenu derrière tous ces sites) et si tu multiplie cela par les 17 langues gérées par le n°1 européen de la sonnerie et du logos pour mobiles, tu dépasse allègrement le million de page pour le site d’un seul affilié motivé.
Ce qui explique que le n°1 avec ses milliers d'affiliés squatte les 1ères pages de Google, au travers de milliers de sites différents sur toutes les requêtes relatives aux logos et sonneries pour mobiles.
Pour en revenir aux sites, cette technique n'a pas vraiment intérêt pour leur PR car cela donne exactement le même résultat que si tu pointes vers les pages internes d'un même domaine, ce qui est le cas, puisqu'il s'agit juste de sous domaines.
Cela permet en revanche de les faire indexer par Google, mais en terme de popularité, rien de particulièrement interessant.
Par ailleurs, depuis la remise à jour de l'algo de Google, ces sites ont été pénalisés car lorsque Google "voit" la requête dans le NDD, le title, l'URL, les meta, les balises H1, H2, etc..les liens entrants, bref, partout, il se dit qu'on se fout un peu de sa gueule.
 
WRInaute occasionnel
WebRankInfo a dit:
le calcul du PR par matrices me semble être seulement la théorie (les équations de base du PR s'expriment très facilement de façon matricielle : trouver le PR de chaque page revient à diagonaliser une matrice. Le pb est que cette matrice représente tous les liens entre les documents indexés par Google).
Je pense que GG fait plutôt des calculs itératifs (sans matrices) qui aboutissent à une approximation du calcul matriciel.

Par contre j'ai un peu oublié le sujet de cette discussion... Sergi va nous expliquer mieux le rapport ;-)

J'aimerais bien qu'on m'explqiue pourquoi ça revient à diagonaliser une matrice de calculer le PR, bref j'ai déjà diagonalisé une matrice en cours de math mais est ce qu'avec un exmple simple on peux pas nous expliquer miex que ça?
 
WRInaute passionné
sietjp a dit:
J'aimerais bien qu'on m'explqiue pourquoi ça revient à diagonaliser une matrice de calculer le PR, bref j'ai déjà diagonalisé une matrice en cours de math mais est ce qu'avec un exmple simple on peux pas nous expliquer miex que ça?

Suivant ton prof, tes cours... tu as peut-etre vu l'utilisation des matrices pour resoudre un système d'équation. En gros, c'est ca. (pfou, au moins 10 ans que j'ai fait moi...)

François
 
WRInaute discret
oui voila quoi. en gros des que tu fais qqchose avec un matrice, il faut la diagonaliser. et sur la diagonale il y a les valeurs propres. et ca doit etre le pr ptet .. huhuhu quel pipotage
 
WRInaute impliqué
Je vois pas trop votre rapport avec les matrices... C'est quoi ? (au fait merci turulillo pour ta réponse j'ai tout ce qu'il faut maintenant)
 
WRInaute impliqué
Mais donc si on résume, faire des sous domaines comme çà ne fait rien au pr... Il touche juste le positionnement... Mais pour google, cela est négatif non ? Mais si chaque sous domaine a un mini-site (peut être même contenu, dit differamment, d'autres noms de fichiers, images...) cela pourrai être positif niveau référecement ? (ben à part avoir 200 liens externes sur ta page d'accueil, je ne vois rien d'autre de négatif !!)
 
WRInaute impliqué
En fait, avant c'était positif car tu avais la requête qui apparaissait dans le nom de domaine (dans le sous domaine très exactement), quant aaux liens, la ditribution du PR se faisait comme sur un site normal.
Aujourdh'ui, non seulement ça n'a plu d'intérêt mais il semblerait que Google pénalise les sites dont la requête apparait dans le nom de domaine ou le sous domaine.
Il y a beaucoup de sites qui utilisent cette technique, si tu veux, je peux t'en montrer un exemple particulièrement interessant sous beaucoup d'aspects.
 
WRInaute passionné
Bonjour,

comment vous arrivez parmi 100 critères, à isoler le mot clé dans le ndd comme étant le seul à causer une pénalité ?
 
WRInaute occasionnel
Eservice a dit:
Bonjour,

comment vous arrivez parmi 100 critères, à isoler le mot clé dans le ndd comme étant le seul à causer une pénalité ?

moi, je dis que c'est le colonel moutarde qui a tué la victime avec un chandellier dans la bibliotheque ! :D

ok !!! je sors :arrow:
 
WRInaute occasionnel
Firewolf,

je prefere vraiment ton nouvl avatar ... c est plus cool ... moins sanglant !
garde le comme ca ...
Du meme coup, j ai change le mien pour t encourager.
 
WRInaute impliqué
C'est cool mais tu préfère lequel ?
3470.gif
(pris sur freegaia)
p1ngu.gif
(modifié moi même)
(PS : je préférai ton ancien avatar mais chacun ses gouts)
 
WRInaute occasionnel
je prefere le premier car les gifs animes me donnent mal a la tete sur les forums ... c est marrant mais un peu enervant ...
 
WRInaute impliqué
Eservice a dit:
...comment vous arrivez parmi 100 critères, à isoler le mot clé dans le ndd comme étant le seul à causer une pénalité ?

turulillo a dit:
...mais il semblerait que Google pénalise les sites dont la requête apparait dans le nom de domaine ou le sous domaine..


Ce n'est qu'une hypothèse que je formule la, comme toi lorsque tu parles de 100 critères, qui te dis qu'il n'y en a pas 101 ?
Cette hypothèse provient de sources comme les articles de SearchEngineWatche ou ceux de SearchEngineNews.
Si tu le souhaites, et si ça ne me prend pas trop de temps, j'essaierais de la retrouver.
 
WRInaute passionné
Bonjour turulillo,

turulillo a dit:
Ce n'est qu'une hypothèse que je formule la, comme toi lorsque tu parles de 100 critères, qui te dis qu'il n'y en a pas 101 ?
Plus de 100 facteurs (dont notre algorithme PageRank) déterminent automatiquement l'ordre d'affichage des résultats Google.
source : https://www.google.fr/intl/fr/webmasters/4.html

turulillo a dit:
Cette hypothèse provient de sources comme les articles de SearchEngineWatche ou ceux de SearchEngineNews.
Si tu le souhaites, et si ça ne me prend pas trop de temps, j'essaierais de la retrouver.
Merci d'avance
 
Olivier Duffez (admin)
Membre du personnel
J'ai dû éditer certains messages de cette discussion pour éviter d'avoir des problèmes.
Je remercie donc les membres de ce forum d'éviter de dénoncer des sites en donnant leur noms (surtout quand on applique soi-même des techniques de triche...)
 
WRInaute impliqué
Je vois que tu as envie de me faire bosser Eservice ;-)
Désolé, mais après avoir longtemps cherché, je ne retrouve pas ma source...mais je vais jeter de nouveau un coup d'oeil ce week end.
En revanche, dans la boîte où je bosse (je ne citerais pas son nom), c'est une constatation qui est devenue évidente a ce point que les sites référencés à travers des milliers, voire des dizaines de milliers de pages (base de données de sites marchands) via des sous domaines ont été tous retravaillés car ils avaient perdu énormément de trafic.
exemple de ce que nous faisions avant: achat du nom de domaine www.marchand.com pour le client www.commercant.com, exemple fictif, donnait lieu à des sous domaines comme hi-fi.marchand.com, video.marchand.com puis en niveau 2 : dvd.marchand.com/matrix, etc...qui redirigeaient ensuite vers les vrais pages du site client
exemple de ce que nous faisons aujourd’hui
www.marchand.com/hi-fi, www.marchand.com/video, et en niveau 2 : www.marchand.com/dvd/matrix, etc...Je ne dis pas que c'est la bonne solution (je ne vois pas trop l'intérêt d'ailleurs) mais cela illustre la croyance actuelle qui veut qu'il y ait un OOP (Over Optimisation Penalty) sur Google et qui touche plus particulièrement les noms de domaines et les sous domaines, lorsque ceux-ci correspondent mot pour mot à la requête de l'internaute.
 
Discussions similaires
Haut