Depuis quelques updates/mois, la visibilité de Pinterest "explose" dans Google. C'est démultiplié par le fait que Pinterest fait indexer plein de versions locales (extensions ccTLD). Mais comment font-ils ?
Nico (de Sistrix) a très bien résumé sur Twitter ce qui a été révélé notamment par @SwiftOnSecurity
d'abord, voici l'évolution de l'indice de visibilité Sistrix (google FR) pour Pinterest.fr et .com. Un indice de 500 est gigantesque. Si vous avez 5 ce n'est pas si mal
Etape 1 : les utilisateurs uploadent des photos sur Pinterest sans aucune métadonnée. L'image seule ne peut pas être un réel atout pour le SEO de Pinterest, donc un traitement va être réalisé...
Etape 2 : Pinterest effectue automatiquement une recherche inversée sur les photos, en scrapant les descriptions et les commentaires textuels qui accompagnent ces mêmes images dans les SERP
Etape 3 : Pinterest crée une page unique pour chaque image avec un titre, puis rassemble les commentaires du propriétaire de l'image ainsi que les extraits de Google dans une section intitulée "Ce que disent les autres".
Etape 4 : Google indexe ces pages et leur donne de la pertinence. De sorte qu'elles commencent à apparaître dans les SERP pour les requêtes qui correspondent aux descriptions et aux métadonnées que Pinterest a récupérées sur d'autres sites. Autant dire que Pinterest prétend que les commentaires sont des textes écrits par ses propres utilisateurs, alors qu'ils sont volés. Mais cela fonctionne.
Et cela fonctionne, selon @RankScience parce que les pages ont été conçues pour décrire sémantiquement les images d'une manière que l'algorithme d'indexation de Google peut comprendre, ce qui conduit à leur référencement.
Ce qui est étrange, c'est que Pinterest a réussi à indexer plus de 800 millions de pages sans que Google ne se rende compte de la supercherie. Maintenant que cela a été révélé, peut-être que l'algorithme sera mis à jour pour éviter ce genre de pratique.
En général, Google ne réagit pas avec bienveillance aux plateformes qui extraient des informations du moteur de recherche de manière massive et automatisée. Par exemple Softonic et Giphy ont eu une pénalité pour searchdexing (indexation de résultats de recherches) :
Quand et comment Google va-t-il réagir à votre avis ?
Nico (de Sistrix) a très bien résumé sur Twitter ce qui a été révélé notamment par @SwiftOnSecurity
d'abord, voici l'évolution de l'indice de visibilité Sistrix (google FR) pour Pinterest.fr et .com. Un indice de 500 est gigantesque. Si vous avez 5 ce n'est pas si mal
Etape 1 : les utilisateurs uploadent des photos sur Pinterest sans aucune métadonnée. L'image seule ne peut pas être un réel atout pour le SEO de Pinterest, donc un traitement va être réalisé...
Etape 2 : Pinterest effectue automatiquement une recherche inversée sur les photos, en scrapant les descriptions et les commentaires textuels qui accompagnent ces mêmes images dans les SERP
Etape 3 : Pinterest crée une page unique pour chaque image avec un titre, puis rassemble les commentaires du propriétaire de l'image ainsi que les extraits de Google dans une section intitulée "Ce que disent les autres".
Etape 4 : Google indexe ces pages et leur donne de la pertinence. De sorte qu'elles commencent à apparaître dans les SERP pour les requêtes qui correspondent aux descriptions et aux métadonnées que Pinterest a récupérées sur d'autres sites. Autant dire que Pinterest prétend que les commentaires sont des textes écrits par ses propres utilisateurs, alors qu'ils sont volés. Mais cela fonctionne.
Et cela fonctionne, selon @RankScience parce que les pages ont été conçues pour décrire sémantiquement les images d'une manière que l'algorithme d'indexation de Google peut comprendre, ce qui conduit à leur référencement.
Ce qui est étrange, c'est que Pinterest a réussi à indexer plus de 800 millions de pages sans que Google ne se rende compte de la supercherie. Maintenant que cela a été révélé, peut-être que l'algorithme sera mis à jour pour éviter ce genre de pratique.
En général, Google ne réagit pas avec bienveillance aux plateformes qui extraient des informations du moteur de recherche de manière massive et automatisée. Par exemple Softonic et Giphy ont eu une pénalité pour searchdexing (indexation de résultats de recherches) :
Quand et comment Google va-t-il réagir à votre avis ?