Bonjour,
Google indexe environ 21 080 pages d'un dédié à la découverte des langues étrangères, avec pour une grande partie d'entres-elles des probabilités proches de zéro qu'elles soient un jour visitées par des humains (par exemple, parmi des centaines, le thème "transports" en breton pour des utilisateurs thaïlandais).
La structure du site est la suivante : pour chacune des 40 langues à apprendre, le site propose de découvrir des expressions dans 17 thèmes, à partir d'une des 31 langues utilisateur. Le 1er thème (expressions essentielles) est aussi la page principale pour chaque langue. Comme il y a 31 langues utilisateurs, cela fait 40x17x31 URL
Le contenu de chacune de ces pages, même s'il est textuellement assez réduit d 'un point de vue informatique, est cependant issu d'un travail humain (traductions adaptées pour chaque couple de langues, enregistrements audio humains, illustrations originales) et propose un service éducatif utile (confirmé par le temps moyen passé sur le site).
Voici ma question : afin d'aider Google à mieux référencer le site (qui reçoit déjà entre 15000 et 25000 visites par jour), ne faudrai-il pas conserver que le thème principal et retirer du sitemap.xml et éventuellement mettre en noindex les milliers de pages des sous-thèmes qui ont une faible probabilité d'être affichées par des humains, et ne les indexer que lorsqu'elles commencent à être vraiment visitées à partir de la page du thème principal ?
Merci pour vos conseils !
Christophe
Google indexe environ 21 080 pages d'un dédié à la découverte des langues étrangères, avec pour une grande partie d'entres-elles des probabilités proches de zéro qu'elles soient un jour visitées par des humains (par exemple, parmi des centaines, le thème "transports" en breton pour des utilisateurs thaïlandais).
La structure du site est la suivante : pour chacune des 40 langues à apprendre, le site propose de découvrir des expressions dans 17 thèmes, à partir d'une des 31 langues utilisateur. Le 1er thème (expressions essentielles) est aussi la page principale pour chaque langue. Comme il y a 31 langues utilisateurs, cela fait 40x17x31 URL
Le contenu de chacune de ces pages, même s'il est textuellement assez réduit d 'un point de vue informatique, est cependant issu d'un travail humain (traductions adaptées pour chaque couple de langues, enregistrements audio humains, illustrations originales) et propose un service éducatif utile (confirmé par le temps moyen passé sur le site).
Voici ma question : afin d'aider Google à mieux référencer le site (qui reçoit déjà entre 15000 et 25000 visites par jour), ne faudrai-il pas conserver que le thème principal et retirer du sitemap.xml et éventuellement mettre en noindex les milliers de pages des sous-thèmes qui ont une faible probabilité d'être affichées par des humains, et ne les indexer que lorsqu'elles commencent à être vraiment visitées à partir de la page du thème principal ?
Merci pour vos conseils !
Christophe