Bijour,
Google est un robot, alors pas étonnant qu’il soit idiot... le problème, c’est qu’il se croit intelligent, alors pas évidement de l’aider dans ces conditions là.
Malgré tout, j’essaie d’imaginer des solutions.
J’ai par exemple remarqué que entre autre le fait que Google préfère les fautes d’orthographes et de grammaires et qu’il sanctionne sévèrement leur correction, préfère le duplicate-content et sanctionne violemment l’interdiction de son indexation, préfère les erreurs les URL renvoyant des erreurs, etc (j’en passe d’autres) j’ai également remarqué qu’il préfère les contenu binaire sans intérêt autre que le téléchargement plutôt que les documents textes interprétables par les humains (Google étant un robot, pas étonnant qu’il ne sache pas).
Comme je constate qu’il n’indexe pas les pages intéressantes mais qu’il indexe, je me demande bien pourquoi, des contenu binaires (exécutables Windows, icônes Mac, archives de données brutes non directement interprétable, etc.) et à hauteur de quantités dépassant nettement le contenu texte qu’il indexe pour le site, je me demande si lui interdire d’indexer le répertoire de téléchargement pourrait l’aider à comprendre qu’il est préférable qu’il indexe les contenus texte plutôt (ce serait même plus économe pour son index... mais comment un robot peut-il comprendre cela).
Donc je pense évidement à un filtre dans un Robots.txt... mais voilà, il se trouve que j’ai constaté que Google n’a pas du tout aimé que je veuille l’empêcher d’indexer des URL qui se terminent systématiquement en redirection 302, alors je me demande quelle pourrait bien être sa réaction si je décide de l’aider en lui indiquant que ce n’est pas la peine d’indexer des fichiers non-pertinents. Son orgueil ne risque t-il pas d’être blessé ? Va t-il encore s’énerver ?
Qu’en penser ?
Google est un robot, alors pas étonnant qu’il soit idiot... le problème, c’est qu’il se croit intelligent, alors pas évidement de l’aider dans ces conditions là.
Malgré tout, j’essaie d’imaginer des solutions.
J’ai par exemple remarqué que entre autre le fait que Google préfère les fautes d’orthographes et de grammaires et qu’il sanctionne sévèrement leur correction, préfère le duplicate-content et sanctionne violemment l’interdiction de son indexation, préfère les erreurs les URL renvoyant des erreurs, etc (j’en passe d’autres) j’ai également remarqué qu’il préfère les contenu binaire sans intérêt autre que le téléchargement plutôt que les documents textes interprétables par les humains (Google étant un robot, pas étonnant qu’il ne sache pas).
Comme je constate qu’il n’indexe pas les pages intéressantes mais qu’il indexe, je me demande bien pourquoi, des contenu binaires (exécutables Windows, icônes Mac, archives de données brutes non directement interprétable, etc.) et à hauteur de quantités dépassant nettement le contenu texte qu’il indexe pour le site, je me demande si lui interdire d’indexer le répertoire de téléchargement pourrait l’aider à comprendre qu’il est préférable qu’il indexe les contenus texte plutôt (ce serait même plus économe pour son index... mais comment un robot peut-il comprendre cela).
Donc je pense évidement à un filtre dans un Robots.txt... mais voilà, il se trouve que j’ai constaté que Google n’a pas du tout aimé que je veuille l’empêcher d’indexer des URL qui se terminent systématiquement en redirection 302, alors je me demande quelle pourrait bien être sa réaction si je décide de l’aider en lui indiquant que ce n’est pas la peine d’indexer des fichiers non-pertinents. Son orgueil ne risque t-il pas d’être blessé ? Va t-il encore s’énerver ?
Qu’en penser ?