BUG google, yahoo sur le slash

Nouveau WRInaute
Je voudrais l'avis sur un bug que j'ai pus constater.

Ce bug touche sur google, webrankinfo, et pas mal d'autre site.
Est-ce vraiment un bug dans ce cas ?

Le problème c'est qu'à tous les répertoires avec un slash on peut ajouter mille et un slashes.

Je donne quelques exemples de cas :
Code:
http://fr.sports.yahoo.com/formule-1///////
https://www.google.fr/intl/fr/services/////////////////////

Je suppose que si, tout le monde à ce problème c'est qu'il ne peut être résolu ?
Dans toutes mes pages, je vérifie tout le temps que la page correspond bien au format que je veux lui attribuer, dans le cas contraire il y a une redirection 301 donc dans mon cas ça ne gêne pas. Je trouve juste que c'est un bug excessif, pour ne pas l'avoir corriger.

Avez-vous une réelle méthode pour corriger ça directement via apache pour avoir une 404 directement, plutôt que de consommer des ressources serveur en le fesant via php par exemple ?

Code:
RewriteRule ^exemple/$ la-page-de-rempalcement [L]
j'ai essayer egalement :

Code:
RewriteRule ^exemple([/]{1})$ la-page-de-rempalcement [L]
(ça ne marche pas) si vous avez d'autres idées, n’hésitez pas

edit : Apparament, ça le fait même sur les vrais dossiers (ceux non rewrit). Donc c'est vraiment apache, le problème ?
 
WRInaute accro
Re: BUG google, webrankinfo sur le slash

sympa de mettre les url's réelles afin de référencer ces url's pourris sur Google, les propriétaires de sites vont t'aimer tiens :)
 
Nouveau WRInaute
C'est vrai, mais gogole et yahoo ne risquent pas d'avoir de gros problème de référencement :) Mais je vais retirer par sécurité celle de webrankinfo. Mais je pense intimement que google à l'habitude de cette erreur.
Mais c'est vrai que ce bug peut être une sorte de porte ouverte pour pourrir un site web qui oublie de faire des 301 ou 404.
 
WRInaute passionné
Heu, supprime l'url vers Yahoo!. J'ai mes actus affichées sur cette partie de leur site. Affiche plutôt le foot :mrgreen:

Mais je ne pense pas que cela pose un problème...
 
Nouveau WRInaute
IllusionPerdu a dit:
Sur mais sites ça te renvoie une jolie erreur 404 ^^ ça doit donc venir des règles de rewrite qui sont mal faite ^^
Je ne pense pas justement. Créer un dossier à la racine par exemple "test" tape dans ton navigateur :

Code:
http://www.tonsite.com/test///////
normalement ca marche.
As-tu apache ?

Si tu n'as pas fait ton site toi même je pense que derrière les gens ont pensé à mettre un 404 sur les urls non correspondantes. Si, c'est toi qui l'as créé, tu l'as peut-être fait par inadvertance en vérifiant que l'url correspond au rewrit (c'est également mon cas).
 
WRInaute accro
Et sérieusement, c'est quoi le problème? Tant que tu ne fais pas des liens "incorrects", ça ne gêne personne...

Jacques.
 
Nouveau WRInaute
Descendre les concurrents en créant des centaines de liens vers une même page. A condition que Google ne prenne pas en compte ce bug.

J'expose juste ce que j'ai trouvé et voir si y avais un meilleur solution que vérifier la page avec request uri et faire une redirection 301 ou 404.
 
WRInaute accro
Alors...

- pour la majorité de ceux qui font du rewriting du genre /toto-.*-([0-9]*).html /lescript.php?id=$1, tu peux créer des milliers de pages du type /toto-ca-c-est-le-titre-original-de-l-article-1234.html, /toto-ca-c-est-un-autre-titre-1234.html, /toto-et-ca-aussi-1234.html...

- pour la majorité des sites, si tu as une page /toto.php, tu peux aussi balancer dessus /toto.php/un-truc, /toto.php/un-autre-truc, sans parler evidemment des /toto.php?parametre-bidon=1, /toto.php?autre-parametre=456, etc.

Bref, à moins d'être très, très, très rigoureux, pour pratiquement n'importe quelle page, il existe une infinité d'URLs possibles qui renvoient sur la même page, rien de nouveau dans tout ça. Tant que tu ne fais que des liens propres, pas de souci. Et même s'il y a des liens incorrects, c'est là que le filtrage du duplicate content fait son boulot: Google va choisir une page (laquelle? mystère et boule de gomme), et oublier les autres. Tu peux toujours l'aider avec un petit canonical ou un 301 si tu veux, mais je pense qu'ils sont assez grands chez Google pour y arriver tout seuls. L'important pour toi, c'est que les liens légitimes utilisent la bonne URL (ou au pire fassent un 301) pour ne pas perdre du "jus" (ou plutôt pour ne pas l'étaler sur des pages inutiles et/ou pour avoir les "bonnes" URLs dans les résultats, si ça a une importance pour toi), mais à part ça...

Jacques.

EDIT: tout plein de typos
 
Discussions similaires
Haut