[htaccess] problème avec répertoires "fantômes"

Discussion dans 'URL Rewriting et .htaccess' créé par carole heinz, 17 Avril 2009.

Tags:
  1. carole heinz
    carole heinz WRInaute passionné
    Inscrit:
    28 Février 2007
    Messages:
    2 417
    J'aime reçus:
    0
    edit: j'ai effacé mon précédent post car j'avais mal cerné le problème

    bonjour,

    sur un site actuellement en développement, je me suis rendue compte qu'en injectant des répertoires "fantômes" dans l'url, je n'obtenais pas une erreur 404, mais une page équivalente à la "bonne" page.

    exemple:

    page originale:
    -http://www.example.com/ma-page.html

    pages problématiques renvoyant le même contenu:
    -http://www.example.com/nimportekoi/ma-page.html
    -http://www.example.com/blablabla/ma-page.html

    en testant plusieurs sites, dont des "gros", on se rend compte qu'un (très) grand nombre de sites ont ce problème!
    exemple avec un "gros" de la location de vacances:

    page originale:
    -http://www.homelidays.com/caracas/appartement104723fr1.htm

    pages fantômes fonctionnant:
    -http://www.homelidays.com/caracas/blablablabla/appartement104723fr1.htm
    -http://www.homelidays.com/caracas/superleduplictatecontent/appartement104723fr1.htm
    -http://www.homelidays.com/blablablablabla/caracas/appartement104723fr1.htm
    - etc etc.

    sûrement un petit souçi au niveau du htaccess, comment régler ce problème? je n'ai trouvé qu'un seul topic à ce sujet, ici, mais resté sans réponse...
     
  2. JanoLapin
    JanoLapin WRInaute accro
    Inscrit:
    21 Septembre 2008
    Messages:
    4 226
    J'aime reçus:
    0
    Si tu développes sous Spip, il me semble que le problème a été réglé avec la nouvelle version de ce cms.
     
  3. carole heinz
    carole heinz WRInaute passionné
    Inscrit:
    28 Février 2007
    Messages:
    2 417
    J'aime reçus:
    0
    non il s'agit d'un script perso, mais le problème semble le même.
     
  4. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    12 011
    J'aime reçus:
    133
    La solution peut-être de vérifier dans le langage serveur utilisé (PHP par exemple) que l'url utilisée est valide par rapport au type de contenu affiché.
     
  5. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    20 825
    J'aime reçus:
    833
    en général il faut en effet vérifier en 1er dans le script de la page, que l'URL demandée est bien l'URL officielle, et rediriger en 301 vers l'officielle si nécessaire. J'ai proposé dans mon article sur le duplicate content un bout de script qui peut servir à certains.

    Il existe un plugin pour Wordpress qui redirige en 301 si l'URL demandée n'est pas l'URL officielle (je l'ai supprimé de WRI car c'était incompatible avec mes URL bidouillées de pages catégories, mais cette discussion est l'occasion de m'y replonger)
    la version SEO que j'utilise de phpBB intègre un mod qui gère ça également

    sinon il y a aussi la possibilité d'utiliser la balise link rel canonical
     
  6. serval2a
    serval2a WRInaute accro
    Inscrit:
    21 Mars 2005
    Messages:
    2 550
    J'aime reçus:
    0
    Salut,
    Le problème initial vient du fait que logiquement tu te sers d'une formule simplifiée de ré-écriture de ces dossiers "virtuels", de fait cela agit comme une wildcard et ré-écrit même si le nom de dossier est "erroné", la solution la plus basique consiste à inscrire à même la règle de ré-écriture le nom du dossier et donc d'avoir une ligne dans le .htaccess par chaque dossier que tu veux être valide. Ce faisant tu as bien une 404 si le dossier n'existe pas.
    Sinon effectivement tu agis en aval avec une règle de redirection en PHP par exemple qui vérifiera que le dossier "virtuel" existe et à l'inverse redirigera vers le bon ou, si tu préfères, provoquera l'affichage d'une 404 par injection dans l'entête HTTP.
    @+
     
Chargement...
Similar Threads - [htaccess] problème répertoires Forum Date
[htaccess] Rediriger toutes les erreurs 404 vers ma home Crawl et indexation Google, sitemaps 30 Janvier 2019
[htaccess] - erreur quand l'adresse termine par / URL Rewriting et .htaccess 4 Juillet 2007
[htaccess] suffixe nom de domaine URL Rewriting et .htaccess 23 Mars 2007
[HTACCESS] Autoriser un dossier a la racine URL Rewriting et .htaccess 20 Avril 2006
Gros problème sur la profondeur de mes pages Problèmes de référencement spécifiques à vos sites Vendredi à 09:06
Problème de htaccess chez Ionos URL Rewriting et .htaccess 12 Septembre 2022
Problème sur jquery avec fonction asynchrone Développement d'un site Web ou d'une appli mobile 6 Septembre 2022
Problème de crawl et d'indexation Crawl et indexation Google, sitemaps 1 Septembre 2022
WordPress Problème affichage style avec Elementor (titre, bordures, separateur) Administration d'un site Web 8 Août 2022
Problème d'indexation de backlinks Débuter en référencement 24 Juillet 2022
Problème d'indexation de backlinks Problèmes de référencement spécifiques à vos sites 21 Juillet 2022
Probleme de visibilité de ma page Facebook Facebook 5 Juillet 2022
problème avec le développeur Droit du web (juridique, fiscalité...) 22 Juin 2022
Problème désindexation des pages de Google Débuter en référencement 21 Juin 2022
Problème d'indexation de pages sur Google Problèmes de référencement spécifiques à vos sites 31 Mai 2022
problème de redirection non souhaitée Administration d'un site Web 28 Avril 2022
Problème d'indexation Produits Prestashop Crawl et indexation Google, sitemaps 28 Avril 2022
Problème d'affichage des campagnes Google Ads dans un tableau de bord Data Studio AdWords 26 Avril 2022
Problème de vitesse d'affichage des pages sur Analytics Google Analytics 26 Avril 2022
Problème : Google Crawl et Index des pages en No Index et bloqué par le robot.txt Crawl et indexation Google, sitemaps 26 Avril 2022