Problème de pages en double à cause de index.html

Discussion dans 'URL Rewriting et .htaccess' créé par Fredo73, 9 Avril 2013.

  1. Fredo73
    Fredo73 WRInaute discret
    Inscrit:
    4 Septembre 2008
    Messages:
    74
    J'aime reçus:
    0
    Bonjour,

    Je viens de voir que GWT me signale tout un tas de balises title en double.
    En fait, le problème de ces pages, c'est moi, sûrement, mais aussi "index.html"

    Je m'explique :
    ces pages sont toutes du type
    monsite.com/dossier/index.html et
    monsite.com/dossier/

    ou encore
    monsite.com/dossier/sousdossier/index.html et
    monsite.com/dossier/sousdossier/

    Comment faut-il faire, ou y a t'il une solution pour que, via le htaccess, toutes les URL du site se terminant par /index.html soient réécrites sans ce index.html ?

    Si quelqu'un a la solution, sachant que je suis nul dans ce domaine ... Je suis preneur ...

    Merci par avance
     
  2. longo600
    longo600 WRInaute passionné
    Inscrit:
    24 Février 2005
    Messages:
    2 208
    J'aime reçus:
    5
    Bonjour Fredo, c'est plutot Google qui est null sur ce genre de double ... ne connaissant pas un seul site qui a une page index default.html et une autre page index.html dans le même repertoire à la fois ...

    Si apres plus de 10 ans, les ingénieurs de Google ne savent pas résoudre ce probleme, c'est de la mauvaise volonté.

    ca ne pose pas de probleme je crois pour le referencement, a moins que certains ont des tests probants?
     
  3. Fredo73
    Fredo73 WRInaute discret
    Inscrit:
    4 Septembre 2008
    Messages:
    74
    J'aime reçus:
    0
    Il n'y a pas un risque de Duplicat si ces 2 adresses peuvent s'afficher ?
     
  4. longo600
    longo600 WRInaute passionné
    Inscrit:
    24 Février 2005
    Messages:
    2 208
    J'aime reçus:
    5
    Ben dans tous les cas, Google n'en choisira qu'une des deux a mettre dans les serps. Après, je ne saurais dire si cela influe sur le fait qu'une url est un répertoire et l'autre une page ...
     
  5. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 875
    J'aime reçus:
    72
    J'aurai quand même tendance à penser que plutôt que laisser l'une des deux pages tomber dans l'index complémentaire, mieux faut faire des redirections. Ca ne mange pas de pain, même si en effet on pourrait imaginer que Google soit en mesure de traiter ça comme un grand après toutes ces années.
     
  6. zeb
    zeb WRInaute accro
    Inscrit:
    5 Décembre 2004
    Messages:
    12 196
    J'aime reçus:
    1
    faudrait essayer un truc du genre dans le htaccess :

    Code:
    RewriteCond %{REQUEST_URI} ^(.*)index.html$
    RewriteRule (.*)index.html $1 [R=301,L]
    J'ai pas testé c'est l'esprit qui compte savoir réécrire toutes les urls finissant par /index.html par leur équivalent sans et renvoyer un 301.
    Faut aussi faire disparaitre tous les liens contenant "index.html" car ces urls sont pas arrivé par hasard.
    Ensuite tu as les inconditionnel du DC qui flippent dès que le site est accessible via deux urls et tu as les autres qui s'en contrefichent. Perso j'ai un site qui est resté 3/4 ans sans réécriture avec une version www et sans et j'ai jamais constaté de mieux quand j'ai réécrit une des deux versions bref ...
     
  7. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 875
    J'aime reçus:
    72
    Oui mais ça tu peux le gérer via GWT, sans forcément avoir besoin d'une redirection. Et on est quand même à une époque où avec tous les algos qui évoluent vers de plus en plus d'intransigeance, mieux vaut être le plus propre possible au niveau de la construction des sites.
     
  8. Fredo73
    Fredo73 WRInaute discret
    Inscrit:
    4 Septembre 2008
    Messages:
    74
    J'aime reçus:
    0
    Merci à vous tous pour vos réponses.

    @Zeb
    Je vais tester ta proposition pour essayer de ne plus avoir ces doublons

    @UsagiYojimbo
    J'aurai tendance à te rejoindre sur le fait que, par les temps qui courent, il vaut mieux éviter de tendre le bâton pour se faire battre ...

    Je vais essayer de jeter un œil avec le bout de code de Zeb.

    Encore merci et bonne soirée.
     
  9. zeb
    zeb WRInaute accro
    Inscrit:
    5 Décembre 2004
    Messages:
    12 196
    J'aime reçus:
    1
    Oui je me doute, tout comme tu peux ne rien faire et ne jamais avoir de souci si tu n'a pas d'url merdiques qui trainent donc que tu n'est pas crawlé en double. Mais le cas est amusant car il a une certaine valeur de "test". C'est un site que j'ai totalement négligé et même pas géré via GWT et comme dit plus haut aucun changement le jour de la mise a niveau vers un truc plus sérieux. Donc soit GG fait la corrélation tout seul comme un grand soit le DC 100% sur site est une légende urbaine (je penche plutôt pour le point 1 :D ).

    Après dans les faits j'abonde totalement dans ton sens tu as raison mieux vaux gérer le problème (vue que ça ne coute rien ou presque) que de se retrouver un jour le bec dans l'eau car c'est devenu "obligatoire".
     
Chargement...
Similar Threads - Problème double cause Forum Date
Problème meta en double à cause du rewriting ? URL Rewriting et .htaccess 20 Mars 2014
Problème sur une source Referral Googleads.g.doubleclick.net Google Analytics 7 Novembre 2019
Problème page en double sur Google avec et sans / Crawl et indexation Google, sitemaps 14 Janvier 2019
Double redirection : quel problèmes encourus ? Référencement Google 26 Mai 2015
Probleme d'url double apres url rewriting URL Rewriting et .htaccess 12 Mars 2015
Probleme de META description en double Débuter en référencement 7 Octobre 2014
Problème d'URL double indexée Netlinking, backlinks, liens et redirections 3 Juin 2014
Problème balises meta et title double Débuter en référencement 24 Février 2014
Problème ancre double vers même url Problèmes de référencement spécifiques à vos sites 18 Février 2013
Problème de point et double point avec une rewrite rule URL Rewriting et .htaccess 1 Février 2013
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice