RESOLU - duplicate content ou pas ?

Nouveau WRInaute
je m'occupe d'un site d'une société qui vend des logiciels, et j'ai mis en place une page 404 qui permet, si l'on tape www.monsite.fr/nomLogiciel de retomber sur la page de description du logiciel, qui est normalement www.monsite.fr/logiciels.cfm?ID=XXX

la première URL est plus intéressante je pense au niveau référencement car elle intègre le nom du logiciel, mais j'ai peur d'avoir généré du duplicate content... car la commande site: donne 676 pages, mais Google n'en considère que 217 de pertinentes


est-ce bien du duplicate content ??? ( :oops: )


j'ai du refondre ce site il y a 3 ans, c'était mon tout premier site et à l'époque le référencement m'était complétement étranger...
j'aimerai bien l'optimiser mais j'hésite un peu à changer, car ca fait un moment que ce système est en place, et le référencement n'est pas mauvais, il apparait en première page pour quasiment tous les logiciels ...

La première place serait encore mieux, mais j'ai peur de faire pire que mieux ... que me conseillez-vous ???
 
WRInaute occasionnel
Quelle-est l'adresse de ton site ?
Je ne pense pas que ce soit celui de ton profil qui n'a pas de rapport avec la vente de logiciel.

En plus, je pense que tu te trompes, car une page 404 est une page d'erreur. Je pense que tu parles plus d'une redirection.
 
Nouveau WRInaute
nan c bien du 404, géré sous IIS

le répertoire monsite.fr/nomLogiciel n'existe pas, donc ca passe par le 404 de IIS... et là j'appele une page 404.cfm qui regarde ce qui est tapé dans l'url, et si ca correspond à un nom de logiciel de la base de donnée, j'inclue alors les informations du logiciel dans cette page 404.cfm

j'inclue directement dans la page 404.cfm car je veux éviter les redirections... comme je bosse sous coldfusion, et que je vous vois parler de redirection 301 et que je sais pas comment faire, j'essaie d'éviter les redirections (d'ailleurs comment vous faites exactement les 301, faut etre sous PHP ??)

sinon l'adresse c copernet.fr
 
WRInaute occasionnel
Toutes tes pages de tarifs sont indexées par Google sous la forme :
-www.copernet.fr/tarifs.asp?IDProduit=XX
et ont le même titre et pas de description.
==> C'est une chose qui peut engendrer du duplicate content.

Par contre, avec la commande "site:" je ne vois pas de trace de tes pages de forme -www.monsite.fr/nomLogiciel ????

Autres remarques : J'ai aussi remarqué qu'il y avait des balises <br> dans certains titres (par exemple -http://www.copernet.fr/logiciels_produit.cfm?IDProduit=109&onglet=tarifs), et ça ce n'est pas normal. Tout comme il y a des liens dans certaines descriptions (par exemple -http://www.copernet.fr/logiciels_produit.cfm?IDProduit=96&onglet=presse).

le répertoire monsite.fr/nomLogiciel n'existe pas, donc ca passe par le 404 de IIS... et là j'appele une page 404.cfm qui regarde ce qui est tapé dans l'url, et si ca correspond à un nom de logiciel de la base de donnée, j'inclue alors les informations du logiciel dans cette page 404.cfm
Moi j'aurais fait de l'URL-rewriting pour renommer le nom des pages.
 
WRInaute discret
Aquarius a dit:
Moi j'aurais fait de l'URL-rewriting pour renommer le nom des pages.
+1
peut etre que je me trompe mais si tu fais un include dans un 404 je pense que google considère tout simplement que la page n'existe pas donc ne te la reference pas :?:
 
Nouveau WRInaute
Aquarius a dit:
Toutes tes pages de tarifs sont indexées par Google sous la forme :
-www.copernet.fr/tarifs.asp?IDProduit=XX
et ont le même titre et pas de description.
==> C'est une chose qui peut engendrer du duplicate content.


le problème avec cette page asp, c'est que c'est une page transitoire, pour gérer du XML, elle n'affiche rien et dès qu'elle est chargée, elle redirige vers une page CFM pour afficher les infos ... donc sans titre ni description ... vé me pencher sérieusement dessus pour essayer de changer ça



Aquarius a dit:
Par contre, avec la commande "site:" je ne vois pas de trace de tes pages de forme -www.monsite.fr/nomLogiciel ????

nan, mais quand on saisit un nom de logiciel sous google ( https://www.google.fr/search?hl=fr&q=pri ... DcountryFR )
le premier résultat est de la forme monsite.fr/nomLogiciel,
et le troisième est de la forme monsite.fr/logiciels.cfm?ID=XXX



pour les BR dans les titres, je reprend les infos de la base pour générer le titre des pages, et il a fallu rajouter dans la base ces BR, pour que l'affichage soit correct sur les pages... mais je pense qu'en remettant ces titres en H1 et en modifiant la base, ca sera réglé... je fais modifié ça aussi




et pour l'URL rewriting je suis d'accord... on en parle souvent sur WRI, et je me suis tjs dis qu'il fallait le faire mais faute de temps et surtout de connaissances, ca reste en suspens... apparamment ca se gère avec des fichier .htaccess il me semble, mais j'en sais pas plus : ca se met ou ? quel est le code ? etc... Bref, si vous avez un bon ptit lien explicatif je suis preneur


Dixit a dit:
peut etre que je me trompe mais si tu fais un include dans un 404 je pense que google considère tout simplement que la page n'existe pas donc ne te la reference pas

je pense pas, vu qu'il accepte les pages monsite.fr/nomLogiciel
par contre, j'ai changé il y a qqs jours le code pour que les title et description soient différents sur chaque page, et il ne le prend pas en compte lorsque l'on passe par le 404.... donc l'url rewriting va vraiment s'imposer


mais si je fais de l'url rewriting, les urls vont donc changer... cela ne va pas altérer le référencement déjà existant ??




en tout cas merci infiniment pour votre réponse, ya du boulot visiblement :)
 
WRInaute occasionnel
Pour l'htaccess, il faut le mettre à la racine de ton site. Tu peux trouver quelques explications sur WRI en tapant "Rewriting" dans l'outil de recherche en haut à droite.
Tu peux déjà commencer par ça :
URL Rewriting expliqué aux débutants
L'URL Rewriting expliqué aux débutants (sujet du forum)

mais si je fais de l'url rewriting, les urls vont donc changer... cela ne va pas altérer le référencement déjà existant ??
Je pense qu'il faudra aussi que tu fournisses un fichier robots.txt à ton site, pour exclure les anciens URL du crawl des robots et pour désindéxer celles déjà présentent dans Google.
Vois ça à cette adresse : FAQ sur les robots
et l'adresse pour désindéxer les pages de Google une fois le fichier robots.txt mis en place :
Pour supprimer une partie de votre contenu de l'index Google

Voilà pour la lecture et bon courage pour la suite :wink:
 
Nouveau WRInaute
apparamment ca se gère que sous Apache le .htaccess
et je suis sous IIS ... me pencherait sur ce prob dès que les autres conneries seront réglées


merci pour ton aide aquarius :wink:
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut