Besoin d'avis de pros pour mon site regime

Nouveau WRInaute
Bonjour
J'ai un site phpnuke que j'ai rewrité, tout sauf le module coppermine.
Avec Xenu, j'ai bien mes liens du type http://www.club-regime.com/maigrir-72.html (en html).
Ca fait 3 mois que j'ai tout rewrité.
Dans google, quand je tape site:http://www.club-regime.com j'ai bien quelques url de ce type (www.club-regime.com/ratelink-20-La_Patiss.html) mais trés trés peu et il y a toujours mes anciennes url (www.club-regime.com/modules.php?name=Co ... age&pid=26)
S'il vous plait quelqu'un pourrait il me dire ce qui ne va pas et ce qu'il faut que je change ? Car j'ai attendu 3 mois, je veux bien attendre mais je me dis que j'ai raté qq chose car google m'a pris que qeulques url et gardé les anciennes en plus. :roll:
Merci beaucoup pour votre aide.
 
Nouveau WRInaute
ok

Merci pour ta réponse. Je ne connais pas du tout ce fichier j'ai lu le lien que tu m'as donné.
Google a environ 300 anciennes url.
Quelle solution est la meilleure ? Peux tu me donner juste qq exemples à mettre dans le fichier ?
Comment mettre
Disallow: /test.htm
Disallow: /test2.htm
Disallow: /test3.htm
enfin a la place du chiffre un caractere general ? Disallow: /test*.htm avec * ca va ?
Merci :p
 
WRInaute occasionnel
Je ne comprends pas ton message
Tu ne veux pas empecher google de venir sur tes pages htm mais bien l'empecher de garder les .php

Par ailleurs le fichier robots.txt ne permet pas de jokers comme *

Mais tu peux interdire un repertoire entier ou un fichier .php
 
Nouveau WRInaute
Et bien en fait, pourrais tu m'aider à faire la ligne du robots.txt ?
Je dois lui dire de ne pas référencer les "modules.php?nama=content..." mais de prendre les maigrir-....html$
Voici mon robots.txt actuel à ma racine
Code:
User-agent: Mediapartners-Google*
Disallow: 
User-agent: *
Disallow: admin.php
Disallow: /admin/
Disallow: /images/
Disallow: /includes/
Disallow: /themes/
Disallow: /blocks/
Disallow: /modules/
Disallow: /language/Bonjour
Merci pour tout je ne sais pas comment m'en sortir j'ai l'impression de piétinner pourtant j'ai lu plein d'articles et attendu google.
Merci :oops:
 
Nouveau WRInaute
Pour que GG ne référence pas tes modules.php?, mets simplement dans robots.txt:

Disallow: /modules.php?

Tu peux vérifier le résultat avec le validateur w3c: http://validator.w3.org/checklink


Par ailleurs, si tu interdis à GG d'aller dans /themes/, est-ce qu'il n'aura pas des problèmes pour charger ta feuille de style?
 
Nouveau WRInaute
merci

Merci pippo j'ai fait le test avec le validateur w3c et il trouve toutes mes pages que je veux indexer dans google (les .html), et il ne trouve pas les anciennes donc c tres bien.

Alors pourquoi google garde les anciennes pages ? :roll:

Merci
 
Nouveau WRInaute
Il trouve toutes tes pages, mais aussi tous les modules.php? qui encombrent la page de recherche de ton site sur GG, et que GG n'aime peut-être pas bcp. Et même si tu as mis dans ton robots.txt:

Disallow: /modules/

tu remarqueras que le validator ne les marque pas comme exclues par le robots.txt
 
Nouveau WRInaute
La consigne:

User-agent: Mediapartners-Google*
Disallow:

signifie que les Mediapartners-Google* peuvent indexer le site.
 
Discussions similaires
Haut