Formation par Olivier Duffez

Formation au référencement par Olivier Duffez, créateur de WebRankInfo !
Une formule efficace alliant théorie et pratique, avec une haute disponibilité des intervenants
Cette formule a déjà convaincu plusieurs centaines d'entreprises, pourquoi pas vous ?
Réservez vite votre place en ligne (convention possible pour imputer sur le budget formation)

Formation référencement Marseille

google référence les parties qu'il ne dois pas de mon forum

Poster un nouveau sujet Imprimer cette discussion    Forum -> Problèmes de référencement spécifiques à vos sites   Les dernières discussions de ce forum sont disponibles au format RSS
Voir le sujet précédent :: Voir le sujet suivant  
Auteur Message
 
aladdin
WRInaute passionné
WRInaute passionné

Inscrit le: 29 Avr 2005
Messages: 743

URL permanente de ce messagePosté le : Dim Juil 31, 2005 12:17    Sujet du message: google référence les parties qu'il ne dois pas de mon forum

j'ai suivi les topic sur l'url rewriting et le patch à appliquer à phpbb pour le féférencement, mais là, google référence aussi des parties qu'il ne devrai pas, car dans mon robots.txt j'ai ça
Code:

Disallow: sutra*.html$
Disallow: ptopic*.html$
Disallow: ntopic*.html$


et sur google, j'ai trouvé des page : sutre-##.html, ntopic-##.html ... ??
 
aladdin Visiter le site web du posteur
JeunZ
WRInaute accro
WRInaute accro

Inscrit le: 18 Fév 2004
Messages: 5306

URL permanente de ce messagePosté le : Dim Juil 31, 2005 12:32    Sujet du message: google référence les parties qu'il ne dois pas de mon forum

Met également du no follow sur ton forum Wink
 
JeunZ
jeanluc
WRInaute accro
WRInaute accro

Inscrit le: 03 Mai 2004
Messages: 2312
Localisation: Bruxelles

URL permanente de ce messagePosté le : Dim Juil 31, 2005 12:40    Sujet du message: google référence les parties qu'il ne dois pas de mon forum

Bonjour aladdin,

Le problème est que, dans robots.txt, "*" ne veut pas dire n'importe quel caractère.

Code:
Disallow: /zut
interdit l'accès à tout ce qui commence par /zut, comme /zut.html ou /zut55.php?abc=34 ou /zut/abcd.php.

Dans ton exemple,
Code:
Disallow: sutra*.html$
interdit l'accès à ce qui commence par "sutra*.html$". Rolling Eyes

Jean-Luc


Dernière édition par jeanluc le Dim Juil 31, 2005 18:19; édité 1 fois
 
jeanluc Visiter le site web du posteur
shrom
WRInaute passionné
WRInaute passionné

Inscrit le: 05 Juil 2004
Messages: 866

URL permanente de ce messagePosté le : Dim Juil 31, 2005 12:49    Sujet du message: google référence les parties qu'il ne dois pas de mon forum

Tu auras beau interdire, Google continuera à indexer ces pages, c'est comme ça. Par contre, il n'affichera plus de titre ni de description. C'est la même chose pour le meta no-index.

Citation:
Si une page est dans robots.txt, nous n'allons pas la crawler, mais nous pouvons l'afficher dans les résultats de recherche si nous avons des raisons de penser qu'elle est pertinente par rapport à la requête. Dans ce cas, nous n'afficherons que l'URL (pas de titre, pas de description et pas de cache). " ( GoogleGuy )
 
shrom Visiter le site web du posteur
aladdin
WRInaute passionné
WRInaute passionné

Inscrit le: 29 Avr 2005
Messages: 743

URL permanente de ce messagePosté le : Dim Juil 31, 2005 12:52    Sujet du message: google référence les parties qu'il ne dois pas de mon forum

ok, donc si j'ai bien compris, je ne risque pas le "duplicate content" meme si ces pages sont crawler (vu que ni le titre ni la description ne sont pris en compte)

Smile
 
aladdin Visiter le site web du posteur
jeanluc
WRInaute accro
WRInaute accro

Inscrit le: 03 Mai 2004
Messages: 2312
Localisation: Bruxelles

URL permanente de ce messagePosté le : Dim Juil 31, 2005 15:39    Sujet du message: google référence les parties qu'il ne dois pas de mon forum

Ton robots.txt tel qu'il est est inutile, car incorrect. Si tu le corriges, tu peux interdire à Google de visiter certaines URL.

Comme le dit shrom, même si Google ne visite pas une adresse, il sait qu'elle existe dès qu'il rencontre ailleurs un lien vers cette adresse. Google se permettra alors d'afficher cette adresse dans les résultats, mais sans jamais l'avoir visitée (uniquement sur base de l'URL de la page et des liens vers celle-ci).

Si Google crawle une page, il la lit et, tôt ou tard, il l'indexera sauf si elle contient une META "robots" avec "noindex".

Jean-Luc
 
jeanluc Visiter le site web du posteur
aladdin
WRInaute passionné
WRInaute passionné

Inscrit le: 29 Avr 2005
Messages: 743

URL permanente de ce messagePosté le : Dim Juil 31, 2005 20:53    Sujet du message: google référence les parties qu'il ne dois pas de mon forum

j'ai verifié et google comprend bien la syntaxe ?!
Code:

Disallow: sutra*.html$


quelcun peut le confirmer plz ?
 
aladdin Visiter le site web du posteur
 
Montrer les messages depuis:   
Revenir en haut    Forum -> Problèmes de référencement spécifiques à vos sites Toutes les heures sont au format GMT + 2 Heures
Page 1 sur 1 - 
Connexion
Nom d'utilisateur:    Mot de passe:      Se connecter automatiquement à chaque visite    

CLIQUEZ ICI pour vous inscrire à WebRankInfo (forum, annuaire, outils...)

Connexion

© 2001-2005 phpBB Group, support français
Personnalisation : WebRankInfo ™


 ODP  Firefox  Alsacreations  annuaire webmaster Yagoort