Formation par Olivier Duffez

Formation au référencement par Olivier Duffez, créateur de WebRankInfo !
Une formule efficace alliant théorie et pratique, avec une haute disponibilité des intervenants
Cette formule a déjà convaincu plusieurs centaines d'entreprises, pourquoi pas vous ?
Réservez vite votre place en ligne (convention possible pour imputer sur le budget formation)

Formation référencement Marseille

Ne pas indexer les PDF

Poster un nouveau sujet Imprimer cette discussion    Forum -> Problèmes de référencement spécifiques à vos sites   Les dernières discussions de ce forum sont disponibles au format RSS
Voir le sujet précédent :: Voir le sujet suivant  
Auteur Message
 
Julia41
WRInaute impliqué
WRInaute impliqué

Inscrit le: 31 Aoû 2007
Messages: 434
Localisation: Oléron

URL permanente de ce messagePosté le : Ven Oct 12, 2007 8:39    Sujet du message: Ne pas indexer les PDF

Bonjour, je dispose d'un ptit site en Joomla...
Celui-ci a un ptit contenu correct, et comme la plupart des sites joomla, il propose (enfin j'ai laissé l'option) l'article au format PDF...

J'aimerais ne pas indexer par Google ce PDF, j'ai quelques articles indexé dans mes premiers résultat qui ne sortent que en pdf (avec la traduc en html par GG qui est pire) alors que la page est dispo en html directement...

Quelqu'un as-til une solution simple ?
Si possible sans .htaccess plutôt par robots.txt ou par cfg d'apache...
 
Julia41 Visiter le site web du posteur
raljx
WRInaute accro
WRInaute accro

Inscrit le: 10 Juil 2006
Messages: 1317
Localisation: Alpes Maritimes

URL permanente de ce messagePosté le : Ven Oct 12, 2007 8:57    Sujet du message: Ne pas indexer les PDF

Dans ton robots.txt :

Code:
User-agent: *
Disallow: /*.pdf$


ou seulement pour GG

Code:

User-agent: Googlebot
Disallow: /*.html$
 
raljx Visiter le site web du posteur
phpmikedu83
WRInaute accro
WRInaute accro

Inscrit le: 06 Aoû 2005
Messages: 1279
Localisation: LE LAVANDOU

URL permanente de ce messagePosté le : Ven Oct 12, 2007 9:01    Sujet du message: Ne pas indexer les PDF

La meilleur solution serait une redirection 301 de tes pdf vers tes fichiers .html

Après, il faut connaître la convention de nommage des 2 types de fichier pour te proposer une règle à mettre dans le httpd.conf
Et savoir aussi, si tu ne veux plus laisser l'accès aux formats pdf Wink
 
phpmikedu83 Visiter le site web du posteur
Julia41
WRInaute impliqué
WRInaute impliqué

Inscrit le: 31 Aoû 2007
Messages: 434
Localisation: Oléron

URL permanente de ce messagePosté le : Ven Oct 12, 2007 9:04    Sujet du message: Ne pas indexer les PDF

Alors j'ai trouvé ce post (merci dd)
http://www.webrankinfo.com/forums/viewtopic_29906.htm
Mais je viens de tester cela n'a pas l'air de marcher, mes pdf ont une tête bizarre :p
Code:
/index2.php?option=com_content&do_pdf=1&id=100

Donc d'après l'article, j'ai testé, cela n'a pas l'air de marcher en mettant un ;

Disallow: /index2.php?option=com_content&do_pdf=
 
Julia41 Visiter le site web du posteur
kazhar
WRInaute accro
WRInaute accro

Inscrit le: 09 Jan 2004
Messages: 6142
Localisation: Somewhere only I know

URL permanente de ce messagePosté le : Ven Oct 12, 2007 9:35    Sujet du message: Ne pas indexer les PDF

Le disallow que tu viens de donner devrait fonctionner.
Attention cependant, Google est toujours un peu long pour remettre à jour le contenu d'un robots.txt.
 
kazhar Visiter le site web du posteur
Julia41
WRInaute impliqué
WRInaute impliqué

Inscrit le: 31 Aoû 2007
Messages: 434
Localisation: Oléron

URL permanente de ce messagePosté le : Ven Oct 12, 2007 9:42    Sujet du message: Ne pas indexer les PDF

Ah j'me disais aussi, ça pouvais venir de ça...
Bon, je laisse ça comme ça alors, on va bien voir :p
Merci pour vos infos, on va tester...
 
Julia41 Visiter le site web du posteur
kazhar
WRInaute accro
WRInaute accro

Inscrit le: 09 Jan 2004
Messages: 6142
Localisation: Somewhere only I know

URL permanente de ce messagePosté le : Ven Oct 12, 2007 9:44    Sujet du message: Ne pas indexer les PDF

Euh ouais, faut pas croire les idées reçues. Google n'est pas Dieu et il ne peut détecter automatiquement ton nouveau robots.txt. Il faut qu'il le crawle avant.
 
kazhar Visiter le site web du posteur
Julia41
WRInaute impliqué
WRInaute impliqué

Inscrit le: 31 Aoû 2007
Messages: 434
Localisation: Oléron

URL permanente de ce messagePosté le : Ven Oct 12, 2007 9:54    Sujet du message: Ne pas indexer les PDF

Bah j'pensais qu'au moment des tests, plutôt que de se servir de son fichier en cache, il retentait en temps réel vu que c'est un "Outils pour les Webmasters" Razz
 
Julia41 Visiter le site web du posteur
david96
WRInaute accro
WRInaute accro

Inscrit le: 28 Aoû 2005
Messages: 1255
Localisation: Grenoble

URL permanente de ce messagePosté le : Sam Oct 13, 2007 6:52    Sujet du message: Ne pas indexer les PDF

kazhar a écrit:
Euh ouais, faut pas croire les idées reçues. Google n'est pas Dieu et il ne peut détecter automatiquement ton nouveau robots.txt. Il faut qu'il le crawle avant.

Pourtant il le fait pour les actualités ! Very Happy
 
david96 Visiter le site web du posteur
Julia41
WRInaute impliqué
WRInaute impliqué

Inscrit le: 31 Aoû 2007
Messages: 434
Localisation: Oléron

URL permanente de ce messagePosté le : Sam Oct 13, 2007 6:59    Sujet du message: Ne pas indexer les PDF

It'S WorK !
 
Julia41 Visiter le site web du posteur
david96
WRInaute accro
WRInaute accro

Inscrit le: 28 Aoû 2005
Messages: 1255
Localisation: Grenoble

URL permanente de ce messagePosté le : Sam Oct 13, 2007 7:40    Sujet du message: Ne pas indexer les PDF

Gné, heingue, comment, allo !? Rolling Eyes Laughing
 
david96 Visiter le site web du posteur
kazhar
WRInaute accro
WRInaute accro

Inscrit le: 09 Jan 2004
Messages: 6142
Localisation: Somewhere only I know

URL permanente de ce messagePosté le : Sam Oct 13, 2007 10:45    Sujet du message: Ne pas indexer les PDF

Julia41 a écrit:
It'S WorK !


Sauf que c'est incorrect ça. C'est "It works" ou "It's working" Wink
 
kazhar Visiter le site web du posteur
Julia41
WRInaute impliqué
WRInaute impliqué

Inscrit le: 31 Aoû 2007
Messages: 434
Localisation: Oléron

URL permanente de ce messagePosté le : Sam Oct 13, 2007 10:53    Sujet du message: Ne pas indexer les PDF

Hum merde pour une fois qu'tu fais gaffe à pas faire de fautes d'orthographes dans ton message...
Hum la prochaine fois, attention à toi...
Et de toute façon tout le monde avait compris :p
 
Julia41 Visiter le site web du posteur
 
Montrer les messages depuis:   
Revenir en haut    Forum -> Problèmes de référencement spécifiques à vos sites Toutes les heures sont au format GMT + 1 Heure
Page 1 sur 1 - 
Connexion
Nom d'utilisateur:    Mot de passe:      Se connecter automatiquement à chaque visite    

Autres sujets de discussion :

CLIQUEZ ICI pour vous inscrire à WebRankInfo (forum, annuaire, outils...)

Connexion

© 2001-2005 phpBB Group, support français
Personnalisation : WebRankInfo ™


 ODP  Firefox  Alsacreations  annuaire webmaster Yagoort