|
Voir le sujet précédent :: Voir le sujet suivant
|
| Auteur |
Message |
| |
|
Julia41 WRInaute impliqué

Inscrit le: 31 Aoû 2007 Messages: 434 Localisation: Oléron
|
Posté le : Ven Oct 12, 2007 8:39 Sujet du message: Ne pas indexer les PDF |
|
|
Bonjour, je dispose d'un ptit site en Joomla...
Celui-ci a un ptit contenu correct, et comme la plupart des sites joomla, il propose (enfin j'ai laissé l'option) l'article au format PDF...
J'aimerais ne pas indexer par Google ce PDF, j'ai quelques articles indexé dans mes premiers résultat qui ne sortent que en pdf (avec la traduc en html par GG qui est pire) alors que la page est dispo en html directement...
Quelqu'un as-til une solution simple ?
Si possible sans .htaccess plutôt par robots.txt ou par cfg d'apache... |
|
| |
|
 |
raljx WRInaute accro

Inscrit le: 10 Juil 2006 Messages: 1317 Localisation: Alpes Maritimes
|
Posté le : Ven Oct 12, 2007 8:57 Sujet du message: Ne pas indexer les PDF |
|
|
Dans ton robots.txt :
| Code: |
User-agent: *
Disallow: /*.pdf$ |
ou seulement pour GG
| Code: |
User-agent: Googlebot
Disallow: /*.html$ |
|
|
| |
|
 |
phpmikedu83 WRInaute accro

Inscrit le: 06 Aoû 2005 Messages: 1279 Localisation: LE LAVANDOU
|
Posté le : Ven Oct 12, 2007 9:01 Sujet du message: Ne pas indexer les PDF |
|
|
La meilleur solution serait une redirection 301 de tes pdf vers tes fichiers .html
Après, il faut connaître la convention de nommage des 2 types de fichier pour te proposer une règle à mettre dans le httpd.conf
Et savoir aussi, si tu ne veux plus laisser l'accès aux formats pdf  |
|
| |
|
 |
Julia41 WRInaute impliqué

Inscrit le: 31 Aoû 2007 Messages: 434 Localisation: Oléron
|
Posté le : Ven Oct 12, 2007 9:04 Sujet du message: Ne pas indexer les PDF |
|
|
Alors j'ai trouvé ce post (merci dd)
http://www.webrankinfo.com/forums/viewtopic_29906.htm
Mais je viens de tester cela n'a pas l'air de marcher, mes pdf ont une tête bizarre :p
| Code: |
| /index2.php?option=com_content&do_pdf=1&id=100 |
Donc d'après l'article, j'ai testé, cela n'a pas l'air de marcher en mettant un ;
Disallow: /index2.php?option=com_content&do_pdf= |
|
| |
|
 |
kazhar WRInaute accro

Inscrit le: 09 Jan 2004 Messages: 6142 Localisation: Somewhere only I know
|
Posté le : Ven Oct 12, 2007 9:35 Sujet du message: Ne pas indexer les PDF |
|
|
Le disallow que tu viens de donner devrait fonctionner.
Attention cependant, Google est toujours un peu long pour remettre à jour le contenu d'un robots.txt. |
|
| |
|
 |
Julia41 WRInaute impliqué

Inscrit le: 31 Aoû 2007 Messages: 434 Localisation: Oléron
|
Posté le : Ven Oct 12, 2007 9:42 Sujet du message: Ne pas indexer les PDF |
|
|
Ah j'me disais aussi, ça pouvais venir de ça...
Bon, je laisse ça comme ça alors, on va bien voir :p
Merci pour vos infos, on va tester... |
|
| |
|
 |
kazhar WRInaute accro

Inscrit le: 09 Jan 2004 Messages: 6142 Localisation: Somewhere only I know
|
Posté le : Ven Oct 12, 2007 9:44 Sujet du message: Ne pas indexer les PDF |
|
|
| Euh ouais, faut pas croire les idées reçues. Google n'est pas Dieu et il ne peut détecter automatiquement ton nouveau robots.txt. Il faut qu'il le crawle avant. |
|
| |
|
 |
Julia41 WRInaute impliqué

Inscrit le: 31 Aoû 2007 Messages: 434 Localisation: Oléron
|
Posté le : Ven Oct 12, 2007 9:54 Sujet du message: Ne pas indexer les PDF |
|
|
Bah j'pensais qu'au moment des tests, plutôt que de se servir de son fichier en cache, il retentait en temps réel vu que c'est un "Outils pour les Webmasters"  |
|
| |
|
 |
david96 WRInaute accro

Inscrit le: 28 Aoû 2005 Messages: 1255 Localisation: Grenoble
|
Posté le : Sam Oct 13, 2007 6:52 Sujet du message: Ne pas indexer les PDF |
|
|
| kazhar a écrit: |
| Euh ouais, faut pas croire les idées reçues. Google n'est pas Dieu et il ne peut détecter automatiquement ton nouveau robots.txt. Il faut qu'il le crawle avant. |
Pourtant il le fait pour les actualités !  |
|
| |
|
 |
Julia41 WRInaute impliqué

Inscrit le: 31 Aoû 2007 Messages: 434 Localisation: Oléron
|
Posté le : Sam Oct 13, 2007 6:59 Sujet du message: Ne pas indexer les PDF |
|
|
| It'S WorK ! |
|
| |
|
 |
david96 WRInaute accro

Inscrit le: 28 Aoû 2005 Messages: 1255 Localisation: Grenoble
|
Posté le : Sam Oct 13, 2007 7:40 Sujet du message: Ne pas indexer les PDF |
|
|
Gné, heingue, comment, allo !?  |
|
| |
|
 |
kazhar WRInaute accro

Inscrit le: 09 Jan 2004 Messages: 6142 Localisation: Somewhere only I know
|
Posté le : Sam Oct 13, 2007 10:45 Sujet du message: Ne pas indexer les PDF |
|
|
| Julia41 a écrit: |
| It'S WorK ! |
Sauf que c'est incorrect ça. C'est "It works" ou "It's working"  |
|
| |
|
 |
Julia41 WRInaute impliqué

Inscrit le: 31 Aoû 2007 Messages: 434 Localisation: Oléron
|
Posté le : Sam Oct 13, 2007 10:53 Sujet du message: Ne pas indexer les PDF |
|
|
Hum merde pour une fois qu'tu fais gaffe à pas faire de fautes d'orthographes dans ton message...
Hum la prochaine fois, attention à toi...
Et de toute façon tout le monde avait compris :p |
|
| |
|
 |
| |
|
|