Exclure les .pdf du Google Custom Search (CSE)

Nouveau WRInaute
Bonjour,

J'utilise le moteur de recherche interne fourni gratuitement par google.
Il ressort souvent aux utilisateurs des fichiers PDF que j'aimerai pouvoir exclure des résultats !

Quelqu'un a-t-il déjà résolu ce problème ? Merci d'avance à vous ! :)

Nico
 
WRInaute impliqué
il faudrait je pense que tes pages .pdf soient en noindex. pour ce faire il faut que tu rajoutes dans ton htaccess :
Code:
RewriteRule \.pdf$ - [env=NOINDEXNOARCHIVE] 
Header set X-Robots-Tag "noindex, noarchive" env=NOINDEXNOARCHIVE
 
Nouveau WRInaute
Bonjour et merci pour vos réponses !

Idéalement je souhaiterai les exclure uniquement du CSE.. Est-ce possible ?
Il y a la possibilité de créer des filtres me semble-il mais très peu d'informations sont disponibles !

Exclure les PDF via le htaccess est-il similaire à une exclusion via le robots.txt ?

Merci d'avance pour vos retours. :D
 
WRInaute impliqué
vu qu'il est possible de choisir que les résultats s'affichent directement dans un div de la page, il est toujours possible, en javascript, une fois les données chargées, de parcourir les résultats et de passer en display: none, les lignes de résultats correspondant à du pdf.
 
WRInaute impliqué
Ni-Colas a dit:
Exclure les PDF via le htaccess est-il similaire à une exclusion via le robots.txt ?

non ce n'est pas similaire. au départ j'avais interdit les pages .pgf de mon site via un fichier robots.txt, et google me les sortait quand même dans les résultats de recherche avec une mention du style (je me rappel plus exactement) contenu interdit d'accès.

alors quand rajoutant la balise noindex, là les pages .pdf ne sortiront plus dans les résultats de recherche.
 
Nouveau WRInaute
Confronter à cette question aujourd'hui, j'apporte la réponse à cette vieille vieille question : ajouter l'opérateur
Code:
-filetype:pdf

(avec le moins devant) et hop, tous les résultats sans les PDF
 
Discussions similaires
Haut