Google indexe les fichiers PDF qui sont automatiquement sauvegardes?

WRInaute passionné
Bonjour,
Dans mon script php de génération de PDF à la volée (mPDF) j'ai le choix entre afficher le PDF dans le navigateur ou bien ouvrir une boite de dialogue pour le sauvegarder sur l'ordinateur de l'utilisateur.

J'ai un lien vers chaque fichier PDF sur mon site.
Est-ce que Google indexera les fichiers PDF si je choisis d'ouvrir une boite de dialogue au lieu de l'afficher dans le navigateur?

Avez-vous déjà fait le test?
 
WRInaute passionné
Pour donner une précision, je parle de la différence entre renvoyer le fichier PDF normalement :
header('Content-type: application/pdf');
Qui lui est bien indexé bien entendu et entre renvoyer le fichier PDF avec :
header('Content-Disposition: attachment; filename="mon-nom-de-fichier.pdf"');
Qui ouvre la boite de dialogue pour sauvegarder (ou ouvrir) le fichier pdf.

"Content-Disposition: An opportunity to raise a "File Download" dialogue box for a known MIME type with binary format or suggest a filename for dynamic content."

Ce que je me demande c'est si google indexe le fichier pdf normalement (et le presente dans ses resultats de recherche) alors qu'il sait que l'url retourne cette ligne "content-disposition: attachment" dans le http header.

Pour les fois où j'ai cliqué sur des pdf dans les résultats de google je n'ai pas souvenir d'avoir eu une boite de dialogue immédiatement après le clic, donc c'est pour ça que je doute...
 
WRInaute passionné
Je pense que personne ne sait, sinon vous auriez déjà répondu, mais il y a un autre moyen qui j'imagine doit être mieux géré par Google car ce n'est pas au niveau du serveur web mais dans le html :
C'est un nouvel attribut de html5 pour la balise "A" : download qui est supporté partiellement par différent navigateurs.
Comme ça : <a href:"/unfichier.pdf" download>ancre texte</a>
Vous pouvez aussi écrire download="nouveaunom" (le navigateur ajoute .pdf lui meme) afin de sauvegarder le fichier sous un autre nom que le fichier original.
Il semble que IE et Safari ne le supportent pas, et Firefox le supporte seulement pour le même domaine.
 
WRInaute passionné
UsagiYojimbo a dit:
L'entête étant application/pdf, je pense que ça ne posera pas de souci d'indexation

Le souci d'indexation viendrait uniquement d'un choix de google. As-tu un exemple d'un fichier pdf envoyé par le serveur avec "content-disposition: attachment;" qui soit dans l'index de google ?
 
WRInaute passionné
Pour l'instant mon test c'est que plusieurs jours après aucun PDF n'est dans l'index de Google, maintenant j'ai enlevé le content-disposition et j'attends.. :)
 
WRInaute passionné
Je ferais un test sur un nom de domaine "propre" car sur le blog drupal j'utilise un module et ce n'est pas clair (il utilise content-disposition: inline; au lieu de ne rien mettre)

Donc je vais faire le test sur un autre domaine en mettant des fichiers pdf avec l'url qui finit en .pdf et content-disposition: attachment;
Et ensuite si rien n'est indexé je ne mettrais pas la ligne content-disposition du tout.

Je reviendrais poster les résultats, surtout s'ils sont bien indexés en content-disposition: attachement bien sur :)
 
WRInaute passionné
Bonjour, sur un autre forum on m'a donne une requete qui affiche un fichier pdf qui ne saffiche pas dans le navigateur, il se telecharge sans quitter la page de resultats google, donc la reponse a ma question est oui, google indexe bien ces fichiers.
 
Discussions similaires
Haut