1. Pour Black Friday on FRACASSE les prix ⚡ avec RM Tech Découverte
    Rejeter la notice

Google indexe les fichiers PDF qui sont automatiquement sauvegardes?

Discussion dans 'Crawl et indexation Google, sitemaps' créé par FortTrafic, 12 Janvier 2016.

  1. FortTrafic
    FortTrafic WRInaute passionné
    Inscrit:
    11 Décembre 2012
    Messages:
    1 210
    J'aime reçus:
    18
    Bonjour,
    Dans mon script php de génération de PDF à la volée (mPDF) j'ai le choix entre afficher le PDF dans le navigateur ou bien ouvrir une boite de dialogue pour le sauvegarder sur l'ordinateur de l'utilisateur.

    J'ai un lien vers chaque fichier PDF sur mon site.
    Est-ce que Google indexera les fichiers PDF si je choisis d'ouvrir une boite de dialogue au lieu de l'afficher dans le navigateur?

    Avez-vous déjà fait le test?
     
  2. FortTrafic
    FortTrafic WRInaute passionné
    Inscrit:
    11 Décembre 2012
    Messages:
    1 210
    J'aime reçus:
    18
    Pour donner une précision, je parle de la différence entre renvoyer le fichier PDF normalement :
    header('Content-type: application/pdf');
    Qui lui est bien indexé bien entendu et entre renvoyer le fichier PDF avec :
    header('Content-Disposition: attachment; filename="mon-nom-de-fichier.pdf"');
    Qui ouvre la boite de dialogue pour sauvegarder (ou ouvrir) le fichier pdf.

    "Content-Disposition: An opportunity to raise a "File Download" dialogue box for a known MIME type with binary format or suggest a filename for dynamic content."

    Ce que je me demande c'est si google indexe le fichier pdf normalement (et le presente dans ses resultats de recherche) alors qu'il sait que l'url retourne cette ligne "content-disposition: attachment" dans le http header.

    Pour les fois où j'ai cliqué sur des pdf dans les résultats de google je n'ai pas souvenir d'avoir eu une boite de dialogue immédiatement après le clic, donc c'est pour ça que je doute...
     
  3. FortTrafic
    FortTrafic WRInaute passionné
    Inscrit:
    11 Décembre 2012
    Messages:
    1 210
    J'aime reçus:
    18
    Je pense que personne ne sait, sinon vous auriez déjà répondu, mais il y a un autre moyen qui j'imagine doit être mieux géré par Google car ce n'est pas au niveau du serveur web mais dans le html :
    C'est un nouvel attribut de html5 pour la balise "A" : download qui est supporté partiellement par différent navigateurs.
    Comme ça : <a href:"/unfichier.pdf" download>ancre texte</a>
    Vous pouvez aussi écrire download="nouveaunom" (le navigateur ajoute .pdf lui meme) afin de sauvegarder le fichier sous un autre nom que le fichier original.
    Il semble que IE et Safari ne le supportent pas, et Firefox le supporte seulement pour le même domaine.
     
  4. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 887
    J'aime reçus:
    74
  5. FortTrafic
    FortTrafic WRInaute passionné
    Inscrit:
    11 Décembre 2012
    Messages:
    1 210
    J'aime reçus:
    18
    Le souci d'indexation viendrait uniquement d'un choix de google. As-tu un exemple d'un fichier pdf envoyé par le serveur avec "content-disposition: attachment;" qui soit dans l'index de google ?
     
  6. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 887
    J'aime reçus:
    74
    Comme ça, non, mais ça se teste :)
     
  7. FortTrafic
    FortTrafic WRInaute passionné
    Inscrit:
    11 Décembre 2012
    Messages:
    1 210
    J'aime reçus:
    18
    Pour l'instant mon test c'est que plusieurs jours après aucun PDF n'est dans l'index de Google, maintenant j'ai enlevé le content-disposition et j'attends.. :)
     
  8. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 887
    J'aime reçus:
    74
    Tu as une url exemple ?
     
  9. FortTrafic
    FortTrafic WRInaute passionné
    Inscrit:
    11 Décembre 2012
    Messages:
    1 210
    J'aime reçus:
    18
    Je ferais un test sur un nom de domaine "propre" car sur le blog drupal j'utilise un module et ce n'est pas clair (il utilise content-disposition: inline; au lieu de ne rien mettre)

    Donc je vais faire le test sur un autre domaine en mettant des fichiers pdf avec l'url qui finit en .pdf et content-disposition: attachment;
    Et ensuite si rien n'est indexé je ne mettrais pas la ligne content-disposition du tout.

    Je reviendrais poster les résultats, surtout s'ils sont bien indexés en content-disposition: attachement bien sur :)
     
  10. FortTrafic
    FortTrafic WRInaute passionné
    Inscrit:
    11 Décembre 2012
    Messages:
    1 210
    J'aime reçus:
    18
    Bonjour, sur un autre forum on m'a donne une requete qui affiche un fichier pdf qui ne saffiche pas dans le navigateur, il se telecharge sans quitter la page de resultats google, donc la reponse a ma question est oui, google indexe bien ces fichiers.
     
Chargement...
Similar Threads - Google indexe fichiers Forum Date
Supprimer des fichiers LOG indexés de l'index de Google ? Débuter en référencement 27 Octobre 2010
Google me dit que ma page est bien indexée mais bloquée par robots.txt Crawl et indexation Google, sitemaps Mercredi à 18:31
Page indexée mais qui ne remonte pas dans Google Problèmes de référencement spécifiques à vos sites Mardi à 13:31
Indexé sur Google News mais n'apparaît pas même sur le nom du site Problèmes de référencement spécifiques à vos sites 7 Novembre 2020
Problème d'indexation Google (pages non indexées) Crawl et indexation Google, sitemaps 7 Novembre 2020
Site indexé dans Bing mais pas dans Google Problèmes de référencement spécifiques à vos sites 3 Septembre 2020
A lire si Google refuse d'indexer toutes vos pages pourtant indexables Crawl et indexation Google, sitemaps 22 Juillet 2020
Search Console Cette URL n'a pas été indexée par Google Crawl et indexation Google, sitemaps 8 Juillet 2020
Search Console Google Search console: page envoyée et indexée mais introuvables par une recherche google Référencement Google 30 Juin 2020
Erreur : Cette URL n'a pas été indexée par Google Crawl et indexation Google, sitemaps 31 Mars 2020