Google indexe les fichiers PDF qui sont automatiquement sauvegardes?

Discussion dans 'Crawl et indexation Google, sitemaps' créé par FortTrafic, 12 Janvier 2016.

  1. FortTrafic
    FortTrafic WRInaute passionné
    Inscrit:
    11 Décembre 2012
    Messages:
    1 202
    J'aime reçus:
    18
    Bonjour,
    Dans mon script php de génération de PDF à la volée (mPDF) j'ai le choix entre afficher le PDF dans le navigateur ou bien ouvrir une boite de dialogue pour le sauvegarder sur l'ordinateur de l'utilisateur.

    J'ai un lien vers chaque fichier PDF sur mon site.
    Est-ce que Google indexera les fichiers PDF si je choisis d'ouvrir une boite de dialogue au lieu de l'afficher dans le navigateur?

    Avez-vous déjà fait le test?
     
  2. FortTrafic
    FortTrafic WRInaute passionné
    Inscrit:
    11 Décembre 2012
    Messages:
    1 202
    J'aime reçus:
    18
    Pour donner une précision, je parle de la différence entre renvoyer le fichier PDF normalement :
    header('Content-type: application/pdf');
    Qui lui est bien indexé bien entendu et entre renvoyer le fichier PDF avec :
    header('Content-Disposition: attachment; filename="mon-nom-de-fichier.pdf"');
    Qui ouvre la boite de dialogue pour sauvegarder (ou ouvrir) le fichier pdf.

    "Content-Disposition: An opportunity to raise a "File Download" dialogue box for a known MIME type with binary format or suggest a filename for dynamic content."

    Ce que je me demande c'est si google indexe le fichier pdf normalement (et le presente dans ses resultats de recherche) alors qu'il sait que l'url retourne cette ligne "content-disposition: attachment" dans le http header.

    Pour les fois où j'ai cliqué sur des pdf dans les résultats de google je n'ai pas souvenir d'avoir eu une boite de dialogue immédiatement après le clic, donc c'est pour ça que je doute...
     
  3. FortTrafic
    FortTrafic WRInaute passionné
    Inscrit:
    11 Décembre 2012
    Messages:
    1 202
    J'aime reçus:
    18
    Je pense que personne ne sait, sinon vous auriez déjà répondu, mais il y a un autre moyen qui j'imagine doit être mieux géré par Google car ce n'est pas au niveau du serveur web mais dans le html :
    C'est un nouvel attribut de html5 pour la balise "A" : download qui est supporté partiellement par différent navigateurs.
    Comme ça : <a href:"/unfichier.pdf" download>ancre texte</a>
    Vous pouvez aussi écrire download="nouveaunom" (le navigateur ajoute .pdf lui meme) afin de sauvegarder le fichier sous un autre nom que le fichier original.
    Il semble que IE et Safari ne le supportent pas, et Firefox le supporte seulement pour le même domaine.
     
  4. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 977
    J'aime reçus:
    121
  5. FortTrafic
    FortTrafic WRInaute passionné
    Inscrit:
    11 Décembre 2012
    Messages:
    1 202
    J'aime reçus:
    18
    Le souci d'indexation viendrait uniquement d'un choix de google. As-tu un exemple d'un fichier pdf envoyé par le serveur avec "content-disposition: attachment;" qui soit dans l'index de google ?
     
  6. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 977
    J'aime reçus:
    121
    Comme ça, non, mais ça se teste :)
     
  7. FortTrafic
    FortTrafic WRInaute passionné
    Inscrit:
    11 Décembre 2012
    Messages:
    1 202
    J'aime reçus:
    18
    Pour l'instant mon test c'est que plusieurs jours après aucun PDF n'est dans l'index de Google, maintenant j'ai enlevé le content-disposition et j'attends.. :)
     
  8. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 977
    J'aime reçus:
    121
    Tu as une url exemple ?
     
  9. FortTrafic
    FortTrafic WRInaute passionné
    Inscrit:
    11 Décembre 2012
    Messages:
    1 202
    J'aime reçus:
    18
    Je ferais un test sur un nom de domaine "propre" car sur le blog drupal j'utilise un module et ce n'est pas clair (il utilise content-disposition: inline; au lieu de ne rien mettre)

    Donc je vais faire le test sur un autre domaine en mettant des fichiers pdf avec l'url qui finit en .pdf et content-disposition: attachment;
    Et ensuite si rien n'est indexé je ne mettrais pas la ligne content-disposition du tout.

    Je reviendrais poster les résultats, surtout s'ils sont bien indexés en content-disposition: attachement bien sur :)
     
  10. FortTrafic
    FortTrafic WRInaute passionné
    Inscrit:
    11 Décembre 2012
    Messages:
    1 202
    J'aime reçus:
    18
    Bonjour, sur un autre forum on m'a donne une requete qui affiche un fichier pdf qui ne saffiche pas dans le navigateur, il se telecharge sans quitter la page de resultats google, donc la reponse a ma question est oui, google indexe bien ces fichiers.
     
Chargement...
Similar Threads - Google indexe fichiers Forum Date
Supprimer des fichiers LOG indexés de l'index de Google ? Débuter en référencement 27 Octobre 2010
[Google] Technique OCR pour indexer les fichiers PDF Google : l'entreprise, les sites web, les services 31 Octobre 2008
Google indexe des faux fichiers warez sur mon site Crawl et indexation Google, sitemaps 9 Avril 2007
Fichiers swf et include html indexés par google Problèmes de référencement spécifiques à vos sites 3 Février 2005
Google indexe les fichiers .wri Le café de WebRankInfo 14 Avril 2003
Google indexe en https au lieu de http Débuter en référencement 26 Juin 2022
Site non indexé par Google Problèmes de référencement spécifiques à vos sites 21 Juin 2022
Cette URL n'a pas été indexée par Google Débuter en référencement 18 Mai 2022
Mon site n’est pas indexé sur Google Débuter en référencement 10 Mai 2022
Google indexe le dossier /wp-includes/ Crawl et indexation Google, sitemaps 27 Mars 2022
Search Console Cette URL n'a pas été indexée par Google Crawl et indexation Google, sitemaps 27 Mars 2022
Comment savoir si une URL est indexée par Google ? Crawl et indexation Google, sitemaps 25 Janvier 2022
Search Console Google ne veut pas indexer après plusieurs semaines Crawl et indexation Google, sitemaps 16 Décembre 2021
Google indexe mes pages AMP sur PC Problèmes de référencement spécifiques à vos sites 10 Décembre 2021
Je n'arrive pas à indexer les pages du site sur Google Problèmes de référencement spécifiques à vos sites 2 Décembre 2021
Certaines pages importantes ne sont plus indexées dans Google Problèmes de référencement spécifiques à vos sites 28 Novembre 2021
Site web non indexé par Google Problèmes de référencement spécifiques à vos sites 22 Novembre 2021
Impossible d'indexer mon site sur google search console Rédaction web et référencement 5 Octobre 2021
Google Search console: page envoyée et indexée mais introuvables via site: Référencement Google 7 Septembre 2021
Search Console Problème d'indexer d'une page sur Google Référencement Google 20 Juin 2021