Faut-il indexer les pdf ?

Nouveau WRInaute
Bonjour tout le monde !

Je me pose une petite question, nous avons un site de vente en ligne qui propose pour chaque produit des fiches techniques.
Ces fiches techniques de part leurs origines (données fournisseur ou autre) sont au format PDF.

Nous avons régulièrement en résultat dans les SERP ces fameuses fiches. Or lorsqu'un prospect consulte cette fiche il obtient des informations mais n'a pas accès à la fiche produit (page du site) de mon client, chose assez embêtante pour un site qui a pour finalité de vendre.

La question que je me pose est la suivante, quel est le poids de l'indexation des fiches pdf sur le positionnement global du site et ai-je plus à gagner de bloquer l'indexation de ces fiches pour être sur que mon prospect obtienne une page du catalogue ?

Merci d'avance !
 
WRInaute accro
Re: Les pdf

Ca ne répond pas directement à ta question, mais ne serait-il pas plus judicieux de modifier les PDF pour s'assurer qu'il y a un bon gros lien bien en vue vers la page d'achat correspondante?

Jacques.
 
Nouveau WRInaute
Re: Les pdf

Totalement d'accord, la problématique est que nous sommes dans le cadre d'une refonte et qu'il y a un passif de 1200 pdf à reprendre ;)
 
WRInaute accro
Re: Les pdf

Tu dois pouvoir faire une bidouille avec un jquery ou un mootools en obligeant le rechargement de la page avec le pdf à l'intérieur. Je l'ai fait avec deux pages html l'une dans l'autre je suppose qu'on peut le faire avec un pdf
Il faut que tu fasses interpréter la terminaison pdf comme du html
Au niveau référencement ça vaudrait le coup de réécrire les liens quand même si tu trouves un moyen automatiquement. Sinon mets le contenu de ton pdf dans une page html qui sera présentée quand les js sont désactivés.
 
Olivier Duffez (admin)
Membre du personnel
Re: Les pdf

La meilleure des solutions est de convertir le PDF en HTML.
Cela dit si c'est un contenu publié par tout plein de monde, ça ne servira pas à grand chose (contenu dupliqué)

Sinon, utilise une des solutions déjà mentionnées.

Au pire, interdire l'indexation des PDF
 
WRInaute occasionnel
engage un ptit stagiaire qui se tape tout le boulot pour pas un clou, c'est à la mode en france....
ou autrement y a d'autre pays qui le ferait pour des clopinettes.
après je ne suis pas pour l'esclavagisme non plus....
1200 pages ca devrait représenté environ 2 -3 semaine de travail tranquil... après à toi de voir selon ton budget.
bon courage
++elembius
 
Nouveau WRInaute
Bon je pense que je vais me tourner vers le traitement par lots des fichiers PDF pour intégrer un lien dans les docs.

Il semblerait que cela fonctionne avec Acrobat, mais si quelqu'un l'a déjà fait je suis preneur :wink:
 
Nouveau WRInaute
Si ce ne sont que des fiches techniques fournies par des fournisseurs je ne vois pas trop l'intérêt de les indexer car comme indiqué plus haut ça risque de faire du contenu dupliqué.
 
Nouveau WRInaute
Pour le traitement en masse des fichiers pdf, j'utilise 2 script/classe php: fpdf et fpdi. fpdi permet de récupérer ton fichier pdf de départ, et ensuite tu le manipules avec fpdf en ajoutant le lien.

Tu as juste besoin de 4 commandes:
venant de fpdi:
setSourceFile
importPage
useTemplate

et de fpdf:
link

Bonne communauté et de nombreux exemples qui font déjà ce que tu veux.

J'aime pas adaube, donc je connais pas le traitement par lots.
 
Discussions similaires
Haut