[PDF]Plusieurs questions très techniques

alexandreb4

Nouveau WRInaute
Bonjour à tous !
Je cherche désespérément depuis 3 jours réponses à mes questions. Ces questions concerne le moteur de recherche Google mais plus particulièrement Google Mini. Mais je sais que le fonctionnement est quasi identique au moteur de recherche Google.

Le contexte de mon organisme : Depuis les années 90, mon organisme a commencé à publier des publications sous format PDF. Aujourd'hui, nous avons environ 2000 publications. Un document contient en moyenne 200 pages. En 2009, mon organisme fait la refonte de son site Web et cherche un bon moteur de recherche capable de lire dans les documents PDF et de donner de bons résultats: Google mini. J'ai participé activement dernièrement à l'implantation du système sur notre site.

Par contre, notre moteur de recherche ne donne pas les performances escomptés... Ce qui est plutôt décevant étant donné le montant que nous avons déboursé pour obtenir, selon nous, le meilleur moteur de recherche d'aujourd'hui. Donc, je suis parti en quête d'information sur le référencement des documents PDF. Pour le moment, peu de site en parle. La plupart ne tente pas de chercher une solution mais recommande seulement de tout convertir en HTML (solution non envisageable pour mon organisme).

La seule optimisation que nous avons trouvé pour le moment est de définir un titre dans les propriétés du document. Ce titre est celui que Google affichera dans ces titre de résultats.

Mes questions :

1)Il est possible maintenant de baliser un document PDF un peu comme on le ferait pour un document HTML. Étant donnée l'importance qu'une page Html soit bien balisé pour obtenir un référencement optimal, est-ce que le balisage d'un document PDF est prit en compte par google pour améliorer l'indexation du contenu?

2)Lorsqu'on utilise la fonction "Tri par date". Quel est la date que Google récupère ? (la date d'upload du document sur le serveur ?; la date de création du document ?; la date de la dernière modification du document ?)

3)Peut-on modifier cette date ?

4)Avez-vous des conseils à me donner pour le référencement de document PDF


Merci beaucoup de votre aide
 

UsagiYojimbo

WRInaute accro
Je trouve que tes questions ne sont pas claires. Ont-elles trait à l'indexation de documents pour le moteur de recherche interne de ton site (géré a priori via Google mini) ou à l'indexation de tes documents auprès de Google ?
 

alexandreb4

Nouveau WRInaute
Merci de l'intervention,

Le moteur de recherche interne de mon site(géré par Google mini). Google Mini utilise le même algorithme d'indexation de Google. Donc mes questions s'applique au deux moteurs
 

UsagiYojimbo

WRInaute accro
A mon avis le tri par date pour Google mini s'effectue à partir de la date d'indexation. Je vois mal comment tu pourrais changer celle-ci.

Au niveau de la prise en compte des documents PDF, remplis-tu bien les méta-données du document ? S'agit-il bien de PDF textes et non de PDF image (le second étant bien plus difficile à indexer) ?
 

alexandreb4

Nouveau WRInaute
Il s'agit bien d'un document PDF en texte. Donc, en terme de référencement (SEO) est-ce que le balisage d'un document PDF est recommandé pour obtenir de meilleurs résultat de recherche ?
 

Discussions similaires

Haut