Dictionnaire domaine public

WRInaute accro
Il y a pas mal de dictionnaires passés dans le domaines publique (ce qui m'intéresse : définitions et synonymes). Je me demandais si, dans le cadre de projets comme Gutenberg, si certains de ces dictionnaires avaient été numérisés et pouvaient être téléchargés ?
 
WRInaute passionné
ecocentric a dit:
serval2a a dit:
Tu as gallica qui offre certains textes, sur bnf.fr

mais apparemment pas de dictionnaire. Ceci dit, ce site est bien intéressant.
Hum hum... http://gallica.bnf.fr/Sujets/SujetsD.htm : 9 rubriques commencent par le mot "Dictionnaire" ou "Dictionnaires". ;)

On y trouve en particulier le très utile Larousse du XIXe siècle: http://gallica.bnf.fr/Catalogue/notices ... 995829.htm
Pour les synonymes: http://gallica.bnf.fr/Catalogue/notices ... 252060.htm
 
Nouveau WRInaute
ben justument, comme c'est dans le domaine publique, rien ne t'emêche d'en faire une version html par simple export ou copier/coller.
 
WRInaute passionné
http://gallica.bnf.fr/faq.htm dit:
Pourquoi ne pas tout numériser en mode texte ?
Le mode image conserve l’aspect initial de l’original y compris ses éléments non textuels.
Si le mode texte, autorise des recherches riches et précises dans un document et permet une réduction significatice du volume des fichiers manipulés, sa réalisation, soit par saisie soit par OCR, implique des coûts de traitement environ 10 fois supérieurs à la simple numérisation.
Ces techniques parfaitement envisageables pour des volumes limités ne pouvaient ici être économiquement justifiables au vu des 50000 documents (représentant presque 15 millions de pages) mis en ligne.

Sur Gallica, la plupart des documents sont en PDF (sauf ceux listés dans http://gallica.bnf.fr/textes.htm qui sont en mode texte). http://gallica.bnf.fr/dicos/dictionnaires.htm te donne aussi un accès commode.

Je ne crois pas qu'on puisse l'exporter, c'est du PDF en mode image. Il faudrait passer un OCR dessus.
 
WRInaute accro
French Dread a dit:
http://fr.wiktionary.org mais il début donc pas forcement le plus exhaustif

Je l'ai a l'oeuil, celui-là ;-)
Ils n'ont encore de base de données séparée, mais ils travaillent dessus (je pense avoir vu qu'ils ont eu un financement pour le faire).
 
Nouveau WRInaute
Si la 8e édition est presque entièrement dans le domaine public:

Je cite :
La 8e édition du Dictionnaire de l'Académie française contient 2 tomes. Le premier tome (A-G, 622p) a été publié en 1932, et le deuxième tome (H-Z, 743p) a été publié en 1935.
Donc, le premier volume (A-G) est dans le domaine public depuis le 1er janvier 2003, et le deuxième volume (H-Z) sera dans le domaine public le 1er janvier 2006.

Boris
 
Nouveau WRInaute
tuisp a dit:
http://gallica.bnf.fr/faq.htm dit:
Pourquoi ne pas tout numériser en mode texte ?
Le mode image conserve l’aspect initial de l’original y compris ses éléments non textuels.
Si le mode texte, autorise des recherches riches et précises dans un document et permet une réduction significatice du volume des fichiers manipulés, sa réalisation, soit par saisie soit par OCR, implique des coûts de traitement environ 10 fois supérieurs à la simple numérisation.
Ces techniques parfaitement envisageables pour des volumes limités ne pouvaient ici être économiquement justifiables au vu des 50000 documents (représentant presque 15 millions de pages) mis en ligne.

Sur Gallica, la plupart des documents sont en PDF (sauf ceux listés dans http://gallica.bnf.fr/textes.htm qui sont en mode texte). http://gallica.bnf.fr/dicos/dictionnaires.htm te donne aussi un accès commode.

Je ne crois pas qu'on puisse l'exporter, c'est du PDF en mode image. Il faudrait passer un OCR dessus.

Bonsoir,

C'est quoi OCR ? Une sorte de reconnaissance de caractères, c'est ça ? Sinon Google, archive.org semblent avoir réussi dans ce domaine, à moins que je me trompe...
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut