Transcription de PDF en texte

Discussion dans 'Développement d'un site Web ou d'une appli mobile' créé par nickargall, 6 Mai 2009.

  1. nickargall
    nickargall WRInaute accro
    Inscrit:
    13 Juin 2005
    Messages:
    6 661
    J'aime reçus:
    4
    Bonjour a tous

    Je suis à la recherche d'informations sur d'éventuels scripts PHP existant, permettant de lire un PDF et d'en extraire le texte, pour ensuite l'ajouter dans une BDD en mode "plain text" (pas de HTML).
    Je ne cherche pas de solution OCR, mais des classes ou scripts PHP qui permettent d'extraire du texte de documents générés par par Xpress, "à la volée", donc à priori avec du contenu texte correctement encapsulé.
    ... sans avoir besoin d'acquérir une licence, ou de compiler du C++ pour un serveur Linux...

    L'idée c'est qu'un utilisateur puisse mettre un fichier PDF en ligne et que le script PHP en extraie le contenu pour en faire une version alternative dans une base de données, pour utilisation ultérieure dans un moteur de recherche.
    Et non, je ne veux pas utiliser les solutions Google :)

    Je n'ai rien trouvé qui puisse correspondre à ce que je recherche, je jette donc une bouteille à la mer ici ..

    Si quelqu'un a déjà vu quelquechose comme celà :mrgreen:
     
  2. RiPSO
    RiPSO WRInaute impliqué
    Inscrit:
    5 Octobre 2007
    Messages:
    967
    J'aime reçus:
    0
    Oui moi j'ai déjà vu une bouteille à la mer :mrgreen: :lol:
     
  3. skyll
    skyll WRInaute passionné
    Inscrit:
    14 Octobre 2005
    Messages:
    1 088
    J'aime reçus:
    0
    Tiens, je cherche aussi quelque chose comme ca, mais j'ai rien trouvé...
     
  4. DadouDuck
    DadouDuck WRInaute impliqué
    Inscrit:
    28 Mai 2007
    Messages:
    814
    J'aime reçus:
    0
    Il faut que pstotext soit installé sur le serveur, sans cela, tu oublies
     
  5. nickargall
    nickargall WRInaute accro
    Inscrit:
    13 Juin 2005
    Messages:
    6 661
    J'aime reçus:
    4
    Ca, ça peut se faire, ca serait sur un dédié. Et ensuite ? :)
     
  6. jamalofski
    jamalofski WRInaute discret
    Inscrit:
    3 Mars 2007
    Messages:
    222
    J'aime reçus:
    0
    Je vais faire un peu de pub pour mon site puisque personne ne propose autre chose :wink:
    Conv2pdf proposera ce service avec son API dans très peu de temps (Quelques jours maximum)
     
  7. nickargall
    nickargall WRInaute accro
    Inscrit:
    13 Juin 2005
    Messages:
    6 661
    J'aime reçus:
    4
    Ok, mais en l'occurence je ne cherche pas de passage par une solution tierce, mais un module, un script, une classe PHP autonome à installer sur un serveur & un site PHP
     
  8. nickargall
    nickargall WRInaute accro
    Inscrit:
    13 Juin 2005
    Messages:
    6 661
    J'aime reçus:
    4
    Merci carole, je vais creuser sur PDFbox :) c'uila , je l'avais pas vu :)
     
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice