Extraire le contenu et le référencement d'un site

Discussion dans 'Référencement international (langues, pays)' créé par kyrdecegirl, 27 Août 2012.

  1. kyrdecegirl
    kyrdecegirl Nouveau WRInaute
    Inscrit:
    27 Août 2012
    Messages:
    3
    J'aime reçus:
    0
    Bonjour,

    Je cherche s'il existe un logiciel capable d'extraire (dans un fichier excel ou texte) le contenu d'un site et son référencement, c'est à dire tout ce qu'il y a entre les balises de titre, de paragraphe, mais aussi le nom des images, le contenu de leur balise alt, également le title de la page, sa description et ses meta tags.

    Le but est de pouvoir faire traduire le site dans une autre langue de la manière la plus complète, en donnant l'extraction du site à un traducteur, pour ensuite l'intégrer.

    Je vous remercie d'avance.
     
  2. kyrdecegirl
    kyrdecegirl Nouveau WRInaute
    Inscrit:
    27 Août 2012
    Messages:
    3
    J'aime reçus:
    0
    Je suis désolé je n'arrive pas à atteindre votre lien.
     
  3. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 684
    J'aime reçus:
    151
    Ce lien était un spam
     
  4. patapon87
    patapon87 WRInaute passionné
    Inscrit:
    12 Janvier 2010
    Messages:
    1 124
    J'aime reçus:
    0
    En même temps ce qu'il demande c'est un peu pareil :mrgreen:
     
  5. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 684
    J'aime reçus:
    151
    Non pas vraiment... c'est pour traduire

    C'est possible avec un crawler comme htttracks, et ensuite l'utilisation de regex pour nettoyer le code. ça demande un certain savoir faire ^^
     
  6. patapon87
    patapon87 WRInaute passionné
    Inscrit:
    12 Janvier 2010
    Messages:
    1 124
    J'aime reçus:
    0
    Oui, ou j'ai l'esprit mal tourné mais c'est pour aspirer un site tout bien tout propre et le traduire pour le lancer dans une autre langue.
    Ce serait pas du plagiat ça ?
     
  7. Furtif
    Furtif WRInaute accro
    Inscrit:
    9 Août 2005
    Messages:
    2 951
    J'aime reçus:
    314
  8. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 684
    J'aime reçus:
    151
    J'ai un client qui a exactement le même problème : pas l'accès à l'admin, le développeur refuse de faire un export de base de données. On peut aussi être honnête et dans la m... ça peut aussi être un site en html pur et dur, bref il y a des tas de bonnes raisons pour avoir besoin de faire ça.

    Je trouve qu'il y a une tendance lourde sur ce forum à faire des procès d'intention aux gens. Quand on VOIT qu'ils sont hors clou, OK, mais considérer a priori que les demandes sont dans une mauvaise intention, c'est pas très normal.
     
  9. patapon87
    patapon87 WRInaute passionné
    Inscrit:
    12 Janvier 2010
    Messages:
    1 124
    J'aime reçus:
    0
    8O

    Allez j'accepte que je puisse avoir l'esprit mal tourné.
     
  10. kyrdecegirl
    kyrdecegirl Nouveau WRInaute
    Inscrit:
    27 Août 2012
    Messages:
    3
    J'aime reçus:
    0
    Mon site présente notre activité touristique et permet à nos clients de réserver leurs vacances en ligne. Nous avons un site en français et un en anglais que nous pouvons construire nous même, cependant il est plus difficile de gérer le contenu et le référencement dans des langues que nous ne maîtrisons pas dont le hollandais, l'allemand et le danois. C'est pourquoi nous voulions exporter dans un fichier excel par exemple le titre des pages, leur description, les mots clés, la balise de titre, de paragraphe, le nom des images, les balises alt, ... pour pouvoir les remettre à un traducteur. Ce n'est pas du plagiat puisque le site de base nous l'avons créé et il nous appartient.
     
  11. zeb
    zeb WRInaute accro
    Inscrit:
    5 Décembre 2004
    Messages:
    12 024
    J'aime reçus:
    1
    Techniquement a coder c'est pas trop compliqué mais je suis pas certains qu'un format XL soit adapté (tu ne va pas avoir le même nombre de choses dans chaque pages donc une grille :? )
    Sinon je ne connais pas de logiciel tout fait qui en soit capable, je n'en ai même jamais entendu parler mais je suis pas le oueb a moi tout seul :D .
    Après extraire tout ça et le lâcher dans une base de données si tu as une liste d'url c'est pas sorcier non plu :wink:
     
Chargement...
Similar Threads - Extraire contenu référencement Forum Date
extraire certaines données contenu dans une variable php Développement d'un site Web ou d'une appli mobile 16 Novembre 2010
Extraire chaine d'un Json Développement d'un site Web ou d'une appli mobile 18 Octobre 2018
Linkedin : impossible d'extraire un aperçu --- Help !!! Autres réseaux sociaux 2 Février 2017
Extraire une partie d'un site vers un nouveau Débuter en référencement 17 Juin 2016
Extraire les sessions pour chaque mois par source Google Analytics 30 Septembre 2015
url rewriting formule pour extraire "mots+clefs" Débuter en référencement 4 Août 2014
Extraire un fichier robots.txt et comparer le résultat Développement d'un site Web ou d'une appli mobile 12 Juillet 2014
[résolu] Extraire les statistiques d'une partie du site avec Google Analytics Google Analytics 11 Février 2013
Extraire une partie des données Google Analytics 8 Octobre 2012
Expression régulière : extraire une chaine variable d'une chaine Développement d'un site Web ou d'une appli mobile 4 Septembre 2012
PHP extraire des dates à partir des numéros de jours Développement d'un site Web ou d'une appli mobile 28 Mai 2012
Extraire des données d'un fichier .csv pour en faire un pdf Administration d'un site Web 12 Mai 2011
explication pour extraire les Internautes qui proviennent de google images ? Débuter en référencement 16 Avril 2011
Advanced web ranking impossible extraire les mots clés Débuter en référencement 4 Avril 2011
Extraire des données avec une regex Développement d'un site Web ou d'une appli mobile 27 Octobre 2010
Extraire les urls d'une recherche Référencement Google 24 Octobre 2010
Extraire les mots clés pertinents d'une requête Débuter en référencement 26 Mai 2010
Extraire une chaine de caractères Développement d'un site Web ou d'une appli mobile 19 Avril 2010
extraire une sous chaine d'une chaine Développement d'un site Web ou d'une appli mobile 7 Avril 2010
PHP : extraire une portion d'image Développement d'un site Web ou d'une appli mobile 15 Novembre 2009