Bonjour,
je dirige une agence de traduction, et nous sommes souvent chargés de traduire des sites Web. La plupart du temps, nos clients nous envoient seulement leur URL et se reposent sur nous pour récupérer le texte à traduire, compter les mots, et faire le devis... qu'ils n'accepteront peut-être pas. Nous avons donc tout intérêt à procéder à ces opérations rapidement et avec exactitude (imaginez qu'il y ait en fait plus de mots à traduire que de mots vendus...).
Jusqu'à quelque temps, les sites étaient statiques et s'aspiraient facilement avec certains outils dédiés. Donc, tout ça ne posait pas de problème. Mais le e-commerce, l'architecture LAMP et d'autres avancées ont généralisé l'utilisation de sites Web dynamiques, reposant sur une base de données. Dans ce cas-là, les outils classiques sont perdus, car ils tentent de générer toutes les combinaisons possibles pour obtenir toutes les pages possibles. Les téléchargements durent des journées entières, les fichiers prennent une place monstrueuse sur nos disques, le texte récupéré est à 95% composé de doublons (qu'il est assez long de supprimer) et on n'a en fait aucune certitude d'avoir bien tout récupéré en fait.
Une solution consisterait à demander aux clients de nous fournir directement leur base de données (un export dans Excel et hop! c'est fait). Mais on se heurte là à un autre problème. La plupart du temps, nos interlocuteurs ne sont pas versés dans la technique mais dans le marketing. Ils prennent peur dès qu'on parle de base de données et annulent leur commande... ou bien le site a été développé il y a longtemps par une webagency et c'est trop compliqué de tout récupérer. Bref, c'est l'impasse.
D'où (enfin!) ma question, simple en apparence: connaissez-vous un moyen de récupérer les données sur lesquelles s'appuient les sites dynamiques sans passer par toute cette gymnastique ? Existe-t-il une solution technique simple, oui ou non ? Ou bien doit-on trouver un moyen de récupérer les bases auprès des clients directement et c'est tout ?
Merci infiniment de votre aide.
Guillaume
je dirige une agence de traduction, et nous sommes souvent chargés de traduire des sites Web. La plupart du temps, nos clients nous envoient seulement leur URL et se reposent sur nous pour récupérer le texte à traduire, compter les mots, et faire le devis... qu'ils n'accepteront peut-être pas. Nous avons donc tout intérêt à procéder à ces opérations rapidement et avec exactitude (imaginez qu'il y ait en fait plus de mots à traduire que de mots vendus...).
Jusqu'à quelque temps, les sites étaient statiques et s'aspiraient facilement avec certains outils dédiés. Donc, tout ça ne posait pas de problème. Mais le e-commerce, l'architecture LAMP et d'autres avancées ont généralisé l'utilisation de sites Web dynamiques, reposant sur une base de données. Dans ce cas-là, les outils classiques sont perdus, car ils tentent de générer toutes les combinaisons possibles pour obtenir toutes les pages possibles. Les téléchargements durent des journées entières, les fichiers prennent une place monstrueuse sur nos disques, le texte récupéré est à 95% composé de doublons (qu'il est assez long de supprimer) et on n'a en fait aucune certitude d'avoir bien tout récupéré en fait.
Une solution consisterait à demander aux clients de nous fournir directement leur base de données (un export dans Excel et hop! c'est fait). Mais on se heurte là à un autre problème. La plupart du temps, nos interlocuteurs ne sont pas versés dans la technique mais dans le marketing. Ils prennent peur dès qu'on parle de base de données et annulent leur commande... ou bien le site a été développé il y a longtemps par une webagency et c'est trop compliqué de tout récupérer. Bref, c'est l'impasse.
D'où (enfin!) ma question, simple en apparence: connaissez-vous un moyen de récupérer les données sur lesquelles s'appuient les sites dynamiques sans passer par toute cette gymnastique ? Existe-t-il une solution technique simple, oui ou non ? Ou bien doit-on trouver un moyen de récupérer les bases auprès des clients directement et c'est tout ?
Merci infiniment de votre aide.
Guillaume