Question à trois francs :
Je cherche à extraire le texte "visible par les moteurs" d'une page web.
Je peux passer par un outil d'analyse de texte genre www.outiref.com mais il me sort du texte brut, un peu trop brut, sans mêmes les balises importantes pour les moteurs (h1, h2...)
Existe-t-il un outil qui sort le texte ainsi formaté ?
Et sinon, n'y a-t-il pas un développeur qui aurait la merveilleuse idée de créer un outil qui cracherait à partir d'une page web un résultat du genre :
Je cherche à extraire le texte "visible par les moteurs" d'une page web.
Je peux passer par un outil d'analyse de texte genre www.outiref.com mais il me sort du texte brut, un peu trop brut, sans mêmes les balises importantes pour les moteurs (h1, h2...)
Existe-t-il un outil qui sort le texte ainsi formaté ?
Et sinon, n'y a-t-il pas un développeur qui aurait la merveilleuse idée de créer un outil qui cracherait à partir d'une page web un résultat du genre :
Code:
<title>le titre de la page</title>
<description> une page web en voila qu'elle est belle</description>
<h1>une page hyper importante sur un sujet passionnant</h1>
<h2>rubrique 1</h2>
<h2>rubrique 2</h2>