Wikipedia xml... Et après ? ;)

Nouveau WRInaute
Re bonjour,

Je post 2 sujets différents car 2 histoires différentes...

J'ai récupéré via l'outil de génération xml de Wikipedia des pages xml. Jusque la tout va bien. Le truc c'est que lorssque l'on ouvre ce fichiers la balise <texte> qui nous interesse est formatée de façon à surement faciliter ensuite la mise en page. Le problème c'est que je ne trouve pas le décodeur. J'y suis bien allé à coup de Regex et autres mais je voudrait le décodeur officiel... Il existe à votre avis ?

Pour le moment ca donne des trucs comme ca :

Code:
{{Ébauche|médecin français}} {{à sourcer|date=novembre 2009}} [[Image:Portrait of Dr. Gachet.jpg|thumb|upright|''[[Portrait du Dr Gachet avec branche de digitale|Portrait du docteur Gachet]]'' par [[Vincent Van Gogh]], 1890, Musée d?Orsay, Paris]] Le docteur '''Paul Gachet''' (30 juillet [[1828]], Lille - 9 janvier [[1909]], Auvers-sur-Oise) est un médecin, artiste et collectionneur d'?uvres d'art. Il est surtout connu comme ayant été en contact avec [[Vincent Van Gogh]], qu'il a hébergé dans sa maison d'[[Auvers-sur-Oise]]. Ce-dernier le peint dans le ''[[Portrait du Dr Gachet avec branche de digitale]]''. [[Image:Paul Cézanne 034.jpg|thumb|upright|left|''La maison du docteur Gachet'' par [[Paul Cézanne]], 1873, Musée d?Orsay, Paris]] Né à [[Lille]] en [[1828]], Paul-Ferdinand Gachet fait ses études de médecine à [[Paris]] et [[Montpellier]]. Il s'établit à Paris au 9, rue Montholon. Il fait de la médecine générale mais commence à se spécialiser dans les maladies nerveuses. Il a fait sa thèse à Montpellier en 1858 : "Etude ...

Merki pour celui qui aura le décodeur ;)
 
WRInaute accro
Si je comprends bien ton objectif est de récupérer automatiquement le texte de wikipedia, et donc j'imagine de faire un DC de la mort sur un autre site ?
 
Nouveau WRInaute
Et voila je suis aps venu ici depuis des mois et quand je reviens on m'attaque !

Pas du tout Marie-Aude... Wikipedia met à disposition ses contenus pour une utilisation libre de droits. J'ai quelques pages que je souhaite documenter. Donc j'ai pris légalement une partie du contenu wiki qui m'interesse et je souhaite maintenant l'exploiter...

Pour les prochaines réponses, si c'est pour me demander si je souhaiter organiser un attentat, tuer mon voisin, faire bruler une voiture ou débuter un commerce prolifique de vente de cannabis, la réponse est non...

T'as quand meme l'esprit vachement mal tourné Marie-Aude, enfin tu dois en voir de toutes les couleurs ici...
 
Nouveau WRInaute
Merci Monthy mais cela ne m'aide pas du tout... Un lien vers www.leparisien.fr ne me serait pas non plus d'une grande utilité ;)... Mais mais c dingue, 2 réponses en 1 minutes qui veulent toutes les deux dire "va te faire voir"... Quel bonne ambiance chez vous ;)...
 
WRInaute accro
En fait tu as pris mon intervention comme une attaque, alors qu'elle était plutôt un conseil.
Faut aussi comprendre ce qu'on vous dit...

Je sais parfaitement que le contenu de Wikipedia est sous licence libre. Et pour info, quand quelqu'un parle de faire quelque chose de contraire aux droits d'auteurs, je ne tourne pas autour du pot et je lui dis clairement.
Cela n'empêche que reprendre des contenus nombreux (sinon tu ferais un simple copier coller, là tu as besoin d'automatiser) va simplement faire que ton site sera rempli de duplicate content par rapport à Wiki, et aura donc très peu d'intérêt pour Google.

Le plagiat est une chose. Le duplicate content en est une autre.
Je ne te dis pas "va te faire voir'" je te dis "tu es sûr que c'est une bonne idée pour toi" ?
 
WRInaute accro
Ce texte me choque pas, c'est le texte de Wiki classique. Il faut le passer à la moulinette et la moulinette tu dois pouvoir la trouver sur Wiki ou tu te la fais toi même
 
Discussions similaires
Haut