Wikipedia xml... Et après ? ;)

Discussion dans 'Développement d'un site Web ou d'une appli mobile' créé par francenails, 1 Février 2011.

  1. francenails
    francenails Nouveau WRInaute
    Inscrit:
    20 Novembre 2009
    Messages:
    7
    J'aime reçus:
    0
    Re bonjour,

    Je post 2 sujets différents car 2 histoires différentes...

    J'ai récupéré via l'outil de génération xml de Wikipedia des pages xml. Jusque la tout va bien. Le truc c'est que lorssque l'on ouvre ce fichiers la balise <texte> qui nous interesse est formatée de façon à surement faciliter ensuite la mise en page. Le problème c'est que je ne trouve pas le décodeur. J'y suis bien allé à coup de Regex et autres mais je voudrait le décodeur officiel... Il existe à votre avis ?

    Pour le moment ca donne des trucs comme ca :

    Code:
    {{Ébauche|médecin français}} {{à sourcer|date=novembre 2009}} [[Image:Portrait of Dr. Gachet.jpg|thumb|upright|''[[Portrait du Dr Gachet avec branche de digitale|Portrait du docteur Gachet]]'' par [[Vincent Van Gogh]], 1890, Musée d?Orsay, Paris]] Le docteur '''Paul Gachet''' (30 juillet [[1828]], Lille - 9 janvier [[1909]], Auvers-sur-Oise) est un médecin, artiste et collectionneur d'?uvres d'art. Il est surtout connu comme ayant été en contact avec [[Vincent Van Gogh]], qu'il a hébergé dans sa maison d'[[Auvers-sur-Oise]]. Ce-dernier le peint dans le ''[[Portrait du Dr Gachet avec branche de digitale]]''. [[Image:Paul Cézanne 034.jpg|thumb|upright|left|''La maison du docteur Gachet'' par [[Paul Cézanne]], 1873, Musée d?Orsay, Paris]] Né à [[Lille]] en [[1828]], Paul-Ferdinand Gachet fait ses études de médecine à [[Paris]] et [[Montpellier]]. Il s'établit à Paris au 9, rue Montholon. Il fait de la médecine générale mais commence à se spécialiser dans les maladies nerveuses. Il a fait sa thèse à Montpellier en 1858 : "Etude ...
    Merki pour celui qui aura le décodeur ;)
     
  2. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 931
    J'aime reçus:
    269
    Si je comprends bien ton objectif est de récupérer automatiquement le texte de wikipedia, et donc j'imagine de faire un DC de la mort sur un autre site ?
     
  3. Monty973
    Monty973 WRInaute passionné
    Inscrit:
    21 Mars 2006
    Messages:
    1 160
    J'aime reçus:
    1
  4. francenails
    francenails Nouveau WRInaute
    Inscrit:
    20 Novembre 2009
    Messages:
    7
    J'aime reçus:
    0
    Et voila je suis aps venu ici depuis des mois et quand je reviens on m'attaque !

    Pas du tout Marie-Aude... Wikipedia met à disposition ses contenus pour une utilisation libre de droits. J'ai quelques pages que je souhaite documenter. Donc j'ai pris légalement une partie du contenu wiki qui m'interesse et je souhaite maintenant l'exploiter...

    Pour les prochaines réponses, si c'est pour me demander si je souhaiter organiser un attentat, tuer mon voisin, faire bruler une voiture ou débuter un commerce prolifique de vente de cannabis, la réponse est non...

    T'as quand meme l'esprit vachement mal tourné Marie-Aude, enfin tu dois en voir de toutes les couleurs ici...
     
  5. francenails
    francenails Nouveau WRInaute
    Inscrit:
    20 Novembre 2009
    Messages:
    7
    J'aime reçus:
    0
    Merci Monthy mais cela ne m'aide pas du tout... Un lien vers www.leparisien.fr ne me serait pas non plus d'une grande utilité ;)... Mais mais c dingue, 2 réponses en 1 minutes qui veulent toutes les deux dire "va te faire voir"... Quel bonne ambiance chez vous ;)...
     
  6. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 931
    J'aime reçus:
    269
    En fait tu as pris mon intervention comme une attaque, alors qu'elle était plutôt un conseil.
    Faut aussi comprendre ce qu'on vous dit...

    Je sais parfaitement que le contenu de Wikipedia est sous licence libre. Et pour info, quand quelqu'un parle de faire quelque chose de contraire aux droits d'auteurs, je ne tourne pas autour du pot et je lui dis clairement.
    Cela n'empêche que reprendre des contenus nombreux (sinon tu ferais un simple copier coller, là tu as besoin d'automatiser) va simplement faire que ton site sera rempli de duplicate content par rapport à Wiki, et aura donc très peu d'intérêt pour Google.

    Le plagiat est une chose. Le duplicate content en est une autre.
    Je ne te dis pas "va te faire voir'" je te dis "tu es sûr que c'est une bonne idée pour toi" ?
     
  7. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 357
    J'aime reçus:
    2
    Ce texte me choque pas, c'est le texte de Wiki classique. Il faut le passer à la moulinette et la moulinette tu dois pouvoir la trouver sur Wiki ou tu te la fais toi même
     
  8. spout
    spout WRInaute accro
    Inscrit:
    14 Mai 2003
    Messages:
    9 185
    J'aime reçus:
    353
  9. francenails
    francenails Nouveau WRInaute
    Inscrit:
    20 Novembre 2009
    Messages:
    7
    J'aime reçus:
    0
    Merci beaucoup et deoslé de m'etre emporté monthy ;)...
     
Chargement...
Similar Threads - Wikipedia xml après Forum Date
Avoir un article Wikipedia pour son entreprise Le café de WebRankInfo 16 Novembre 2021
Backlink Wikipedia Netlinking, backlinks, liens et redirections 13 Février 2018
Meilleur Backlink sur Wikipedia Débuter en référencement 13 Février 2018
Les deux monopoles, Google et Wikipédia Google : l'entreprise, les sites web, les services 23 Avril 2016
Référencement avec lien depuis Wikipedia Débuter en référencement 3 Avril 2015
Utilité d'une page Wikipédia et d'un profil entreprise sur Viadeo Autres réseaux sociaux 5 Février 2014
Copié-collé des definitions de wikipedia et referencement Débuter en référencement 5 Septembre 2013
Liens wikipedia : nofollow mais utiles pour le référencement ? Netlinking, backlinks, liens et redirections 27 Août 2013
L'internet en danger ! Google, Wikipedia, deezer. et la mission 404 Le café de WebRankInfo 6 Juillet 2013
Wikipedia lance Wikivoyage, guide de voyage en ligne Le café de WebRankInfo 17 Janvier 2013
Doubler Wikipedia Problèmes de référencement spécifiques à vos sites 5 Mai 2012
Péréniser sa page sur Wikipedia Annuaires et moteurs 20 Mars 2012
Comment optimiser une page marque sur Wikipedia (page entreprise) Autres moteurs de recherche connus 7 Février 2012
URL rewriting façon Wikipédia : pas bien ? URL Rewriting et .htaccess 15 Mai 2011
No Follow et Wikipedia Problèmes de référencement spécifiques à vos sites 16 Mars 2011
Google se trompe dans les langues avec Wikipédia Crawl et indexation Google, sitemaps 2 Mars 2011
lien wikipédia Netlinking, backlinks, liens et redirections 30 Octobre 2010
Extrait wikipedia sur site marchand. Droit du web (juridique, fiscalité...) 12 Juillet 2010
Duplicate entre Wikipédia et l'encyclopédie de Voila Référencement Google 12 Juillet 2010
Utilisation des marques Facebook Twitter Wikipedia dans les mots clés Annuaires et moteurs 15 Mai 2010