DMOZ Vendre le RDF DMOZ !

WRInaute occasionnel
Nos amis les Spammeurs ne reculent devant rien !

Reçu aujourd'hui :
Hi!

Database of URLs of ALL websites (1.9 million) listed on the Google.com
directory is on sale!

The database includes domains/URLs of ALL websites (1.9 million)
listed on the Google directory. By default the domains database is
provided in a ZIP archive of a TXT file (14.2MB, one domain/URL per
line) or in any other format of your choice. The data was collected
in the period of September 07-14, 2003 and will be updated every 3
months.

If you are interested in purchasing this data please email us to
sales@xxxxxxxxx.com <mailto:sales@xxxxxxxxxxxx.com>
(DO NOT REPLY TO THIS MESSAGE).

Thank you for your attention!

Sincerely,
Jessica Lambert | xxxxxxxxxx.com
Mirgolth
 
Olivier Duffez (admin)
Membre du personnel
ils le vendent quand meme 240$ puis 50$ par mise à jour trimestrielle...
ils ont aussi une base de données des sites utilisant les adwords ou autres achats de liens sponsorisés
 
WRInaute occasionnel
Est légal de ventre une BD opensource surtout lorsqu'on n'a pas les droits de propriété ?
Avoir une copie de la BD pour sa propre exploitation ne veut pas dire devenir le propriétaire.
 
WRInaute discret
Est-ce qu'il existe des versions allégées de l'index parce que exploiter 2 millions de sites c fait beacoup :) ... ou alors exploiter seulement certaines catégories ? ca serait meme mieux ca d'ailleurs, c possible ?
 
WRInaute passionné
Davios a dit:
Est-ce qu'il existe des versions allégées de l'index parce que exploiter 2 millions de sites c fait beacoup :) ... ou alors exploiter seulement certaines catégories ? ca serait meme mieux ca d'ailleurs, c possible ?

Bonjour,

ca s'appelle ne pas tout lire :)
2 messages avant le tien : https://www.webrankinfo.com/forum/viewt ... 7889#47889¨

Et plus spécialement
http://dmozed.org/special/french/www/help/getdata.html
http://dmozed.org/special/french/www/he ... ml#updated

François
 
WRInaute discret
Suede a dit:

Merci Suede pour ces précisions mais je t'avouerais que j'avais déjà lu ces messages et qu'il ne répondent pas à ma question ... ou alors je cromprends pas tout
D'ailleurs sur DMOZ, je n'ai pas vu d'exemples explicitant le fait que l'on puisse exploiter que quelques catégories.

Alors, il est bien sur possible de n'utiliser que quelques catégories une fois les fichiers téléchargés ... mais bon 300Mo si l'on ne s'intéresse qu'à une catégorie par exemple, ca fait beaucoup de données pour pas gd chose d'exploité.

Je sais pas si j'ai été plus clair que dans mon premier message :)

En tt cas, merci de ta réponse, je vais qd meme à mon avis la chopper la structure pour voir si je peux pas en extraire que ce qui m'intéresse après
 
WRInaute discret
Il n'existe pas, à ma connaissance, de version "élaguée" des données de l'ODP. Par contre, certains utilitaires (payants) permettent de ne télécharger qu'une partie du répertoire.

Voir par exemple, le Dmoz Extractor (je pense qu'il ne fonctionne que pour les catégories anglophones en raison d'un problème d'encodage, mais je n'en suis pas absolument sûr, il faudrait vérifier).

D'autres outils permettant de manipuler les données de l'ODP sont présentés dans la catégorie : Computers/Internet/Searching/Directories/Open_Directory_Project/Use_of_ODP_Data/Upload_Tools/
 
WRInaute discret
Merci de ta réponse VanilleFraise, j'ai regardé un peu les outils qui sont dans cette catégorie, ca m'a l'air sympa et apparemment les outils permettant "d'extraire" une partie des données de l'ODP sont en fait des spiders assez bien foutus.
Par contre je sais pas si je vais m'en servir sachant que j'ai déjà récupérer les RDF :)

Enfin, sinon ca serait une suggestion pour DMOZ, de permettre d'afficher de manière partielle certaines catégories sur un site.
Je ne m'attends pas à ce qu'elle soit prise en compte mais sait-on jamais ... :)
 
WRInaute discret
cmic a dit:
perti a dit:
Y a t-il une solution pour télécherger uniquement la mise à jour depuis une date ?
Tout est

Hélas cette page n'est plus disponible aujourd'hui :

Dmozed.org has undergone a change. The page you're looking for currently no longer exists. Please visit the Editor Produced Tools internal forum for information about content that used to be at this site.

Où peut-on la retrouver ?
 
WRInaute discret
Americas a dit:
Par contre... si vous voulez installez l'annuaire sur votre site... il existe un petit script sympa est très rapide :wink:

http://www.dominion-web.com/products/dwodp_live/ :arrow:

Un petit script PHP bien sympa. Son développeur, Dominion Web, propose aussi une version commerciale : DWodp pro. Des scripts Perl permettent de traiter le "dump RDF" et extraient les données dans une base MySQL qui peut ensuite être consultée à l'aide de scripts PHP. L'utilisation de deux langages scripts est sans doute historique au projet. Auparavant le projet s'appelait DWodp et ne devait être qu'un script PHP gratuit. La différence entre la version "live" et "pro" réside dans les nombreuses fonctionnalités et l'utilisation de MySQL.

Sinon on peut trouver d'autres scripts dans la catégorie Open Directory Project de Hotscripts.com.
 
Discussions similaires
Haut