Web content is freeware - Ben voyons !

  • Auteur de la discussion Auteur de la discussion eldk
  • Date de début Date de début
WRInaute occasionnel
Bonjour,

Tout est là :

The quote. Here’s what Suleyman told CNBC’s Andrew Ross Sorkin at the Aspen Ideas Festival:

  • “…With respect to content that is already on the open web, the social contract of that content since the ’90s has been that it is fair use. Anyone can copy it, recreate with it, reproduce with it. That has been freeware, if you like. That’s been the understanding.
  • “There’s a separate category where a website or a publisher or a news organization had explicitly said, ‘do not scrape or crawl me for any other reason than indexing me so that other people can find that content.’ That’s a gray area and I think that’s going to work its way through the courts.”

https://searchengineland.com/microsoft-web-content-freeware-443775

Je ne sais pas si je peux traduire cela par : "Nous pouvons utiliser à notre guise tout le contenu du web pour entraîner nos IA , pour ceux qui s'y opposeraient, y compris par des mesures légales, c'est la justice qui tranchera ..." .

Cordialement,

Eric

Pour rappel : le fichier ai.txt - mieux vaut prévenir que guérir.
 
Olivier Duffez (admin)
Membre du personnel
ça en dit long sur la politique de Microsoft en effet

au fait, ça avance comment ce projet de fichier ai.txt ?
 
WRInaute occasionnel
Bonjour,
au fait, ça avance comment ce projet de fichier ai.txt ?
Pour ma part, j'ai bien un robot qui vient lire le fichier ai.txt, mais c'est celui de Spawning-AI . À savoir que le principe est Spawning-Ai vient lire ce fichier et stocke les règles pour le domaine/site (images, textes ... autorisés ?). Les robots IA interrogent Spawning-AI pour savoir si l'utilisation du contenu est autorisée (avec rétroactivité). En tout cas Spawning-AI clame la validité juridique pour l'Union Européenne (avec rétroactivité).

Est ce qu'un quelconque crawler AI le respecte ?

Je ne sais toujours pas. Certains respecteraient les mentions dans le fichier robots.txt .

Est ce que cette méthode est conforme avec les textes de l'Union Européenne en ce qui concerne le droit à refuser l'utilisation de son contenu prour le data-mining ?

Oui.

Est ce qu'une quelconque information des webmasters/créateurs de contenu en ce qui concerne le droit à refuser l'usage de leurs "créations" pour le data-mining par nos gouvernements ou les instances européennes est diffusée ?

Non, pas à ma connaissance. Aucune mesure de "vulgarisation".

Bref, pour le moment, pour ceux qui souhaiteraient tenter de garder le contrôle sur l'usage de leur contenu par les IA génératives ou autres. il faut (faudrait) combiner :
- robots.txt
- ia.txt (rétroactivité)
- tdmrep.json (qui est maintenant officialisé par le W3C)

Mais bon, on voit déjà, comment certaines majors ont l'intention de gérer les conflits avec les créateurs de contenu :

- Un chèque pour les "gros" qui font des procès couteux
- Nada pour les petits ("si t'es pas content, t'as qu'à attaquer")

On verra ... En tout cas, je "bloque" tout ce que je peux en ce qui concerne les IA - (SEO ou pas) - suivant le droit de refus en vigueur dans l'UE.

Cordialement,

Eric
 
Discussions similaires
Haut