1. ✅ Apprenez une METHODE qui marche pour votre SEO ! Formation à distance avec Olivier Duffez et Fabien Facériès + aide pour prise en charge du financement
    Rejeter la notice

Détection automatique du contenu illicite/soumis aux droits d'auteur

Discussion dans 'Droit du web (juridique, fiscalité...)' créé par 7804j, 7 Février 2014.

  1. 7804j
    7804j WRInaute discret
    Inscrit:
    20 Avril 2011
    Messages:
    167
    J'aime reçus:
    0
    Bonjour,

    Je ne sais pas si je suis dans la bonne section, la question étant relativement technique.

    Je dispose d'un site qui traite chaque jour près de un million de contenu utilisateur (messages et images) public, que je ne peux bien sûr pas vérifier manuellement. J'ai donc mis en place une procédure extrêmement simplifiée pour le retrait de ce contenu.
    Malgré tout, je reçois régulièrement des avis de retrait des résultats de recherche de google, et je sais que beaucoup de contenu reste en ligne trop longtemps avant d'être supprimé. Je voulais donc savoir s'il existait une sorte de base de données/librairie permettant de filtrer sommairement avec plus ou moins de précision le contenu de ma base de données.
    Je souhaiterais notamment repérer les contenus pornographiques et relatifs à la propriété intellectuelle. Je pensais donc à un logiciel semblable aux systèmes de contrôle parental, ou à une base de données publique d'images blacklistées (avec une liste de md5 par exemple), ou à un système permettant à mon serveur de directement supprimer les contenus dès que Google reçoit une demande de retrait (car actuellement, je reçois ces notifications par e-mail, ce qui n'est pas très commode). Je sais que Microsoft a des outils pour la recherche de ce genre de contenus, alors je me demandais s'il en existait des versions libres que je puisse utiliser en interne.

    Merci d'avance pour votre réponse et vos conseils.

    7804j
     
  2. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 368
    J'aime reçus:
    2
    A ma connaissance, "non".
    Tu dois plus travailler par algo, par détection de mots voir par soft d'analyse d'images pour la partie contrôle parental.

    Pour la partie "contenu relatif à la propriété intellectuelle", il existe des systèmes mis en place par les ayant droits, et qui permettent d'identifier extrêmement rapidement les contenus. Youtube utilise ça pour les vidéos, et je sais qu'un système est mis en place en France, pour la presse. J'avais vu ça ici http://www.mondaynote.com/2010/02/14/cashing-in-on-stolen-contents/

    Peut être la solution est de te mettre en rapport avec les gros éditeurs ? Je pense qu'ils seront ravis de t'aider gratuitement :)
     
  3. Axiso
    Axiso WRInaute passionné
    Inscrit:
    8 Avril 2004
    Messages:
    1 209
    J'aime reçus:
    0
    Les seules solutions que je connaisse sont éditées en versions commerciales.
    En même temps, si ça te fait gagner des heures de modération chaque semaine ça peut valoir le coup d'investir.
     
  4. 7804j
    7804j WRInaute discret
    Inscrit:
    20 Avril 2011
    Messages:
    167
    J'aime reçus:
    0
    Si elles sont efficaces, je suis prêt à investir :)
     
  5. noren
    noren WRInaute accro
    Inscrit:
    8 Avril 2011
    Messages:
    2 906
    J'aime reçus:
    14
    Je ne sais pas si j'ai bien compris le sujet. Mais en gros vous parlez bien d'outils qui permettraient d'identifier du contenu saisi par nos membres qui ne serait pas le leur? Détection de DC.

    Si c'est le cas je suis également intéressé par les réponses et ses outils, étant donné que mes futurs membres pourront poster des articles sur le site et que je voudrais m'éviter un maximum de contrôle manuels. Je souhaites évidemment éviter que mes membres proposent des articles qui sont des copiés collés (ou presque) d'articles d'autres sites.

    Je pense pouvoir modérer chaque article manuellement en vérifiant sur google, mais si il s'avère que le site fonctionne pas mal Je pourrais vite perdre beaucoup de temps rien qu'avec la modération.
     
  6. Axiso
    Axiso WRInaute passionné
    Inscrit:
    8 Avril 2004
    Messages:
    1 209
    J'aime reçus:
    0
    Il veut surtout détecter des contenus inapropriés selon ses critères je crois, pas le contenu dupliqué. Même s'il ne serait pas contre j'imagine :)

    @7804j : un message en privé.
     
  7. noren
    noren WRInaute accro
    Inscrit:
    8 Avril 2011
    Messages:
    2 906
    J'aime reçus:
    14
    ah avec le terme "soumis aux droits d'auteur" je comprenais également contrôle du DC :mrgreen:

    Si quelqu'un sait comment automatiser le contrôle du DC des articles publiés par les membres, je suis preneur :wink:
     
  8. 7804j
    7804j WRInaute discret
    Inscrit:
    20 Avril 2011
    Messages:
    167
    J'aime reçus:
    0
    Vu qu'il s'agit de discussions entre utilisateurs et non pas d'articles, il y a peu de risques de contenu dupliqué. Par "soumis aux droits d'auteur", je pensais plutôt à des images provenant de bandes dessinées ou éventuellement à des chapitres de livres copiés-collés.
     
  9. noren
    noren WRInaute accro
    Inscrit:
    8 Avril 2011
    Messages:
    2 906
    J'aime reçus:
    14
    Ah ok ;)

    Cela dit ma question tient toujours, si jamais quelqu'un passe par là et aurait un moyen pour simplifier la tache de la detection de DC des articles de membres :mrgreen:
     
Chargement...
Similar Threads - Détection automatique contenu Forum Date
Détection automatique de la langue et référencement Débuter en référencement 18 Septembre 2013
Problème et mauvaise détection automatique de recherche Google Problèmes de référencement spécifiques à vos sites 9 Juillet 2013
Détection automatique de la langue du navigateur : risque pour le SEO Référencement international (langues, pays) 16 Mai 2011
La détection automatique de la langue du navigateur!!! Demandes d'avis et de conseils sur vos sites 23 Janvier 2010
Email de détection de non conformités AdSense AdSense 3 Février 2020
Détection tablette marche pas Développement d'un site Web ou d'une appli mobile 1 Juillet 2019
Détection Google de réseau de sites avec un même compte Search Console Netlinking, backlinks, liens et redirections 16 Novembre 2018
Détection des vidéos en doublon sur YouTube [brevet Google] YouTube, Google Images et Google Maps 11 Janvier 2017
Détection des mobiles, pour AMP Google : l'entreprise, les sites web, les services 12 Décembre 2016
SEO : détection des pages trop profondes avec myrankingmetrics Débuter en référencement 20 Avril 2016