Bonjour,
Je ne sais pas si je suis dans la bonne section, la question étant relativement technique.
Je dispose d'un site qui traite chaque jour près de un million de contenu utilisateur (messages et images) public, que je ne peux bien sûr pas vérifier manuellement. J'ai donc mis en place une procédure extrêmement simplifiée pour le retrait de ce contenu.
Malgré tout, je reçois régulièrement des avis de retrait des résultats de recherche de google, et je sais que beaucoup de contenu reste en ligne trop longtemps avant d'être supprimé. Je voulais donc savoir s'il existait une sorte de base de données/librairie permettant de filtrer sommairement avec plus ou moins de précision le contenu de ma base de données.
Je souhaiterais notamment repérer les contenus pornographiques et relatifs à la propriété intellectuelle. Je pensais donc à un logiciel semblable aux systèmes de contrôle parental, ou à une base de données publique d'images blacklistées (avec une liste de md5 par exemple), ou à un système permettant à mon serveur de directement supprimer les contenus dès que Google reçoit une demande de retrait (car actuellement, je reçois ces notifications par e-mail, ce qui n'est pas très commode). Je sais que Microsoft a des outils pour la recherche de ce genre de contenus, alors je me demandais s'il en existait des versions libres que je puisse utiliser en interne.
Merci d'avance pour votre réponse et vos conseils.
7804j
Je ne sais pas si je suis dans la bonne section, la question étant relativement technique.
Je dispose d'un site qui traite chaque jour près de un million de contenu utilisateur (messages et images) public, que je ne peux bien sûr pas vérifier manuellement. J'ai donc mis en place une procédure extrêmement simplifiée pour le retrait de ce contenu.
Malgré tout, je reçois régulièrement des avis de retrait des résultats de recherche de google, et je sais que beaucoup de contenu reste en ligne trop longtemps avant d'être supprimé. Je voulais donc savoir s'il existait une sorte de base de données/librairie permettant de filtrer sommairement avec plus ou moins de précision le contenu de ma base de données.
Je souhaiterais notamment repérer les contenus pornographiques et relatifs à la propriété intellectuelle. Je pensais donc à un logiciel semblable aux systèmes de contrôle parental, ou à une base de données publique d'images blacklistées (avec une liste de md5 par exemple), ou à un système permettant à mon serveur de directement supprimer les contenus dès que Google reçoit une demande de retrait (car actuellement, je reçois ces notifications par e-mail, ce qui n'est pas très commode). Je sais que Microsoft a des outils pour la recherche de ce genre de contenus, alors je me demandais s'il en existait des versions libres que je puisse utiliser en interne.
Merci d'avance pour votre réponse et vos conseils.
7804j