1. ✅ Apprenez une METHODE qui marche pour votre SEO ! Formation à distance avec Olivier Duffez et Fabien Facériès + aide pour prise en charge du financement
    Rejeter la notice

Suppression données personnelles et index google

Discussion dans 'Crawl et indexation Google, sitemaps' créé par jcalino, 5 Avril 2013.

  1. jcalino
    jcalino Nouveau WRInaute
    Inscrit:
    5 Avril 2013
    Messages:
    4
    J'aime reçus:
    0
    Bonjour à tous,

    Je dois répondre à une demande de suppression de données personnelles sur le site que je gère. Le demandeur menace de déposer plainte auprès de la CNIL.
    Le site a été développé avec le logiciel libre SPIP dans sa version 2.
    Les données personnelles du demandeur figurent en effet dans un fichier pdf qui a été publié à une époque dans un article sur notre site.
    Nous avons procédé à la suppression de cet article, mais force est de constater que cette action n'a pas pour autant supprimé les fichiers associés dont le fameux fichier incriminé. En effet, dans l'index google, le lien vers ce fichier est toujours actif et conduit bien à son téléchargement. Cependant, nous ne trouvons aucune trace de ce fichier dans la partie privée du site.
    J'ai expliqué cette situation au demandeur qui nous a répondu à juste titre que ce n'était pas son problème en nous indiquant qu'il suffisait de supprimer le fichier directement sur le serveur qui héberge le site. Il a probablement raison, seulement, la seule habilitation dont je dispose est celle d'administrateur webmestre de l'environnement SPIP. Je me trouve donc privé de moyens pour agir au niveau du serveur.
    Je ne vais pas rentrer dans les détails mais nous ne travaillons plus avec le prestataire qui a mis en oeuvre ce site, et ma hiérarchie n'envisage pas de recourir à un autre prestataire pour des raisons d'ordre budgétaire.
    J'en arrive donc à ma question et vous prie de m'excuser d'avoir été un peu long.
    Le fichier incriminé a bien été à un moment donné en ligne sur notre site au sens où un lien vers ce dernier était bien présent sur une page de notre site. Ce qui explique la présence de ce lien dans l'index google.
    Aujourd'hui, si le fichier est toujours présent sur le serveur hébergeant notre site, il n'existe plus, sur aucune page de notre site, de lien vers ce dernier.
    Peut-on considérer que le lien présent dans l'index google disparaîtra lors du prochain passage des robots google sur notre site ou ce lien persistera-t-il dans l'index google du seul fait qu'il pointe vers un fichier existant ?

    Merci d'avance pour vos réponses et bonne journée.
     
  2. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 368
    J'aime reçus:
    2
    Tant que le document est accessible sur un serveur que tu héberges, ta responsabilité est engagée. Tu peux demander la suppression de l'url via GWT, mais rien ne dit qu'elle ne réapparaitra pas, et surtout que quelqu'un qui a mémorisé l"url n'ira pas télécharger le document.

    Accessoirement, gérer un site sans avoir la main sur le serveur est très risqué.
     
  3. jcalino
    jcalino Nouveau WRInaute
    Inscrit:
    5 Avril 2013
    Messages:
    4
    J'aime reçus:
    0
    Merci Marie-Aude.
    Je suis d'accord sur la responsabilité du propriétaire d'un site et donc de celle de mon employeur.
    Je ne comprends pas ce que tu entends par suppression de l'url via GWT.
    Mes compétences se limitent à la publication d'informations sur ce site public. Je n'ai que des connaissances limitées en informatique.
    Le robot google a pu indexer ce fichier car un lien était présent à une époque sur une page de mon site. Il n'aurait jamais pu y accéder autrement car le dossier contenant ce fichier est protégé par un .htaccess. Quand je saisis ce dossier dans le navigateur (monsite/IMG/pdf), j'obtiens un message "403 forbidden".
    En fait, ma question portait sur la façon dont est construit l'index google relatif à un site.
    Est-ce une opération de type "annule et remplace", auquel cas le lien incriminé présent dans l'index va naturellement disparaître puisque ce lien n'existe plus sur mon site ? Dans la négative, comment est-ce géré ?
    Enfin, le fait que quelqu'un ait mémorisé l'url est moins gênante. L'important est que le demandeur ne voit plus ses données personnelles en saisissant ses nom et prénom dans un moteur de recherche.
    Par ailleurs, j'ai constaté que le lien vers ce pdf était mémorisé sur d'autres sites : fichier.me et www.documents.com.co.
    Connais-tu ces sites ?
    Merci.
     
  4. Archaos-JdR
    Archaos-JdR WRInaute discret
    Inscrit:
    20 Septembre 2006
    Messages:
    122
    J'aime reçus:
    0
    Le fichier semble toujours présent sur le disque dur. Il faudrait passer par FTP (ou équivalent pour le supprimer véritablement). Le prestataire qui a mis en oeuvre ce site a du vous donner tous les codes d'accès (FTP entre autres), si ce n'est pas le cas il faudrait lui demander. L'hébergeur actuel devrait aussi pouvoir réinitialiser les comptes FTP (ou autres).

    Le lien restera dans les anciennes version stockées en cache.
     
  5. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 368
    J'aime reçus:
    2
    Google Webmaster Tools permet de supprimer des urls de ses résultats... quand on a pu valider qu'on est propriétaire du site, donc quand on a accès au ftp.

    Tu n'es sans doute donc pas la bonne personne, et tu ferais mieux de repasser la patate chaude.

    Non, le document pdf a été indexé, et donc tant qu'il sera disponible, ce qui semble être le cas, il restera indexé.

    Ce n'est pas ce que dit la loi. Eet ce qn'est pas ce qui t'es demandé

    Raison de plus pour supprimer le fichier.
     
  6. zeb
    zeb WRInaute accro
    Inscrit:
    5 Décembre 2004
    Messages:
    12 192
    J'aime reçus:
    1
    Après c'est qu'un spip si le prestataire est parti depuis un moment il y a des chances pour qu'il soit pas a jour ... :D
     
  7. pfg236
    pfg236 Nouveau WRInaute
    Inscrit:
    4 Mai 2005
    Messages:
    1
    J'aime reçus:
    0
    Le plugin "mediathèque" permet de retrouver tous les documents téléchargés dans SPIP, et de les supprimer définitivement : http://contrib.spip.net/Mediatheque

    Encore faut-il que l'installation automatique des plugins soit possible (c'est dans configuration/gestion des plugins).

    Sinon le fait que tu n'ais pas d'accès FTP au serveur me semble un risque : tu n'as pas accès aux squelettes et donc ne peut pas bouger le site ailleurs, je me trompe ?
     
  8. jcalino
    jcalino Nouveau WRInaute
    Inscrit:
    5 Avril 2013
    Messages:
    4
    J'aime reçus:
    0
    Bonjour,

    Je ne comprends pas.
    Nous avons réussi à supprimer le fichier par FTP.
    Et le lien vers ce fichier est toujours actif.
    Pour information, le serveur est sous APACHE.

    Merci pour votre aide.
     
  9. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 368
    J'aime reçus:
    2
    Tu veux dire que si tu cliques sur le lien, le fichier s'affiche ?
     
  10. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 887
    J'aime reçus:
    74
    Si tu as eu accès au FTP, met le robots.txt et bloque l'accès au fichier. Ce qui te permettra d'en faire la demande de suppression dans Google Webmaster Tools.
     
  11. HawkEye
    HawkEye WRInaute accro
    Inscrit:
    23 Février 2004
    Messages:
    13 932
    J'aime reçus:
    4
    L'URL (l'adresse) du fichier est certainement encore présente dans l'index (la base de données) de Google.
    Si le code d'état renvoyé par cette adresse est de type "404" (à vérifier ici: https://www.webrankinfo.com/outils/header.php), Google finira par retirer la page de ses résultats.

    Quoi qu'il en soit, si le fichier n'est plus consultable par un visiteur, tu as fait tout ce qui était de ta responsabilité.
    Dossier clos.
     
  12. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 414
    J'aime reçus:
    0
    si on laisse faire gg, ça mettra du temps. En fait, c'est plus du 410 que du 404 qu'il faut renvoyer
     
  13. jcalino
    jcalino Nouveau WRInaute
    Inscrit:
    5 Avril 2013
    Messages:
    4
    J'aime reçus:
    0
    Bonjour et merci à tous,
    Quelques précisions.
    Le fichier a bien été supprimé par FTP. Il n'existe donc plus physiquement sur le serveur. Je viens de vérifier à nouveau.
    Il y a bien un lien vers ce fichier dans les index Google mais ce lien est toujours actif, le fait de cliquer sur ce lien permet de télécharger ce fichier !!!!!
    Au départ je pensais que le cache de mon navigateur Firefox était en cause. Mais le fait de vider ce cache n'a pas résolu le problème.
     
Chargement...
Similar Threads - Suppression données personnelles Forum Date
Droit de suppression de données personelles - Conserver des données pour bloquer quelqu'un Droit du web (juridique, fiscalité...) 23 Juin 2014
Suppression Base de données Développement d'un site Web ou d'une appli mobile 29 Août 2011
Suppression de données sql superieur à 15 jours Développement d'un site Web ou d'une appli mobile 7 Novembre 2010
WordPress Suppression élément avec Css Demandes d'avis et de conseils sur vos sites 16 Août 2020
Search Console Suppression de sous domaines + stop crawl ? Crawl et indexation Google, sitemaps 27 Juillet 2020
Suppression de page et Référencement Référencement Google 16 Juillet 2020
Outil suppression GSC Crawl et indexation Google, sitemaps 20 Avril 2020
suppression de page noindex Crawl et indexation Google, sitemaps 12 Mars 2020
Suppression des étiquettes Wordpress (tags) ? Rédaction web et référencement 21 Novembre 2019
Besoin d'éclaircissement suppression produits et page cms prestashop Netlinking, backlinks, liens et redirections 20 Novembre 2019