Des documents sensibles sont enregistrés sur Google Docs!

Discussion dans 'Débuter en référencement' créé par stolz, 17 Juin 2012.

  1. stolz
    stolz Nouveau WRInaute
    Inscrit:
    23 Septembre 2011
    Messages:
    6
    J'aime reçus:
    0
    Bonjour,

    J'ai mis à jour dernièrement mon site web, et j'ai eu un gros problème avec l'indexation de mes fichiers.

    je recevais des CV au format DOC qui étaient enregistrés sur le serveur du site, dans un répertoire interdit d’accès aux robots, sauf que, lors de ma mise a jour, ces fichiers ont été indexés et sortent maintenant avec les résultats de recherche ( quand on tape le nom d'un candidat par exemple ).

    J'ai revérifié le contenu du robots.txt qui est correct,
    J'ai demandé a google webmasters de supprimer les fichiers indéxés,
    J'ai supprimé les documents en question de mon serveur web,

    Mon probleme, les documents restent accessibles en ligne car ils sont enregistrés sur google documents,

    Je ne trouve pas comment les supprimer ? C'est très important que les données personnelles de mes contacts sont en ligne,

    Merci de votre aide,

    Stolz.
     
  2. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 875
    J'aime reçus:
    71
    Url du site ? A mon sens, si quelqu'un ou un robot a accédé à tes fichiers, c'est que le dossier de stockage n'était pas sécurisé.
     
  3. stolz
    stolz Nouveau WRInaute
    Inscrit:
    23 Septembre 2011
    Messages:
    6
    J'aime reçus:
    0
    Merci beaucoup UsagiYojimbo de ta réponse rapide, :)

    Il l'etait, les fichiers ont été stockés de la sorte durant plus de 2 ans sans aucun probleme, la, tout sort,
    J'ai pu faire en sorte que les fichiers ne soient plus lisibles directement, mais, ils restent dans le "cache" on je ne sais quoi de google documents,
    Si on clique sur l'url du fichier, cela nous renvoi vers une redirection, ( page d'accueil ), mais si on clique sur le le petit "afficher", cela nous renvoi vers le document enregistré dans google documents qui lui est lisible meme si l'url qu'il donne n'existe plus.

    L'url du site, je peux te la donner par MP, mais, je ne voudrais pas publier un lien vers mon site avec cette faille.
     
  4. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 875
    J'aime reçus:
    71
    Va pour le MP, avec un exemple concret ^^
     
  5. Koxin-L.fr
    Koxin-L.fr WRInaute passionné
    Inscrit:
    15 Janvier 2012
    Messages:
    1 892
    J'aime reçus:
    8
    Bonjour,

    Sans donner l'url, tu peux toujours montrer ton script de sécurisation pour avoir des avis.

    Rod
     
  6. stolz
    stolz Nouveau WRInaute
    Inscrit:
    23 Septembre 2011
    Messages:
    6
    J'aime reçus:
    0
    Bonjour,

    Je n'ai pas script de sécurisation,

    J'ai juste mis un disallow pour le répertoire, et pour les extensions que je ne souhaite plus faire indexer, ( doc, docx, pdf, xls et xlsx )

    Et puis c'est tout,

    Il fallait faire autre chose ?



    Merci :)
     
  7. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 149
    J'aime reçus:
    270
    Idem, si cela est possible.
     
  8. XoSt
    XoSt WRInaute passionné
    Inscrit:
    6 Octobre 2003
    Messages:
    2 231
    J'aime reçus:
    0
    Euh, depuis quand Google index nos documents personnels stockés sur Google Drive ?!
     
  9. Koxin-L.fr
    Koxin-L.fr WRInaute passionné
    Inscrit:
    15 Janvier 2012
    Messages:
    1 892
    J'aime reçus:
    8
    o0
    Euhhhhh... le robots.txt, c'est juste pour dire "Ce truc ? non, pas la peine d'aller le voir."
    Mais cela n'empêche personne d'y accéder.

    - Tu charges ton robots.txt, GG passe au même moment, il ne le voit pas, il indexe.
    - Le bot GG à une couille, il oublie de lire le robots.txt
    - Un bot qui se moque du robots indexe les fichiers. GG les trouve chez lui.

    Tout ce qui ne doit pas apparaitre sur le web et qui a un certain niveau de confidentialité doit être interdit physiquement d'être lu.
    Ta parti admin, elle est sécurisée ou juste bloqué par robots.txt ?

    Rod
     
  10. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 875
    J'aime reçus:
    71
    Aucun rapport ici. Il s'agit des fichiers mis en cache en raison d'un manque de sécurisation du dossier de stockage.
     
  11. XoSt
    XoSt WRInaute passionné
    Inscrit:
    6 Octobre 2003
    Messages:
    2 231
    J'aime reçus:
    0
    Bah Google Docs maintenant c'est Google Drive, ou alors j'ai pas compris ?
     
  12. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 875
    J'aime reçus:
    71
    Il ne s'agit pas de fichier stockés sur Google Doc, ils sont bien stockés physiquement sur le serveur qui héberge le site. Ce sont les versions en cache qui sont accessible via le reader de Google Doc.
     
  13. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 436
    J'aime reçus:
    0
    une sécurisation avec juste un blocage dans robots.txt, ça revient à protéger ta voiture contre le vol en mettant juste un autocollant "s'il vous plait, ne volez pas ma voiture" :mrgreen:
    si le couple htaccess/htpasswd existe, c'est bien pour une raison. Le htaccess ne sert pas qu'à faire des réécriture d'url
    si tu accède à une url privée via chrome ou une gg barre, gg aura ainsi des url à crawler, il suffit après que ton fichier robots.txt soit mal formé pour que ça autorise l'indexation
     
  14. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 804
    J'aime reçus:
    259
    le titre de la discussion est en effet erroné
    cela dit Xost, va lire les CGU de Google Drive, tu verras... il y a de quoi être perplexe
     
  15. stolz
    stolz Nouveau WRInaute
    Inscrit:
    23 Septembre 2011
    Messages:
    6
    J'aime reçus:
    0
    Bonjour,

    Je devais mettre autre chose dans le robots.txt ? J'ai juste mis ça,

    L'administration est bloquée, enfin, à ma connaissance,

    Stolz
     
  16. stolz
    stolz Nouveau WRInaute
    Inscrit:
    23 Septembre 2011
    Messages:
    6
    J'aime reçus:
    0
    C'est très bien résumé,

    Sauf que j'ai supprimé les fichiers du serveur qui héberge le site mais ils restent toujours disponibles dans le cache de google et accessibles via le reader de Google Doc.

    le problème, comment faire pour les retirer rapidement du cache ? ( je l'ai demandé via Google Webmaster mais cela tarde beaucoup )

    Et surtout, que faire pour ne plus avoir ce genre de problèmes.

    Merci beaucoup.
     
  17. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 875
    J'aime reçus:
    71
    Il faut attendre. Tu n'a aucun autre recours si toutes les demandes nécessaires ont été faites. Et pour ce qui est du futur, il serait judicieux de mettre en place une sécurisation de ce dossier, par exemple via un couple .htaccess + .htpasswd.
     
  18. stolz
    stolz Nouveau WRInaute
    Inscrit:
    23 Septembre 2011
    Messages:
    6
    J'aime reçus:
    0
    Merci :) Bien noté
     
  19. MikeR
    MikeR WRInaute passionné
    Inscrit:
    9 Janvier 2010
    Messages:
    1 416
    J'aime reçus:
    0
    Moi, j'ai renoncé à utiliser Google Drive, il y a trop d'incertitude sur l'utilisation que GG pourrait eventuellement faire du contenu stocké. .
     
  20. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 149
    J'aime reçus:
    270
    Heureusement quand même que la majorité des documents indexés sont en résultats complémentaires.
     
Chargement...
Similar Threads - documents sensibles enregistrés Forum Date
Windows 10 : disparition des documents et mise à jour Le café de WebRankInfo 7 Octobre 2018
Suivi des téléchargements documents - y compris liens externes Google Analytics 16 Septembre 2016
Lisez-vous des documents .pdf ailleurs que sur votre ordinateur de bureau ? e-commerce 12 Juillet 2016
Référencement de documents PDF Référencement Google 22 Juin 2016
Brevet Google (2015) sur la fraîcheur des documents pour requêtes d'actualité Techniques avancées de référencement 23 Novembre 2015
Google indexe t-il correctement les très gros documents ? Crawl et indexation Google, sitemaps 5 Juin 2015
Facebook examine des documents... pendant combien de temps? Facebook 20 Février 2015
Le brevet Ranking Documents de Google cherche à piéger les spammeurs Techniques avancées de référencement 21 Août 2012
Site de partage de documents d'étudiants, que faut-il améliorer? Demandes d'avis et de conseils sur vos sites 8 Février 2012
plate forme documents en consultation en ligne sur le site Développement d'un site Web ou d'une appli mobile 30 Décembre 2011
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice