Boulette : AOL publie des données privées (Oops trop tard)

Discussion dans 'Autres moteurs de recherche connus' créé par Monty973, 7 Août 2006.

  1. Monty973
    Monty973 WRInaute passionné
    Inscrit:
    21 Mars 2006
    Messages:
    1 175
    J'aime reçus:
    0
    AOL a mis à disposition les données de plus de 20 millions de requêtes. de plus de 650.000 utilisateurs.

    Elles comprennent les requêtes, les résultats cliqués, en quelle position...

    Un zip de plus de 400Mb.

    Mais il contient également beaucoup de données privées, on peut suivre toute les recherches d'un utilisateurs, et parmis elles, il y a des noms (ego search), des numéros de sécu ou des "comment assassiner votre femme", "acheter de l'ecstasy"... bref, embarassant.

    Sans parler des experts du marketing qui vont décortiquer les requêtes pour voir étudier comportement des utilisateurs...

    AOL a du se rendre compte de sa boulette, et a retiré le fichier, mais trop tard, des mirroirs ont été mis en place.

    Après les débat autour de la diffusion des données qui ont eu lieu récemment, une telle erreure est incompréhensible.

    Source Techcrunch.
    http://www.techcrunch.com/2006/08/06/aol-proudly-releases-massive-amounts-of-user-search-data/
     
  2. TOMHTML
    TOMHTML WRInaute accro
    Inscrit:
    25 Août 2004
    Messages:
    2 524
    J'aime reçus:
    0
    j'ai le fichier >> 2.2 GO de données !

    bon, tous les utilisateurs d'AOL sont remplacés par des "anonymous ID" mais bon
    je peux savoir qu'une même personne a tapé "pregnancy test" avant de rechercher "card I'm pregnant !"...


    ps : c'est bien y'a les sites qui ont été visités suite aux clics, j'apparais plein de fois :D Zorgloob aussi :D
    bon par contre j'arrive pas à mettre ça dans une base mysql...
     
  3. Albert1
    Albert1 WRInaute impliqué
    Inscrit:
    23 Août 2005
    Messages:
    775
    J'aime reçus:
    0
    Je vais essayer de le choper ça ...
    ça va bien me faire marrer je crois :lol:
     
  4. TOMHTML
    TOMHTML WRInaute accro
    Inscrit:
    25 Août 2004
    Messages:
    2 524
    J'aime reçus:
    0
    attention : ne pas l'ouvrir avec le bloc note de windows > ça l'explose....
     
  5. Monty973
    Monty973 WRInaute passionné
    Inscrit:
    21 Mars 2006
    Messages:
    1 175
    J'aime reçus:
    0
    Je peux pas le télécharger, je suis en 56k. :(

    TOMHTML, tu voudrais pas mettre ça dans une base, une fonction de recherche et l'uploader quelque part ?

    Ca ferais un carton. :D
     
  6. Albert1
    Albert1 WRInaute impliqué
    Inscrit:
    23 Août 2005
    Messages:
    775
    J'aime reçus:
    0
    m'étonne même pas :lol:

    <anecdote>
    j'ai souvenir d'une fois où j'avais essayé d'ouvrir une BDD d'un forum de taille moyenne avec cette daube ...

    sinon, j'ai remplacé mon notepad Win par notepad2, même la calculatrice n'est plus celle d'origine ...
    </anecdote>


    Par contre, les débits, c'est pas trop çà, je suis rarement au maximum de ma connexion, donc soit le serveur que j'ai choisi est pourrave, soit y a du succès et ça limite la Bande Passante ; mais ça reste "correct", faut juste pas être trop pressé.

    Je le mettrai peut être en download sur le réseau Gnutella après l'avoir reçu.
     
  7. scores
    scores WRInaute occasionnel
    Inscrit:
    24 Novembre 2002
    Messages:
    442
    J'aime reçus:
    0
    Ca me fait halluciner !!
    c'est pas une boulette d'Aol, mais une avalanche d'AOL !
     
  8. pounk
    pounk WRInaute impliqué
    Inscrit:
    21 Février 2004
    Messages:
    631
    J'aime reçus:
    0
    faut l'ouvrir avec quoi ?
     
  9. Albert1
    Albert1 WRInaute impliqué
    Inscrit:
    23 Août 2005
    Messages:
    775
    J'aime reçus:
    0
    avec un Éditeur de texte mais pas notepad ;)
     
  10. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    suis à 67% lol meme pas sur que je puisse le dézippet vu la faible taille de mon dd :)
     
  11. TOMHTML
    TOMHTML WRInaute accro
    Inscrit:
    25 Août 2004
    Messages:
    2 524
    J'aime reçus:
    0
    vous pouvez ouvrir les fichiers avec WordPad, ça passe
    par contre la base de données...
    MySql > passe pas (même en virant la limite de tailles des fichiers à importer, c'est encore trop grand)
    Excel > une feuille ne peut contenir que 65536 lignes... beaucoup beaucoup moins que le nombre de données dans les fichiers texte...


    edit : sous linux ouvrez avec Vi
     
  12. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    en découpant par tranche de 10 lignes... doit pas y en avoir bcp sur un fichier de 2 Go lol
     
  13. Albert1
    Albert1 WRInaute impliqué
    Inscrit:
    23 Août 2005
    Messages:
    775
    J'aime reçus:
    0
    t'as commencé quand ?
     
  14. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    euh y'a un moment... toutes les 2 mns le pc dit qu'il y a pas assez place lol

    Edit : suis à 80% ... ca passe à 64 kos/s
     
  15. Albert1
    Albert1 WRInaute impliqué
    Inscrit:
    23 Août 2005
    Messages:
    775
    J'aime reçus:
    0
    chez moi ça fluctue entre +de 70 et moins de 30 ...
    c'est pénible :?
     
  16. Monty973
    Monty973 WRInaute passionné
    Inscrit:
    21 Mars 2006
    Messages:
    1 175
    J'aime reçus:
    0
    Pour les autres qui seraient intéréssés plusieurs mirroirs ici:

    -http://www.gregsadetsky.com/aol-data/
     
  17. keroin
    keroin WRInaute passionné
    Inscrit:
    29 Avril 2006
    Messages:
    1 517
    J'aime reçus:
    0
    Très cool ça Monty c'est justement ce que j'allais demander ^^
    Sur l'un des mirroirs, je suis à 400 ko/s stable donc ça devrait aller vite :wink:
     
  18. pounk
    pounk WRInaute impliqué
    Inscrit:
    21 Février 2004
    Messages:
    631
    J'aime reçus:
    0
    pfiou j'suis déçu je n'ai retrouvé mon site que deux fois
     
  19. ortolojf
    ortolojf WRInaute accro
    Inscrit:
    14 Août 2002
    Messages:
    2 789
    J'aime reçus:
    8
    Bonjour
    Pour décomprsser un fichier *.tgz , on peut utiliser gunzip <fichier.tgz> , ce qui donne un fichier type *.tar , mais ensuite, avec la commande tar sous Linux, quels sont les paramètres qu'il faut mettre ?

    J'avais l'habitude de faire:

    tar -xvf fichier.tar

    C'est bon ou c'est pas bon ?

    Merci beaucoup de vos réponses.

    Jean-François Ortolo
     
  20. Monty973
    Monty973 WRInaute passionné
    Inscrit:
    21 Mars 2006
    Messages:
    1 175
    J'aime reçus:
    0
    Pour ceux qui auraient des problèmes avec leur éditeurs de texte pour les gros fichiers, il y a ça:

    -http://www.swiftgear.com/ltfviewer/features.html

    spécialement conçu pour les gros fichiers > 1Gb

    Je n'ai pas testé mais en ai eu de bons échos.
     
  21. Serious
    Serious WRInaute passionné
    Inscrit:
    21 Novembre 2005
    Messages:
    1 843
    J'aime reçus:
    0
    Le top* des requetes sur AOL.
    Ca laisse songeur...

    369867 -
    47921 google
    43598 ebay
    28658 internet
    26408 yahoo.com
    23440 mapquest
    20158 http
    19976 google.com
    17729 myspace.com
    16533 yahoo
    12968 .com
    12719 weather
    12569 www.yahoo.com
    12419 ebay.com
    11442 www.google.com
    10152 map quest
    9270 american idol
    9088 myspace
    8378 m
    7630 www.google
    7300 mycl.cravelyrics.com
    7015 com
    6982 www.myspace.com
    6656 www.
    6324 travelocity
    5764 im help
    5705 www
    5561 om
    5348 home depot
    5302 www.ebay.com
    5280 dictionary
    5234 g
    5129 pogo
    5114 my
    5062 hotmail.com
    5033 sears
    4838 porn
    4683 white pages
    4577 orbitz
    4552 mailbox

    * uniq|sort|uniq -c
     
  22. ortolojf
    ortolojf WRInaute accro
    Inscrit:
    14 Août 2002
    Messages:
    2 789
    J'aime reçus:
    8
    La honte...

    Effectivement, ce sont les bons paramètres, je m'en suis souvenu juste au moment où j'ai rempli ce message.

    J'ai testé, j'ai maintenant les dix fichiers de AOL décompressés, mais... Il me semble que ce ne sont que les clients de langue anglophone ? Je peux me tromper...

    Bien à vous.

    Jean-François Ortolo
     
  23. Grantome
    Grantome WRInaute passionné
    Inscrit:
    16 Janvier 2004
    Messages:
    2 253
    J'aime reçus:
    0
    C'est pas ton site qu'il faut chercher, mais celui de tes concurrent afin de trouver pourquoi eux ils sortent et pas toi. :wink:
     
  24. TOMHTML
    TOMHTML WRInaute accro
    Inscrit:
    25 Août 2004
    Messages:
    2 524
    J'aime reçus:
    0
    je cherche la même commande sous DOS
    si quelqu'un a...
     
  25. Serious
    Serious WRInaute passionné
    Inscrit:
    21 Novembre 2005
    Messages:
    1 843
    J'aime reçus:
    0
    Oui mais tu peux aussi decompressr en meme temps.
    tar xvzf fichier.tgz
    A noter que l'archive contient des fichiers compresses .gz que tu peux lire avec zcat ou decompresser avec ungzip (ou gzip -d)
     
  26. TOMHTML
    TOMHTML WRInaute accro
    Inscrit:
    25 Août 2004
    Messages:
    2 524
    J'aime reçus:
    0
    Un de mes potes est en train de mettre ça sur une base MySQL... c'est long mais ça marche :)

    ps : pour MS-DOS j'ai trouvé cette commande qui marche
    Code:
    find /i "mot recherché" *.txt
    je pensais que ça marchais que sous linux ça :)
    mais bon ça reste deux de tension qd même
     
  27. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    ben le truc que j'ai dl est composé de 10 fichiers de 212 Mo donc c facile à ouvrir avec Word :)

    j'ai cherché juste sur un fichier, j'ai pas trouvé mon site ouinnnnn
     
  28. TOMHTML
    TOMHTML WRInaute accro
    Inscrit:
    25 Août 2004
    Messages:
    2 524
    J'aime reçus:
    0
    Une petite recherche sur WebRankInfo...

    déjà rien que le premier fichier (le reste viendra après manger :D )
    (liste supprimée par WRI : merci de ne pas publier des extraits des données d'AOL sur ce forum)
     
  29. pounk
    pounk WRInaute impliqué
    Inscrit:
    21 Février 2004
    Messages:
    631
    J'aime reçus:
    0
    ils ne sortent pas plus que moi, certainement parcequ'il s'agit d'aol.com et non d'aol.fr
     
  30. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 807
    J'aime reçus:
    259
    si c'est d'aol.com qu'il s'agit, ça veut dire que ce sont les mêmes données (de ranking) que Google.com, non ?
     
  31. Monty973
    Monty973 WRInaute passionné
    Inscrit:
    21 Mars 2006
    Messages:
    1 175
    J'aime reçus:
    0
    Exact. C'est pour ça qu'après l'épisode "Google refuse de communiquer ses données à la justice", la boulette est de taille.

    D'ailleurs s'explique et s'excuse

    Les données regroupent environ 1/3 des recherches effectuées aux US avec le client AOL sur une période de 3 mois.
     
  32. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 807
    J'aime reçus:
    259
    ça n'a pas trainé : -http://www.aolsearchdatabase.com/
    un nom de domaine et des adsense agrémentent la base de données consultable en entier, y compris les user_id (il aurait dû les virer)
     
  33. HawkEye
    HawkEye WRInaute accro
    Inscrit:
    23 Février 2004
    Messages:
    13 934
    J'aime reçus:
    4
    Rha, il a réussi à fourrer les 2.2Go... Moi je magouille toujours pour uploader tout ça dans ma base... :D
     
  34. scores
    scores WRInaute occasionnel
    Inscrit:
    24 Novembre 2002
    Messages:
    442
    J'aime reçus:
    0
    Y'aurait-t'il d'après vous un rapport entre :
    - la fuite de ce fichier de 2,2 Go
    et
    - le licenciement de 5000 employés annoncés chez AOL ?

    -http://www.lexpansion.com/art/32.0.145827.0.html

    Un futur licencié qui se venge ?
     
  35. Serious
    Serious WRInaute passionné
    Inscrit:
    21 Novembre 2005
    Messages:
    1 843
    J'aime reçus:
    0
    Non. Il ne s'agit pas d'une fuite mais d'une mise a disposition officielle. Par une equipe de plusieurs personnes (nommees), avec des conditions d'utilisation, ... (et c'est aussi pour ca que ca a pris une telle ampleur)
    Par ailleurs, ce fichier et ces personnes relevent de l'activite portail que justement AOL souhaite developper et ne sont pas concernes (directement) par les licenciements.
     
  36. Zim'
    Zim' WRInaute impliqué
    Inscrit:
    27 Avril 2006
    Messages:
    599
    J'aime reçus:
    0
    j'avais cru que AOL n'utilisais plus google mais exalead... enfin je dis ça je dis rien
     
  37. Albert1
    Albert1 WRInaute impliqué
    Inscrit:
    23 Août 2005
    Messages:
    775
    J'aime reçus:
    0
    A0L.fr utilise ex4le4d ;)
     
  38. Zim'
    Zim' WRInaute impliqué
    Inscrit:
    27 Avril 2006
    Messages:
    599
    J'aime reçus:
    0
    ok j'ai donc pas totalement révé, j'avais juste mal compris, en meme temps logique
     
  39. phloam
    phloam WRInaute passionné
    Inscrit:
    8 Avril 2005
    Messages:
    1 127
    J'aime reçus:
    0
    Ca me rappelles le jour ou j'avais trouver un fichier libre d'acces sur dir*ct-st*ts avec tous les noms d'utilisateurs , mots de passe , et e-mail, des comptes utilisateurs sur dir*ct-st*ts...
    Ca s'etait une vrai boulette...
     
  40. Mumuri
    Mumuri WRInaute passionné
    Inscrit:
    3 Novembre 2004
    Messages:
    1 417
    J'aime reçus:
    0
    tenais pour ceux qui veulent
    -http://www.aolsearchdatabase.com/
    -http://www.askthebrain.com/aol/
    -http://www.dontdelete.com/

    y'en a qui ont mis les fichiers dans une belle base de donnée

    EDIT : en voila d'autre alors audrey :)
     
  41. dd32
    dd32 WRInaute accro
    Inscrit:
    9 Septembre 2005
    Messages:
    2 733
    J'aime reçus:
    0
  42. mr_go
    mr_go WRInaute passionné
    Inscrit:
    21 Septembre 2005
    Messages:
    1 695
    J'aime reçus:
    1
    Personne n'a fait de statistiques croustillantes encore ?

    ^^
     
  43. dd32
    dd32 WRInaute accro
    Inscrit:
    9 Septembre 2005
    Messages:
    2 733
    J'aime reçus:
    0
  44. mr_go
    mr_go WRInaute passionné
    Inscrit:
    21 Septembre 2005
    Messages:
    1 695
    J'aime reçus:
    1
    Merci, mais je suis intervenu dans le topic... ^^

    Je me demandais si certains avaient fait d'autres stats succeptibles d'interrresser la communauté...
     
  45. Artefact2
    Artefact2 WRInaute discret
    Inscrit:
    23 Juillet 2006
    Messages:
    89
    J'aime reçus:
    0
    Le lien ?

    En 24 Méga ca devrait aller :)
     
  46. ybet
    ybet WRInaute accro
    Inscrit:
    22 Novembre 2003
    Messages:
    7 519
    J'aime reçus:
    0
  47. 2dm
    2dm WRInaute discret
    Inscrit:
    3 Septembre 2002
    Messages:
    173
    J'aime reçus:
    0
    merci pour les liens. Quelqu'un a déja commencé à faire une étude détaillée sur les requêtes réelles ? (et ainsi comparer les estimations de traffic via adsense avec les résultats réel chez aol)
     
  48. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 807
    J'aime reçus:
    259
  49. Monica2006
    Monica2006 Nouveau WRInaute
    Inscrit:
    2 Avril 2006
    Messages:
    32
    J'aime reçus:
    0
    Tout ce que Google touche se transforme en X#N!...Traduction Tout ce que Google touche se transforme en catastrophe.

    Google signe le deal avec Aol, Aol met plus de 650 000 donnees prives en ligne.

    Google signe un deal avec Dell, la batterie de plus de 4 Millions d'ordinateurs explose.

    Y'aurait pas comme un effet de poisse chez Google ??
     
  50. scores
    scores WRInaute occasionnel
    Inscrit:
    24 Novembre 2002
    Messages:
    442
    J'aime reçus:
    0
    Des têtes sont belles et biens tombées !
    -http://www.vnunet.fr/fr/vnunet/news/2006/08/23/fuites-chez-aol-t-tomber
     
Chargement...
Similar Threads - Boulette AOL publie Forum Date
Désindexation d'un site par erreur. la boulette ! Crawl et indexation Google, sitemaps 12 Septembre 2014
4000 liens d'un forum vers mon site : la boulette? Débuter en référencement 2 Septembre 2014
Enorme boulette avec un fichier robot.txt..Votre avis SVP ! Crawl et indexation Google, sitemaps 12 Juillet 2011
Racontez vos pires boulettes SEO Le café de WebRankInfo 22 Octobre 2010
Microsoft Accord publicitaire entre AOL, Yahoo! et Microsoft Le café de WebRankInfo 15 Septembre 2011
Google Panda déjà actif sur AOL ? Référencement Google 21 Avril 2011
AOL rachète TechCrunch Autres moteurs de recherche connus 28 Septembre 2010
Contrat renouvelé entre AOL et Google Google : l'entreprise, les sites web, les services 2 Septembre 2010
Google: le chef des ventes US prend la tête d'AOL Google : l'entreprise, les sites web, les services 13 Mars 2009
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice