Moteur de recherche sur les urls externes de twitter

Discussion dans 'Twitter' créé par pm27, 4 Octobre 2010.

  1. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
    Bonsoir,

    Nous venons de mettre en place un moteur de recherche sur les liens de twitter à titre d'exemple :
    http://wikiwix.com/index.php?lang=fr&art=true&disp=article&action=photographie
    et c'est dans le cadre :Activité récente sur le web pour photographie.

    Classement en fonction de la recense du lien et de sa pertinence.

    Tout est évidement récupérable via notre api:
    http://api.wikiwix.com/opensearch.php?action=photographie&page=1&format=rss&target=twitter/fr/

    Je suis preneur de tout retour.

    Cordialement
    Pascal
     
  2. vitalizo
    vitalizo WRInaute impliqué
    Inscrit:
    27 Novembre 2005
    Messages:
    962
    J'aime reçus:
    0
    Je comprends pas le site. Quand j'arrive sur le site et que je lis le logo, je pense à un moteur de recherche sur wikipedia.

    Vous voulez dire que tous les liens dans "Activité récente sur le web pour...." sont des liens extraits de twitter ?
     
  3. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    faudrait peut etre vous calmer en balancant le referer quand vous indexer non ? :)
     
  4. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 149
    J'aime reçus:
    271
    Il faudrait ajouter que les résultats récents sont de Twitter.
     
  5. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
    Oui tout à fait c'est plus explicite lorsqu'on clique sur la croix pour avoir les résultats en pleine fenêtre.
    Cordialement
    Pascal
     
  6. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
    Pourquoi, on indexe proprement, après le referer permet aux webmasters de savoir où il est sur le site.
    Cordialement
    Pascal
     
  7. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    Ben un bot avec un referer, ca existe ? Le bot vient d'une marchine. Il a pas à annoncer qu'il vient d'ailleurs.
     
  8. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
  9. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    Une question intéressante. On peut cracher sur france.fr quand on a touché du fric d'Oseo ? Juste une question comme ca, pour savoir.Avant c'était "ne crache pas dans la main qui te nourrit", maintenant ca serait plutôt "oublie pas de l'écraser après avoir craché dedans".
     
  10. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
    "Cracher" est un bien grand mot si tu fais allusion à http://blog.wikiwix.com/fr/2010/08/17/france-fr-la-baguette-et-le-kepi/,touché du fric est également un bien grand mot si tu fais allusion au logo.
    En effet, je trouve que le partenariat entre marmiton, et le site france.fr est un peu borderline, après ce ne sont pas des subventions que donne l'oseo, mais des avances de trésorerie en gros un crédit.
    ...
     
  11. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    ouais... enfin c un peu comme si je critiquais les sites internet de la même pépinière par exemple
     
  12. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
    France.fr et Wikiwix.com font partie de la même pépinière, vraiment je te comprends pas le site france.fr appartient à l'état, ma société non. Et même si celle - ci appartenait à l'état ce n'est pas pour autant que je ne critiquerai pas ce type de partenariat.
     
  13. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    oui donc c'est ce que je disais au début. Tu craches dans la main qui te donne à manger. Chacun fait comme il veut ceci dit.
     
  14. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
    Parce que tu estimes que c'est france.fr qui me nourrit :)
     
  15. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    j'estime juste que quand on touche des subventions, on s'écrase un minimum c'est tout. Mais comme déjà dit, tu fais comme tu veux.
     
  16. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
    Je discute pas avec une brouette je la pousse, je t'ai déjà dit que c'était pas des subventions.
     
  17. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    C'est très fin. Si si très fin. Ca fait une semaine que tu indexes mon site en passant par un referer ce qui est crade au possible, et tu me traites de brouette. Finalement tu touches du fric d'Oseo, tu craches sur france.fr, maintenant tu craches sur les sites que tu indexes. Non vraiment belle preuve de professionnalisme. Et c'est expliqué sur ton site, comment on peut bloquer le passage de votre bot ? Non parce que pas le moindre pèt de Mentions Légales sur votre site, c'est assez comique :) A ce rythme là, ils font filer du fric pour monter un skyblog :)
     
  18. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
    Tu as raison à force de cracher j'ai plus de salive.
     
  19. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    et donc vous avez pas de Mentions légales ? Faudrait peut etre demander un nouveau prêt pour développer la page :)
     
  20. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
    Tiens j'y avais pas pensé à demander un prêt pour cette page
     
  21. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    Bah sincèrement tu devrais :) A première vue ils ont plein de frics. Non mais sans déc. Vous êtes une boite. Vous avez un poil d'expérience. Vous trouvez pas que vous y gagnerez en crédibilité en inscrivant sur votre site, et pas le site de votre boite, vos mentions légales. En plus, c'est juste la loi qui vous l'impose. Et deuxio, expliquez la procédure pour éviter qu'on se fasse indexer par vos soins. Je crois que ca s'appelle l'éthique

    Surtout que tu dis dans un post :
    "D'un autre côté , des solutions techniques permettent de protéger un site de son indexation." Oui les solutions techniques se doivent d'être apportées par le moteur à la base. Sauf pour les moteurs bien pourris
     
  22. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
  23. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    mis à part les mentions légales, l'absende de procédure pour interdire votre indexation, vous vous faites indexés aussi les résultats de recherche par GG ? niveau parasitisme c'est pas mal aussi
     
  24. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 436
    J'aime reçus:
    0
    respectent-ils le robots.txt ? parce que moi, en dehors de 3-4 plus gros moteurs, j'interdis aux autres, il ne devrait donc apparaitre dans mes logs que sur l'appel de robots.txt, normalement. C'est quoi sont UA ?
     
  25. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    J'ai juste son ip. J'ai pas testé s'il respecte le robots.txt mais vu qu'il y a zéro info.
     
  26. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 436
    J'aime reçus:
    0
    c'est la même ip que celle de son serveur public ? ou au moins la même range ip ?
     
  27. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
    Hors mis des bugs, nous respectons le fichier robots.txt, UA:wikiwix-bot. Cordialement
     
  28. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    en partie. C'est 195.221.21.*** les 3 derniers changent. Pour aujourd'hui en tout cas :)
     
  29. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
    195.221.21.171
    195.221.21.172
    195.221.21.173
    195.221.21.150
    195.221.21.225
    195.221.21.227
    195.221.21.229
    195.221.21.231
    195.221.21.235

    Cordialement
     
  30. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    impressionnant :) Plus d'un mois pour répondre à la question initiale posée sur un autre thread :) On va attendre un mois aussi sur le pourquoi vous mettez en cache des pages en leur supprimant leurs pubs ?
     
  31. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    Ah zut... j'ai glissé. Je vous ai bloqué. C'est triste.
     
  32. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 436
    J'aime reçus:
    0
    gg indexe déjà les données de twitter, donc quel est l'intérêt de faire indexer par gg des données déjà indexées par gg ? à part faire du spamindex ?
     
  33. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
    Nous indexons dans http://wikiwix.com les liens de twitter, qui ne sont pas nécessairement indexé par google. Cordialement
    Pascal
     
  34. VisitezMonSite
    VisitezMonSite WRInaute impliqué
    Inscrit:
    7 Mai 2009
    Messages:
    739
    J'aime reçus:
    0
    Pourquoi virer les pubs des pages de sites externes qu'on a mis dans son cache?
    https://www.webrankinfo.com/forum/t/wiki-cache-publicite.135333/

    Notez que je n'en ai rien à faire, mais vraiment..
    Par contre je trouve que c'est un manque de respect total mais je n'y vois rien d'étonnant, on voit pire tous les jours hahaha.
     
  35. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 436
    J'aime reçus:
    0
    en même temps, "récupérer" du contenu de divers sites pour en faire son propre contenu et le faire indexer, peut-on déjà appeler ça du respect :twisted:
     
  36. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
    Vous faîtes un amalgame de tout, je veux bien répondre aux questions qui sont posés, mais choisissez au moins un thread unique que le lecteur puisse suivre et par là même occasion je pourrais suivre aussi. Parce qu'actuellement je suis sollicité à la fois sur deux threads et sur une page de discussion de Wikipedia.
    Cordialement
    Pascal
     
  37. VisitezMonSite
    VisitezMonSite WRInaute impliqué
    Inscrit:
    7 Mai 2009
    Messages:
    739
    J'aime reçus:
    0
  38. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 436
    J'aime reçus:
    0
  39. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
  40. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    1
    c'est en semaines qu'il faut compter pour que votre moteur lise le robots.txt ?
     
  41. milkiway
    milkiway WRInaute accro
    Inscrit:
    3 Février 2004
    Messages:
    4 238
    J'aime reçus:
    0
    Pardonnez moi mais j'ai du mal à comprendre l'intérêt de ce site. C'est un moteur de quoi ?
    Et puis, vos pages sont très peu lisibles !
     
  42. pm27
    pm27 Nouveau WRInaute
    Inscrit:
    16 Juillet 2008
    Messages:
    39
    J'aime reçus:
    0
    A la base c'était un moteur de recherche sur les contenus de la fondation wikimedia , la colonne de gauche affiche les résultats des projets frères de wikipedia, la partie centrale étant les résultats de wikipedia.
    En autocomplétion, il y a un moteur de recherche de site qui vous permet d'accéder rapidement à un nom de domaine.
    Et dans la partie verte, ce sont les résultats provenant des liens qui sont twittés.
    Cordialement
    Pascal
     
  43. milkiway
    milkiway WRInaute accro
    Inscrit:
    3 Février 2004
    Messages:
    4 238
    J'aime reçus:
    0
Chargement...
Similar Threads - Moteur recherche urls Forum Date
mon site internet n'apparaît plus dans les moteurs de recherche Problèmes de référencement spécifiques à vos sites 16 Juillet 2019
SERP sur les différents moteurs de recherches Demandes d'avis et de conseils sur vos sites 10 Mai 2019
Le moteur de recherche YouCare Le café de WebRankInfo 13 Avril 2019
lilo.org : méta-moteur de recherche Autres moteurs de recherche connus 9 Décembre 2018
Google a 20 ans. Comment sera le moteur de recherche d'ici 2038 ? Google : l'entreprise, les sites web, les services 25 Septembre 2018
Réseau social et Moteur de recherche Le café de WebRankInfo 21 Septembre 2018
Moteur de recherche sur Facebook Facebook 18 Août 2017
Etre présent sur les moteurs de recherche en premier Netlinking, backlinks, liens et redirections 10 Juillet 2017
Premsgo.fr Webmaster tool du moteur de recherche Français Autres moteurs de recherche connus 3 Juillet 2017
Moteur de Recherche Interne et Contenus Significatifs Débuter en référencement 8 Juin 2017
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice