Transcript du chat interview d'Exalead sur WebRankInfo
Par Olivier Duffez, jeudi 16 février 2006
Le chat organisé hier soir à 18h a rencontré un vif succès : environ 50 personnes étaient connectées pour suivre et participer à l'interview de Sébastien Richard, ingénieur chez Exalead.
Voici le compte-rendu :
Interviewer : bonsoir ExaleadGuy 
ExaleadGuy : bonsoir à tous
Interviewer : Pouvez-vous présenter, vous et le moteur de recherche Exalead
ExaleadGuy : Tout d'abord je vais présenter la société Exalead et comment elle a été fondée. L'idée est venue à la base à francois Bourdoncle et Patrice Bertin en 1998. à l'epoque ils travaillaient pour Altavista et celui-ci se transformant en portail ne correspondait plus à leur vision de chercheur. Ils ont continué à travailler pour Altavista mais depuis la France dans un labo des Mines de Paris avec déjà l'idée de potentiellement de developper une entreprise sur le sujet. Donc dès le départ les couches profondes d'Exalead ont ete développées dans une optique web. En 2000 la société a été créée. Jusqu'en 2004, on avait essentiellement une vitrine technologique comme moteur de recherche centrée sur le web francophone. En 2004 nous avons décidé de passer à la vitesse superieure et de faire un moteur mondial. Tous les produits Exalead reposent sur la meme techno. Juste leur enrobage et leur tuning diffèrent. Les autres produits d'exalead pour rappel sont un moteur de recherche sur pc one:desktop, un moteur de recherche en entreprise one:enterprise et un moteur pour groupe de travail one:workgroup. En ce qui me concerne, je travaille a Exalead depuis 5 ans et je suis le responsable de projet technique de tout ce qui concerne l'aspect Web de notre moteur.
Interviewer : Que pensez vous avoir de plus à proposer que google, yahoo ou encore msn pour pouvoir reussir à conquerir le marché francais des moteurs de recherches ?
ExaleadGuy : Par rapport à ces moteurs de recherche nous nous différencions dans le sens où nous voulons proposer une nouvelle methode de recherche. Ne plus se baser sur du essai erreur, reecriture, visionage des pages suivantes jusqu'a plus soif. Notre moteur permet de survoler les resultats et a travers les categories de zoomer dans des details ou de rebondir sur d'autres concepts. Tout cela s'applique aux resultats du monde entier car la plupart de nos technologies sont plus statistiques que linguistiques et marchent dans d'autres langues. j'invite d'ailleurs ceux qui parlent chinois a tester notre interface chinoise Smile La France est notre marché de départ et nous allons donc consacrer plus d'efforts que sur les marchés au départ en tous cas.
Interviewer : Pouvez vous nous expliquer brievement l'algorithme de pertinence du moteur, et les facteurs les plus importants permettant d'etre correctement placé ?
ExaleadGuy : les facteurs sont globalement les memes que dans les autres moteurs et je ne peux que vous faire les meme recommandations que les autres moteurs : faites des pages avec du contenu proposer une version identique aux internautes et au moteur.
ie eviter les pages satellites, les fermes de liens...
et devenez la reference dans votre domaine et vous monterez dans les resultats exalead 
Interviewer : On peut constater que la catégorie d'un site indexé dans dmoz est affichée dans les recherches. Quelles sont vos relations avec dmoz ? et quel est le poids donné aux sites y figurant par rapport aux autres ?
ExaleadGuy : nous utilisons principalement dmoz pour sa taxonomie. nous n'avons pas de lien particulier avec cette "association". etre dans dmoz est un plus mais un tres petit plus. nous sommes conscients que bp d'entre vous etes en desaccord avec certains choix de ces editeurs. (la taxonomie c'est l'arborescence des categories)
Interviewer : Pouvez vous nous parler de vos projets à venir ?
ExaleadGuy : parmi les projets à court terme nous avons une refonte de notre interface. l'interface actuelle est trop segmentante: des gens qui adorent et des gens qui detestent. nous prevoyons de faire une interface plus legere avec les memes options mais plus discretes afin de remettre les resultats au centre. un moteur de recherche d'image est egalement prevu. ces deux projets devraient etre en ligne en mai au plus tard.
dans le plus long terme le passage à 8 md de pages. et de nombreux autres projets dans le cadre de quaero en partenariat avec les autres societes impliquées dans les domaines plus multimedia.
illi : Lorsque l'on fait des recherches, on constate que la description de la page correspond plus à son contenu qu'à la balise de description, est-elle est prise en compte ?
ExaleadGuy : les balises meta ont ete trop souvent spammées par le passé et leur prise en compte est tres faible nous voulons donner. une version qui est la plus proche de ce que les internautes trouveront en allant sur le site. Dans la meme optique il y a le thumbnail et la preview.
Julien_ev : Que pensez-vous des balises META (standard comme keywords, ou exotiques commes DC.)
ExaleadGuy : meme reponse que ci dessus le mecanisme part d'une bonne idee mais est trop facilement spammable pour etre vraiment pris au serieux par un moteur
Packref : Quelle est le temps de mise à jour des page sur Exalead, n'avez vous pas peur d'être trop lent (comme voila) à prendre en compte les changement ?
ExaleadGuy : la frequence de mise a jour des pages depend de nombreux facteurs. toutes les pages ne sont pas rafraichies de la meme facon et nous avons developpés des algorithmes qui zooment sur les contenus qui ont des chances d'avoir changé. Jusqu'a present nous etions dans une logique de montée en puissance donc notre vitesse de rafraichissement etait encore modérée. mais là nous allons a nouveau nous reconsacrer sur la mise à jour des pages deja vues. et nous avons les moyens de rivaliser avec les grands moteurs je pense.
hollenfurst : Envisagez vous de mettre en place un system de sitemap ?
ExaleadGuy : c'est a l'etude, nous attendons en partie les retours vis à vis de celui de google. voir si le format choisi n'est pas trop spamable au sens où tous les webmasters mettent "je veux que mon site soit rafraichi toutes les 10s".
oli004 : l'intégration d'une régie publicitaire, phenomène en vogue sur les différents moteurs est-elle envisageable et envisagée sur exalead ?
ExaleadGuy : nous comptons integrer des liens sponsorisés à court terme mais pas de regie publicitaire en interne au moins au depart
Bill- : Quel est votre politique concernant le duplicate content ?
ExaleadGuy : nous essayons de les detecter et de n'afficher qu'une version
oli004 : Dans soucis de pertinence des résultats donnés par exalead, un système de pénalité visant par exemple à déclasser volontairement un site voir le blacklister est-il adopté ?
ExaleadGuy : nous avons des mecanismes qui essayent de detecter les sites qui essayent d'usurper un ranking. dans ces cas nous ne blacklistons pas (nous trouvons cette methode un peu trop brutale meme si nos amis d'outre atlantique ne partagent pas ce point de vue) nous preferons deranker les sites en question en general
Julien_ev : comment différenciez-vous un annuaire d'une ferme de liens ?
ExaleadGuy : nous avons des algos proprietaires pour cela 
ronan : Quel est le comportement de votre robot face aux différentes redirections ( ex redirection 301 )
ExaleadGuy : oui la question a deja ete evoqué sur le forum actuellement nous affichons la "meilleure" version contrairement à nos concurrents qui priviligient toujours la destination. je pense que pour ne pas decontenancer les webmasteurs. nous allons migrer vers la solution de nos concurrents
Julien_ev : Quelle politique face au contenu caché ? (attributs hidden) qui peuvent etre des liens cachés OU des menu dynamiques
ExaleadGuy : nous essayons au maximum de nos capacités d'indexer uniquement le texte qui est visible par l'internaute sur la page.
Pada : Comment aider Exalead à devenir moins "confidentiel" ? (Et est ce un des objectifs premiers pour vous de se retrouver parmi les moteurs les plus connus ?)
ExaleadGuy : vous pouvez parler d'exalead a votre entourage les inciter a l'utiliser ou a postuler pour nos offres d'emplois
oui c'est un de nos objectifs d'etre connus.
mais pour le moment nous visons plus une approche bouche a oreille et presse avant la campagne publicitaire.
Je ne pense pas que malgre son matracage publicitaire msn ait recupere bp d'internautes.
kazhar : D'ou vient le nom "Exalead" ?
ExaleadGuy : Exa veut dire 10 puissance 18 (clin d'oeil a google qui veut 10 puissance 100) nous sommes plus realistes Smile et lead veut dire guider : nous guidons les utilisateurs vers les bons resultats.
illi : Tenez vous compte du fait que les sites soient valides ou non aux normes W3C ?
ExaleadGuy : ne pas etre valide presente le risque de ne pas etre interpreté correctement par nos robots mais pas de bonus ou de malus specifique.
oli004 : Existe-t-il sur exalead des commandes spécifiques permettant de voir l'évolution de nos sites web telle que la commande "site:" par exemple
ExaleadGuy : oui site: bien sur et link: qui contrairement a google ne restraind pas la liste des resultats. en cas de caracteres bizarre privilegez les guillemets : site:"exalead.com".
Julien04 : A quoi sert le lien "ajouter mon site" ? par rapport à un simple passage du moteur (grace a des liens), une inscription manuelle apporte quoi ?
ExaleadGuy : rien de plus ca accelere juste la procedure
Julien_ev : Est il prévu une API exalead ?
ExaleadGuy : nous y reflechissons mais il nous reste a determiner les limites payant/gratuit
illi : Existe-t-il un phénomène de SandBox ou de mise à l'épreuve sur Exalead ?
ExaleadGuy : pas vraiment mais c'est toujours dur pour un nouveau site d'occuper les premieres places a cause de l'inertie naturelle du web.
kazhar : Quelle est la meilleure méthode à utiliser pour symboliser un espacer dans l'url ? un - un _ un + ?
ExaleadGuy : de notre point de vue c'est identique.
xun : Selon vous, quel est le pourcentage d'utilisation de Exalead par rapport aux autres moteurs de recherches ?
ExaleadGuy : nous sommes encore un outsider mais notre traffic a fortement progressé ces derniers mois et je pense que la courbe devrait continuer a monter donc nous devrions bientot apparaitre dans les barometres mais actuellement nos clics sont fait a travers du javscript et sont mal comptés
oli004 : Concretement, exalead en quelques chiffres, c'est quoi ? (combien de serveur, de pages référencées, etc.)
ExaleadGuy : 50 serveurs et 4 Milliard de pages web
illi : Les liens internes ont ils le même poids que les liens externes ou faites-vous une différence entre les deux ?
ExaleadGuy : chaque lien est traité separement et nous avons des algos qui les gerent de la facon la plus appropriée
ronan : Tenez vous compte de la localisation des serveurs , des domaines ( .fr .com) dans le classement ?
ExaleadGuy : peu dans la mesure ou ces infos ne sont pas toujours fiables
ronan : Ou sont situés vos serveurs ?
ExaleadGuy : a courbevoie dans un grand data center.
kazhar : Coment procédez vous pour les captures d'écran ? à quelle fréquence sont-elles réactualisées ?
ExaleadGuy : la encore la frequence depend des pages et nous essayons de rafraichir celles qui changent et qui sont souvent vues pour les construire, nous utilisons des machines qui jouent le role de browsers
mate : pouvez-vous nous donner des infos sur le projet européen de moteur de recherche
ExaleadGuy : pour le moment on est encore dans les phases de reunion et de concertation entre les differents acteurs, donc je n'ai pas bp d'infos concretes et je ne suis pas la personne qui gere ce projet a exalead.
ronan : Bonjour , cherchez vous des testeurs ? si oui comment vous contacter ? quel travail attendez vous d'eux ?
ExaleadGuy : nous cherchons surtout des employés pour le moment nous n'avons pas encore mis en place de procedure de recrutement de testeurs de resultats. mais vous pouvez nous remonter ce qui vous apparait bizarre:)
Si vous avez des questions à propos d'Exalead suite à cette interview, posez-les dans le forum Exalead, ExaleadGuy viendra vous répondre !
Voir aussi ce résumé.
Un grand merci à l'équipe de modération du chat WRI pour cette organisation. Si vous avez des idées d'autres chats à organiser, utilisez le forum consacré au chat WebRankInfo.


Ajoutez ce blog à vos favoris Technorati !




Commentaires
1. Le jeudi 16 février 2006 à 22:52, par Yazerty
Ajouter un commentaire
Les commentaires pour ce billet sont fermés.
A lire aussi dans l'actualité WebRankInfo
WebRankInfo et principalement les modérateurs du chat organisent une interview d'un ingénieur d'Exalead le mercredi 15 février 2006 à partir de 18h.
AgoraVox publie une interview du fondateur d'Exalead, François Bourdoncle : l'occasion de faire une nouvelle présentation d'Exalead et de parler des projets.
Surfant sur la mode outre-atlantique de l'iPhone et de l'iPod Touch, Exalead vient de mettre en ligne une interface dédiée à ces appareils mobiles.
Exalead fait parler de lui en ce moment... Voici comment analyser le positionnement de son site dans ce moteur de recherche.
Exalead est un moteur de recherche français qui existe depuis plusieurs années mais qui fait de plus en plus parler de lui. Il était donc temps de créer un forum consacré à ce moteur, d'autant plus que les ingénieurs d'Exalead sont membres de WebRankInfo et viennent répondre aux questions !
Après les fichiers Sitemaps Vidéo de Google, c'est au tour d'Exalead de s'y mettre. Le moteur français a choisi le format Media RSS (mRSS) déjà adopté par Yahoo. Explications...
Fred Cavazza sera l'invité du chat sur WebRankInfo mercredi 21 mars 2007 pour une soirée interview à partir de 20h. Réservez la date !
A lire dans le forum WebRankInfo