<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Commentaires sur : Comment faire ignorer des zones de page pour Yahoo (robots-nocontent)</title>
	<atom:link href="http://www.webrankinfo.com/actualites/200705-robots-nocontent.htm/feed" rel="self" type="application/rss+xml" />
	<link>http://www.webrankinfo.com/dossiers/yahoo/robots-nocontent</link>
	<description>Articles en tous genres sur le référencement, écrits par Olivier Duffez ou d'autres membres de WebRankInfo</description>
	<lastBuildDate>Fri, 11 Dec 2009 14:54:56 +0100</lastBuildDate>
	<generator>http://wordpress.org/?v=abc</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>Par : jfl</title>
		<link>http://www.webrankinfo.com/dossiers/yahoo/robots-nocontent#comment-1223</link>
		<dc:creator>jfl</dc:creator>
		<pubDate>Tue, 15 May 2007 22:23:53 +0000</pubDate>
		<guid isPermaLink="false">http://www.webrankinfo.com/dossiers/debutants/robots-nocontent#comment-1223</guid>
		<description>&lt;p&gt;Pour repondre, en vrac.&lt;br /&gt; &lt;br /&gt; Javascript :&lt;br /&gt; N&#039;oublions pas que le moteur de recherche collecte le source d&#039;une page...Pour lui , javascript est un contenu comme un autre, sauf que c&#039;est une exception de parsing, un peu comme un &lt;style&gt;&lt;/style&gt;&lt;br /&gt; &lt;br /&gt; message de Nico :&lt;br /&gt; Je ne peux que m&#039;inscrire en faux ave Nico. Porrquoi..je vais vous le dire ;-) [allusion presidentielle]&lt;br /&gt;  - Ce qui fait le ranking...c&#039;est la redondance d&#039;un contenu (header, footer...text, mot clef, etc) sur 1 page et globalement sur un site.&lt;br /&gt;  - Ce qui fait le bruit (inter-page) c&#039;est cette même redondance de contenu (plus le mot est présent moins il semble pertinent).&lt;br /&gt;  - Le ranking : pertinence du doc 1 versu doc 2, c&#039;est globalement qque chose entre trop de bruit et pas assez de présence...&lt;br /&gt; &lt;br /&gt; Donc : Ce que cherche Yahoo, c&#039;est tout simplement isoler le sens précis d&#039;un document, en supprimant son encapsulage.  Pour info, chez Verticrawl, nous utilisons la balise &quot;&lt;noindex&gt;n&#039;indexe pas cette partie stp&lt;/noindex&gt;&quot; depuis 1999...&lt;br /&gt; &lt;br /&gt; Car : Si vous consulter un source hors html (full-text), c&#039;est ni plus, ni moins qu&#039;une suite de mots ..Comment retrouver le coeur d&#039;un document, comment enlever ce qui est du bruit ??? Doit-on consider la taille de la police (genre &lt;h1&gt;) ? chaque moteur a sa recette...&lt;br /&gt; &lt;br /&gt; Pour info,  Gooqle avait lancé, en 1999 (de mémoire), un projet de recherche sur l&#039;extraction du sens d&#039;un document, inter-page. En clair, comment se servir d&#039;un document pour enlever l&#039;habillage et extraire le coeur du sens ? La dotation de recherche etait de (mémoire encore) 50.00 USD...&lt;br /&gt; &lt;br /&gt; Interpretation de JS :&lt;br /&gt; Le javascript est un language de programmation client web...pas du texte.. C&#039;est comme si vous demandiez à LPage d&#039;indexer les sources de Windows ? Quel interet ? (si ce n&#039;est de savoir que votre doc contient &quot;document.write(&#039;...&quot; ?&lt;br /&gt; &lt;/p&gt;</description>
		<content:encoded><![CDATA[<p>Pour repondre, en vrac.</p>
<p> Javascript :<br />
 N&#8217;oublions pas que le moteur de recherche collecte le source d&#8217;une page&#8230;Pour lui , javascript est un contenu comme un autre, sauf que c&#8217;est une exception de parsing, un peu comme un &lt;style&gt;&lt;/style&gt;</p>
<p> message de Nico :<br />
 Je ne peux que m&#8217;inscrire en faux ave Nico. Porrquoi..je vais vous le dire ;-) [allusion presidentielle]<br />
  &#8211; Ce qui fait le ranking&#8230;c&#8217;est la redondance d&#8217;un contenu (header, footer&#8230;text, mot clef, etc) sur 1 page et globalement sur un site.<br />
  &#8211; Ce qui fait le bruit (inter-page) c&#8217;est cette même redondance de contenu (plus le mot est présent moins il semble pertinent).<br />
  &#8211; Le ranking : pertinence du doc 1 versu doc 2, c&#8217;est globalement qque chose entre trop de bruit et pas assez de présence&#8230;</p>
<p> Donc : Ce que cherche Yahoo, c&#8217;est tout simplement isoler le sens précis d&#8217;un document, en supprimant son encapsulage.  Pour info, chez Verticrawl, nous utilisons la balise &quot;&lt;noindex&gt;n&#8217;indexe pas cette partie stp&lt;/noindex&gt;&quot; depuis 1999&#8230;</p>
<p> Car : Si vous consulter un source hors html (full-text), c&#8217;est ni plus, ni moins qu&#8217;une suite de mots ..Comment retrouver le coeur d&#8217;un document, comment enlever ce qui est du bruit ??? Doit-on consider la taille de la police (genre &lt;h1&gt;) ? chaque moteur a sa recette&#8230;</p>
<p> Pour info,  Gooqle avait lancé, en 1999 (de mémoire), un projet de recherche sur l&#8217;extraction du sens d&#8217;un document, inter-page. En clair, comment se servir d&#8217;un document pour enlever l&#8217;habillage et extraire le coeur du sens ? La dotation de recherche etait de (mémoire encore) 50.00 USD&#8230;</p>
<p> Interpretation de <acronym title="JavaScript">JS</acronym> :<br />
 Le javascript est un language de programmation client web&#8230;pas du texte.. C&#8217;est comme si vous demandiez à LPage d&#8217;indexer les sources de Windows ? Quel interet ? (si ce n&#8217;est de savoir que votre doc contient &quot;document.write(&#8217;&#8230;&quot; ?
 </p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Thomas</title>
		<link>http://www.webrankinfo.com/dossiers/yahoo/robots-nocontent#comment-1232</link>
		<dc:creator>Thomas</dc:creator>
		<pubDate>Wed, 09 May 2007 10:21:16 +0000</pubDate>
		<guid isPermaLink="false">http://www.webrankinfo.com/dossiers/debutants/robots-nocontent#comment-1232</guid>
		<description>&lt;p&gt;En tous cas cela en fait un outil &quot;officiel&quot; de masquage de contenu, ce qui est bienvenu &lt;/p&gt;</description>
		<content:encoded><![CDATA[<p>En tous cas cela en fait un outil &quot;officiel&quot; de masquage de contenu, ce qui est bienvenu </p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Rêveur</title>
		<link>http://www.webrankinfo.com/dossiers/yahoo/robots-nocontent#comment-1229</link>
		<dc:creator>Rêveur</dc:creator>
		<pubDate>Tue, 08 May 2007 19:33:10 +0000</pubDate>
		<guid isPermaLink="false">http://www.webrankinfo.com/dossiers/debutants/robots-nocontent#comment-1229</guid>
		<description>&lt;p&gt;Faudra nous en parler si il y a la même technique avec Google parce que je suis interessé !&lt;br /&gt; Merci.&lt;/p&gt;</description>
		<content:encoded><![CDATA[<p>Faudra nous en parler si il y a la même technique avec Google parce que je suis interessé !<br />
 Merci.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Aurélien</title>
		<link>http://www.webrankinfo.com/dossiers/yahoo/robots-nocontent#comment-1251</link>
		<dc:creator>Aurélien</dc:creator>
		<pubDate>Thu, 03 May 2007 23:12:54 +0000</pubDate>
		<guid isPermaLink="false">http://www.webrankinfo.com/dossiers/debutants/robots-nocontent#comment-1251</guid>
		<description>&lt;p&gt;Ca n&#039;est pas le sujet de l&#039;article mais cela fait quelques temps déjà que Google prend en compte certains liens javascript.&lt;/p&gt;</description>
		<content:encoded><![CDATA[<p>Ca n&#8217;est pas le sujet de l&#8217;article mais cela fait quelques temps déjà que Google prend en compte certains liens javascript.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Nico</title>
		<link>http://www.webrankinfo.com/dossiers/yahoo/robots-nocontent#comment-1252</link>
		<dc:creator>Nico</dc:creator>
		<pubDate>Thu, 03 May 2007 12:13:07 +0000</pubDate>
		<guid isPermaLink="false">http://www.webrankinfo.com/dossiers/debutants/robots-nocontent#comment-1252</guid>
		<description>&lt;p&gt;Ce déploiement n&#039;est-il pas tout simplement fait pour pallier le manque de pertinence d&#039;analyse d&#039;une page ; Yahoo n&#039;arrivant pas à identifier correctement le véritable contenu de la page en supprimant les éléments redondants des pages du type header, menus, footer, ce qui m&#039;étonnerait puisque Yahoo reste un modèle de déploiement technique.&lt;br /&gt; &lt;br /&gt; Par ailleurs, la mise en valeur d&#039;un contenu passe par une publication correcte de ce dernier (utilisation et respect strict des recommandations HTML) donc :&lt;br /&gt; - une mise au neutre (div, span) des éléments n&#039;ayant pas une importance sémantique (footer, header, etc.)&lt;br /&gt; - l&#039;utilisation des liens (&lt;link&gt; et pas seulement des ancres &lt;a&gt;) à bon escient, entre autre pour le menu, comme cela avait été conçu au départ&lt;br /&gt; - l&#039;utilisation correcte des balises de hiérarchisation de l&#039;information : déployer le &lt;h1&gt; pour le titre du contenu de la page et non pour un logo, etc.&lt;br /&gt; &lt;br /&gt; Enfin, l&#039;implémentation sur nos pages de cet élément en alourdit le poids pour, et seulement pour, un seul moteur de recherche qui va détecter cet élément par l&#039;utilisation d&#039;un masque.&lt;br /&gt; Le déploiement sous forme de classe CSS permettra certes par exemple dans la version en cache de ne proposer à l&#039;internaute que le véritable contenu de la page, mais cette dénaturation (?) de l&#039;utilisation du CSS (par Yahoo pour répondre aux besoins de classement de l&#039;information) n&#039;est-elle pas finalement que la conséquence d&#039;un manque de respect des standards web de notre part (webmasters) ?&lt;br /&gt; &lt;br /&gt; Note : beaucoup parlent d&#039;un suivi des liens en JS par les moteurs de recherche ; en se mettant à leur place, il serait bien plus pertinent d&#039;analyser l&#039;ensemble de la page avec des masques détectant tout type d&#039;URL (donc n&#039;importe où dans la page y compris dans le JS), ce qui permettrait de suivre également les ressources référencées par le JS (ce qui est assimilé à l&#039;inteprétation du JS).&lt;/p&gt;</description>
		<content:encoded><![CDATA[<p>Ce déploiement n&#8217;est-il pas tout simplement fait pour pallier le manque de pertinence d&#8217;analyse d&#8217;une page ; Yahoo n&#8217;arrivant pas à identifier correctement le véritable contenu de la page en supprimant les éléments redondants des pages du type header, menus, footer, ce qui m&#8217;étonnerait puisque Yahoo reste un modèle de déploiement technique.</p>
<p> Par ailleurs, la mise en valeur d&#8217;un contenu passe par une publication correcte de ce dernier (utilisation et respect strict des recommandations HTML) donc :<br />
 &#8211; une mise au neutre (div, span) des éléments n&#8217;ayant pas une importance sémantique (footer, header, etc.)<br />
 &#8211; l&#8217;utilisation des liens (&lt;link&gt; et pas seulement des ancres &lt;a&gt;) à bon escient, entre autre pour le menu, comme cela avait été conçu au départ<br />
 &#8211; l&#8217;utilisation correcte des balises de hiérarchisation de l&#8217;information : déployer le &lt;h1&gt; pour le titre du contenu de la page et non pour un logo, etc.</p>
<p> Enfin, l&#8217;implémentation sur nos pages de cet élément en alourdit le poids pour, et seulement pour, un seul moteur de recherche qui va détecter cet élément par l&#8217;utilisation d&#8217;un masque.<br />
 Le déploiement sous forme de classe <acronym title="Cascading Style Sheets">CSS</acronym> permettra certes par exemple dans la version en cache de ne proposer à l&#8217;internaute que le véritable contenu de la page, mais cette dénaturation (?) de l&#8217;utilisation du <acronym title="Cascading Style Sheets">CSS</acronym> (par Yahoo pour répondre aux besoins de classement de l&#8217;information) n&#8217;est-elle pas finalement que la conséquence d&#8217;un manque de respect des standards web de notre part (webmasters) ?</p>
<p> Note : beaucoup parlent d&#8217;un suivi des liens en <acronym title="JavaScript">JS</acronym> par les moteurs de recherche ; en se mettant à leur place, il serait bien plus pertinent d&#8217;analyser l&#8217;ensemble de la page avec des masques détectant tout type d&#8217;URL (donc n&#8217;importe où dans la page y compris dans le <acronym title="JavaScript">JS</acronym>), ce qui permettrait de suivre également les ressources référencées par le <acronym title="JavaScript">JS</acronym> (ce qui est assimilé à l&#8217;inteprétation du <acronym title="JavaScript">JS</acronym>).</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Olivier Duffez</title>
		<link>http://www.webrankinfo.com/dossiers/yahoo/robots-nocontent#comment-1253</link>
		<dc:creator>Olivier Duffez</dc:creator>
		<pubDate>Thu, 03 May 2007 11:00:30 +0000</pubDate>
		<guid isPermaLink="false">http://www.webrankinfo.com/dossiers/debutants/robots-nocontent#comment-1253</guid>
		<description>&lt;p&gt;Est-ce que tu pourrais être un peu plus explicite ? Donner un exemple ? Merci d&#039;avance pour tous les lecteurs.&lt;/p&gt;</description>
		<content:encoded><![CDATA[<p>Est-ce que tu pourrais être un peu plus explicite ? Donner un exemple ? Merci d&#8217;avance pour tous les lecteurs.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : JP</title>
		<link>http://www.webrankinfo.com/dossiers/yahoo/robots-nocontent#comment-1254</link>
		<dc:creator>JP</dc:creator>
		<pubDate>Thu, 03 May 2007 09:56:26 +0000</pubDate>
		<guid isPermaLink="false">http://www.webrankinfo.com/dossiers/debutants/robots-nocontent#comment-1254</guid>
		<description>&lt;p&gt;Je ne pense pas que le javascript soit ignoré par les moteurs. En tout cas certainement pas par Google.&lt;/p&gt;</description>
		<content:encoded><![CDATA[<p>Je ne pense pas que le javascript soit ignoré par les moteurs. En tout cas certainement pas par Google.</p>
]]></content:encoded>
	</item>
</channel>
</rss>
