WRInaute accro
Vous avez peut-être déjà croisé des projets qui, comme Majestic 12, travaillent à identifier le contenu utile HTML des pages indexées (= virer les headers, les footers, etc).
Avez-vous des informations / des idées sur les algorithmes qui peuvent être utilisés à cette fin?
Avez-vous des informations / des idées sur les algorithmes qui peuvent être utilisés à cette fin?