Google, rien à comprendre ???

krystian · 26 Février 2006

salut

voilà, chaque fois que je tape ce code dans google site: suivi de mon site

des fois il me renvoie la page cache , avec toutes les informations précises
et des fois il renvoie cela "Aucune information n’est disponible pour la page (site web profil)."

ca veut dire quoi ? je suis blacklisté, puis apres déblacklisté, puis reblacklisté, puis dereblacklisté, et tagada .. ?

ou bien google est perdu dans le crawl de mes pages, pourtant, les applications assujetties a url rewritting sont completes, il n' a pas de double contenu... j'ai filtré ce qu'il faut avec robots.txt.

bizarre... bizarre....

a pas de bons programmes pour savoir ce que lis un robot quand il va sur un site ? comme cela on peut vérifier si il y a double contenu, ce qui est crawlé...

jverite · 26 Février 2006

tu peux essayer ca -http://www.spider-simulator.com/ pour voir ce que voient les robots sur ton site

Leonick · 26 Février 2006

Ru peux regarder https://www.webrankinfo.com/outils/googl ... dance3.php et voir que sur tous ces datacenter il y a au moins 40 pages indexées.
Si c'est une histoire de cache qui ne s'affiche plus, ça fait quelques temps que l'on avait remarqué ce problème, mais ça n'empêche pas de bons positionnements. :wink:

krystian · 26 Février 2006

Merci

cela commence vraiment à me plaire ce genre de forum,
on y trouve plein d'infos utiles

merci les gars

krystian · 26 Février 2006

C'est trop puissant spider simulator !

trop top !super!merci !

Yvel · 26 Février 2006

spider-simulateur ne renvoie rien sur mon www !!
sans doute à cause des - dans mon NDD
quelqu'un peut confirmer ?

YerebY · 26 Février 2006

Voila ce qu'il renvoie:

Code:

Statut de réponse HTTP : 	500 (Internal Server Error)

Tu dois avoir une erreur dans ton fichier .htaccess

jverite · 26 Février 2006

je ne comprendrai jamais pourquoi un site fonctionne dans les navigateurs et ne fonctionne pas depuis certains outils. Apparemment, ce n'est pas une histoire de javascript dans le cas présent, qu'est ce qui peut faire la différence ?

luxe-campagne · 26 Février 2006

quelque fois, j'ai observé que la présence d'un ">" dans une balise title faisait perdre les pédales à ce genre d'outil par exemple

Leonick · 26 Février 2006

Ou un blocage dans le htaccess à partir d'ip ou de USER_AGENT

jverite · 26 Février 2006

Yvel, est ce que tu pourras nous dire ce qui bloquait l'outil sur ton site une fois que tu auras réussi à le faire fonctionner stp ?

merci d'avance

Yvel · 26 Février 2006

je jette un coup d'oeil dès que possible et vous tiens au courrant

krystian · 26 Février 2006

Il y a comme même un Glapsus avec spider-simulateur :c'est qu'il ne prends pas les robots.txt en compte.

Alors cela n'aide pas pour savoir si l'URL rewritting optimise efficacement le travail des robots

Certes, on voit que les bots pointent sur les url réécrites, mais on ne voit pas avec spider simulateur si le robot ne lui pas les url interdites par le robots.txt , et le but est de savoir si il n'y a pas de double content, donc présence d'une multitude d'url dans lesquelles ils seraient perdus, et du coup le crawl leur serait trés difficle.

Yvel · 26 Février 2006

c'est bien mon htaccess faut que je regarde ça plus en detail.