Google et le javascript

P
pewhy
Guest
Bonjour,

J'ai été tres surpris de voir google faire une requete sur une page qui n'est presente que dans le code javascript de mon site, sur une ligne du genre

Code:
	tmp = new Image();
	tmp.src = 'track.php?msg=test';

A l'origine c'etait juste une astuce pour suivre les liens utilisés par l'utilisateur, j'ai été tres etonné de trouver googlebot faire une requete sur ma page track.php, en plus sans mettre d'argument msg !!!

Alors, apparement, google lit le javascript, mais ne suit pas tous les liens...
J comprend pas gd chose, mais je voulais partager cette info :?
 
WRInaute passionné
Pas du tout, Google ne lit toujours pas le javascript.
Il doit donc s'agir d'un lien dont GG à eu vent à un moment ou un autre via par exemple, un referer dans une page de stat et un autre moyens (la toolbar ?).
 
WRInaute occasionnel
Je pense plutot que GG garde les urls envoyés par la toolbar et les crawls.
Cependant, je ne comprend pas comment peut-il attribuer à de telles pages un PR 4 ?
 
P
pewhy
Guest
perti a dit:
Je pense plutot que GG garde les urls envoyés par la toolbar et les crawls.
Cependant, je ne comprend pas comment peut-il attribuer à de telles pages un PR 4 ?

Un PR 4 sur quelles pages? sur ce site j'ai au max du PR2 ! (je sais c pas top :( )
 
WRInaute passionné
Tiens, en parlant de ça... J'ai sur un site des pages qui s'ouvrent en popup (et uniquement en popup, je n'ai pas mis le lien en href en parallèle au onclick). J'ai un système de logs sommaire sur ces pages (un fichier qui met à jour le nombre d'accès puis redirige vers une page extérieure à mon site). Lors du dernier deep-crawl de ce site, j'ai constaté une méchante augmentation des logs avec par moments une page visitée à chaque seconde... Comportement typique d'un bot, donc, et peut-être de GoogleBot puisqu'il était justement en train de me crawler. Il pourrait donc être capable de suivre les événements JS... En plus la popup s'ouvre par une fonction et par le biais de variables dont l'URL encodée, donc ce n'est pas juste une récupération d'une url dans le code source. Je n'ai pas pensé plus tôt à logguer l'IP mais je vais le faire en vue du prochain crawl, comme ça j'en aurai le coeur net, et je vous tiendrai au courant.

Fred
 
WRInaute impliqué
J'ai codé des liens que je ne voulais pas que GG suive en javascript comme ceci:
Code:
<script type="text/javascript" language="JavaScript">
<!--
document.write('<a href="page.php?destinataire=toto">Répondre à toto</a>');
// -->
</script>
<noscript><a href="page.php">Répondre à toto</a></noscript>

Que croyez-vous qu'il arrivât? page.php?destinataire=toto est indexée dans GG :evil:
 
WRInaute passionné
La page répondre a toto est elle dans google ?
ou
google a suivit le lien pour indexer les pages filles de la page à toto (non toto n'a pas de fille !)

Comment dire qu'elle sont indexées, est ce que c'est parce qu'elles sont loguées dans robostats, ou parce qu'elle sont réellement dans le cache
 
WRInaute impliqué
En fait, page.php et page.php?destinataire=toto sont une seule et même page. Il ne s'agit pas d'une redirection.

La différence est que le formulaire de page.php est vide au chargement, alors que celui de page.php?destinataire=toto a un de ses champs pré-rempli avec le texte "Réponse à toto".

Ce qui me faire dire qu'elle est indexée? Elle apparait avec cette URL dans les réponses de GG pour:
Code:
site:www.monsite.com -dfghj

Précision cependant: elle apparait sans description dans GG et avec le titre -www.monsite.com/page.php?destinataire=toto
Elle n'est pas non plus en cache

page.php est aussi indexée mais avec titre, description et version en cache.

Comme si GG avait bien suivi le lien javascript, indexé la page page.php?destinataire=toto, mais reconnu qu'il s'agissait d'un "duplicate content"
 
WRInaute passionné
Avec tout celà, et d'autres topic sur le même sujet, je pense que google arrive à passer partout, mais que tout ne va pas dans le cache.
Et qu'il semble traiter de la même manière les pages orphelines et ces pages passerelles (non indexable pour raison x - javascript, formulaire), mais lui permettant d'aller chercher d'autres pages ensuite.
 
Discussions similaires
Haut