Google et le javascript

Discussion dans 'Crawl et indexation Google, sitemaps' créé par pewhy, 16 Décembre 2003.

  1. pewhy
    pewhy Guest
    Bonjour,

    J'ai été tres surpris de voir google faire une requete sur une page qui n'est presente que dans le code javascript de mon site, sur une ligne du genre

    Code:
    	
    	tmp = new Image();
    	tmp.src = 'track.php?msg=test';
    
    A l'origine c'etait juste une astuce pour suivre les liens utilisés par l'utilisateur, j'ai été tres etonné de trouver googlebot faire une requete sur ma page track.php, en plus sans mettre d'argument msg !!!

    Alors, apparement, google lit le javascript, mais ne suit pas tous les liens...
    J comprend pas gd chose, mais je voulais partager cette info :?
     
  2. BadProcESs
    BadProcESs WRInaute passionné
    Inscrit:
    28 Juillet 2003
    Messages:
    1 841
    J'aime reçus:
    0
    Pas du tout, Google ne lit toujours pas le javascript.
    Il doit donc s'agir d'un lien dont GG à eu vent à un moment ou un autre via par exemple, un referer dans une page de stat et un autre moyens (la toolbar ?).
     
  3. perti
    perti WRInaute occasionnel
    Inscrit:
    22 Octobre 2003
    Messages:
    271
    J'aime reçus:
    0
    Je pense plutot que GG garde les urls envoyés par la toolbar et les crawls.
    Cependant, je ne comprend pas comment peut-il attribuer à de telles pages un PR 4 ?
     
  4. pewhy
    pewhy Guest
    Un PR 4 sur quelles pages? sur ce site j'ai au max du PR2 ! (je sais c pas top :( )
     
  5. George Abitbol
    George Abitbol WRInaute passionné
    Inscrit:
    6 Juin 2003
    Messages:
    1 536
    J'aime reçus:
    0
    Tiens, en parlant de ça... J'ai sur un site des pages qui s'ouvrent en popup (et uniquement en popup, je n'ai pas mis le lien en href en parallèle au onclick). J'ai un système de logs sommaire sur ces pages (un fichier qui met à jour le nombre d'accès puis redirige vers une page extérieure à mon site). Lors du dernier deep-crawl de ce site, j'ai constaté une méchante augmentation des logs avec par moments une page visitée à chaque seconde... Comportement typique d'un bot, donc, et peut-être de GoogleBot puisqu'il était justement en train de me crawler. Il pourrait donc être capable de suivre les événements JS... En plus la popup s'ouvre par une fonction et par le biais de variables dont l'URL encodée, donc ce n'est pas juste une récupération d'une url dans le code source. Je n'ai pas pensé plus tôt à logguer l'IP mais je vais le faire en vue du prochain crawl, comme ça j'en aurai le coeur net, et je vous tiendrai au courant.

    Fred
     
  6. anguenot.com
    anguenot.com WRInaute impliqué
    Inscrit:
    14 Mai 2003
    Messages:
    644
    J'aime reçus:
    0
    J'ai codé des liens que je ne voulais pas que GG suive en javascript comme ceci:
    Code:
    <script type="text/javascript" language="JavaScript">
    <!--
    document.write('<a href="page.php?destinataire=toto">Répondre à toto</a>');
    // -->
    </script>
    <noscript><a href="page.php">Répondre à toto</a></noscript>
    
    Que croyez-vous qu'il arrivât? page.php?destinataire=toto est indexée dans GG :evil:
     
  7. Kmacleod
    Kmacleod WRInaute passionné
    Inscrit:
    28 Novembre 2002
    Messages:
    2 468
    J'aime reçus:
    0
    La page répondre a toto est elle dans google ?
    ou
    google a suivit le lien pour indexer les pages filles de la page à toto (non toto n'a pas de fille !)

    Comment dire qu'elle sont indexées, est ce que c'est parce qu'elles sont loguées dans robostats, ou parce qu'elle sont réellement dans le cache
     
  8. anguenot.com
    anguenot.com WRInaute impliqué
    Inscrit:
    14 Mai 2003
    Messages:
    644
    J'aime reçus:
    0
    En fait, page.php et page.php?destinataire=toto sont une seule et même page. Il ne s'agit pas d'une redirection.

    La différence est que le formulaire de page.php est vide au chargement, alors que celui de page.php?destinataire=toto a un de ses champs pré-rempli avec le texte "Réponse à toto".

    Ce qui me faire dire qu'elle est indexée? Elle apparait avec cette URL dans les réponses de GG pour:
    Code:
    site:www.monsite.com -dfghj
    Précision cependant: elle apparait sans description dans GG et avec le titre -www.monsite.com/page.php?destinataire=toto
    Elle n'est pas non plus en cache

    page.php est aussi indexée mais avec titre, description et version en cache.

    Comme si GG avait bien suivi le lien javascript, indexé la page page.php?destinataire=toto, mais reconnu qu'il s'agissait d'un "duplicate content"
     
  9. Kmacleod
    Kmacleod WRInaute passionné
    Inscrit:
    28 Novembre 2002
    Messages:
    2 468
    J'aime reçus:
    0
    Avec tout celà, et d'autres topic sur le même sujet, je pense que google arrive à passer partout, mais que tout ne va pas dans le cache.
    Et qu'il semble traiter de la même manière les pages orphelines et ces pages passerelles (non indexable pour raison x - javascript, formulaire), mais lui permettant d'aller chercher d'autres pages ensuite.
     
Chargement...
Similar Threads - Google javascript Forum Date
Ras le bol ! Bloquer le crawling des fichiers Css et Javascript à Google Crawl et indexation Google, sitemaps 12 Septembre 2015
Indexation massive par google de textes fixes venant de javascript Référencement Google 12 Septembre 2014
Code javascript indexé par Google ? Crawl et indexation Google, sitemaps 4 Mars 2013
Comment effacer JavaScript de Google Analytics sous prestashop? Google Analytics 5 Février 2012
Indexation de pages qui n'existent pas (Google "lit" le Javascript ! ) Débuter en référencement 26 Janvier 2012
Google indexe JavaScript, AJAX et formulaires en POST Développement d'un site Web ou d'une appli mobile 4 Novembre 2011
Javascript : détecter mot clés Google et exécuter un script Développement d'un site Web ou d'une appli mobile 16 Juillet 2011
Le logo Google est animé en JavaScript Google : l'entreprise, les sites web, les services 4 Septembre 2010
Dans Google Analytics : % de visiteurs désactivant javascript Google Analytics 1 Février 2010
Google et Javascript eval/unescape Crawl et indexation Google, sitemaps 4 Décembre 2009
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice