Code javascript indexé par Google ?

WRInaute discret
Bonsoir,

J'ai du javascript dans mon code pointant sur des fichiers XML et sur du Flash, utilisé pour présenter des galeries photo.
Les pages XML ont été indexés. Je viens de terminer le ménage grâce aux outils de webmaster, en supprimant toute les pages XML référencés...

Néamoins...

1- Est-ce que Google suit les liens dans du code Javascript systématiquement ?
2- J'ai mis seulement dans la balise Robot "index" afin que Google ne suive pas les liens (EX: evenementiel.xml, et TiltViewer.swf ) en question ! Est-ce suffisant ?

Code:
<meta name="Robots" content="index" />


Code:
<script type="text/javascript">	
var fo = new SWFObject("TiltViewer.swf", "viewer", "100%", "100%", "9.0.28", "#FFFFFF");			
(...)
fo.addVariable("xmlURL", "evenementiel.xml");
fo.addVariable("maxJPGSize","999");
(...)		
</script>

D'avance merci pour vos réponses !
++
 
Olivier Duffez (admin)
Membre du personnel
oui Google sait de plus en plus interpréter le Javascript (et les CSS)

non ce n'est pas suffisant de mettre "index" en espérant que les liens ne soient pas suivis. ça ne sert même à rien de mettre "index" car c'est fait par défaut. dans ton cas il faudrait tester "nofollow"
mais attention, la balise meta robots nofollow concerne 100% des liens de la page. si tu veux gérer ça plus précisément il faut utiliser l'attribut nofollow sur les liens concernés

cependant, ce n'est pas comme ça qu'on empêche le crawl, c'est en bloquant les robots dans le fichier robots.txt
 
WRInaute discret
WebRankInfo a dit:
oui Google sait de plus en plus interpréter le Javascript (et les CSS)

non ce n'est pas suffisant de mettre "index" en espérant que les liens ne soient pas suivis. ça ne sert même à rien de mettre "index" car c'est fait par défaut. dans ton cas il faudrait tester "nofollow"
mais attention, la balise meta robots nofollow concerne 100% des liens de la page. si tu veux gérer ça plus précisément il faut utiliser l'attribut nofollow sur les liens concernés

cependant, ce n'est pas comme ça qu'on empêche le crawl, c'est en bloquant les robots dans le fichier robots.txt


Bonjour,

Merci de ta réponse ! :)
Depuis l'outils de webmaster j'ai supprimé toutes les pages XML qui m'avait référencé. Je vais passer par le robot.txt afin de bien définir les pages que je désires qu'il référence... :)

Petite question: On peut générer le fichier robot.txt depuis les outils de webmaster ? Je ne vois plus le menu ! :(
++
 
WRInaute discret
spout a dit:
cvbperso a dit:
Je vais passer par le robot.txt
robots.txt

Oups,..Erreur de frappe ! :mrgreen:

Vous en pensez quoi (je ne veux pas que les pages xml et swf soient indexés) ? :)

Code:
User-Agent: *
Disallow: /pictures
Disallow: /pictures/Gallerie
Disallow: /pictures/Gallerie/air.xml
Disallow: /pictures/Gallerie/corporate.xml
Disallow: /pictures/Gallerie/eau.xml
Disallow: /pictures/Gallerie/evenementiel.xml
Disallow: /pictures/Gallerie/insolite.xml
Disallow: /pictures/Gallerie/noiretblanc.xml
Disallow: /pictures/Gallerie/sportive.xml
Disallow: /pictures/Gallerie/temp.xml
Disallow: /pictures/Gallerie/terre.xml
Disallow: /pictures/Gallerie/urbain.xml
Disallow: /pictures/Gallerie/TiltViewer.swf

++
 
Olivier Duffez (admin)
Membre du personnel
si tu mets
Code:
User-Agent: *
Disallow: /pictures

alors tout le répertoire /pictures/ sera bloqué aux robots. les lignes qui suivent ne servent donc sans doute à rien

dernière remarque : si tes URL sont déjà indexées, bloquer leur crawl ne les désindexera pas. Il faudra faire une demande de désindexation du répertoire /pictures/ (si c'est bien ce que tu voulais) via GWT
 
WRInaute discret
WebRankInfo a dit:
si tu mets
Code:
User-Agent: *
Disallow: /pictures

alors tout le répertoire /pictures/ sera bloqué aux robots. les lignes qui suivent ne servent donc sans doute à rien

dernière remarque : si tes URL sont déjà indexées, bloquer leur crawl ne les désindexera pas. Il faudra faire une demande de désindexation du répertoire /pictures/ (si c'est bien ce que tu voulais) via GWT

En fait dans le répertoire "Pictures" j'ai un fichier PHP permettant d'afficher les photos, dont le nom de la page est crée dynamiquement, ainsi qu'un certains nombre de balise META (factorisation). Comment puis-je procéder dans ce cas ? :) Est-ce que je peux mettre une autorisation spécifique, pour un fichier ? :)

++
 
Olivier Duffez (admin)
Membre du personnel
ce qui compte ce n'est pas l'endroit où est ton fichier sur ton serveur mais les URL générées
mais quelles sont les URL à bloquer ?

sinon tu peux mettre
Code:
User-Agent: *
Disallow: /pictures/Gallerie/*.xml
 
WRInaute discret
WebRankInfo a dit:
ce qui compte ce n'est pas l'endroit où est ton fichier sur ton serveur mais les URL générées
mais quelles sont les URL à bloquer ?

sinon tu peux mettre
Code:
User-Agent: *
Disallow: /pictures/Gallerie/*.xml

Bonjour,

je ne veux pas qu'il référence les fichier *.xml et *.swf présent dans le dossier /pictures/Galerie ! :)

En fait faut que je mette cela, en rajoutant juste une ligne ? :)

Code:
User-Agent: *
Disallow: /pictures/Gallerie/*.xml
Disallow: /pictures/Gallerie/*.swf
 
Olivier Duffez (admin)
Membre du personnel
oui c'est ça, par contre il faudra les désindexer, ce qui ne pourra se faire qu'URL par URL dans GWT :-(
à moins que tu puisses interdire tout le répertoire /pictures/Gallerie/ ?
 
WRInaute discret
WebRankInfo a dit:
oui c'est ça, par contre il faudra les désindexer, ce qui ne pourra se faire qu'URL par URL dans GWT :-(
à moins que tu puisses interdire tout le répertoire /pictures/Gallerie/ ?

Bonjour,

J'ai déjà désindexé l'ensemble des URL (Env. une dizaine, ouf pas plus... :mrgreen: )
Pour le moment je ne peux pas interdire l'accès au dossier, je suis entrain de faire en sorte d'avoir qu'un seul dossier comportant des vues ! :)

++ :)
 
Discussions similaires
Haut