Déréférencement GG ?

WRInaute impliqué
salut a tous

je viens de tester l'outil -http://www.whitelist.fr qui est plutot pas mal, sur le domaine de mon www, qui n'apparait tjs pas dans l'index GG... Pour info, je n'ai aucun robots.txt, et je n'ai soumis mon site qu'UNE seule fois via l'interface de suggestion de site du site de Google.

ils me disent qu'il a peut-etre subit une procédure de déréferencement.
ca veut dire quoi ?
 
WRInaute impliqué
fin Aout. Mais beaucoup de mes sites précédents ont été indexés au bout d'à peine quelques jours dans l'index de GG....

celui-la, niet.
hors soumis a la meme date dans l'index de Livesearch, le moteur de crosoft ressort pleins de BL et indexe bien mes pages...

est-ce que si j'avais rempli deux fois le formulaire sur le site de Google cela aurait un impact ? notamment cette idée de déréférencement ??
 
WRInaute passionné
Une multiple soumission sur le formulaire de Google ne gene pas l'indexation d'un site a mon avis.
Ton site serait-il blackliste ? En 2 mois, un site a au moins son index indexe.


C'est quoi ces meta ?

<meta http-equiv="Cache-Control" content="no-cache, must-revalidate" />
<meta http-equiv="Expires" content=" Mon, 26 Jul 1997 05:00:00 GMT" />
 
WRInaute passionné
Apres une recherche Googlienne, il serait preferable de supprimer ceci

<meta http-equiv="Pragma" content="no-cache" />
<meta http-equiv="Cache-Control" content="no-cache, must-revalidate" />
<meta http-equiv="Expires" content=" Mon, 26 Jul 1997 05:00:00 GMT" />
 
WRInaute passionné
Suis pas expert en ce qui concerne les meta, mais il me semble que celles là concernent la mise en cache par les browsers et ne devraient pas être un frein à l'indexation.

Quelqu'un de plus calé pour confirmer, infirmer ?
 
WRInaute passionné
kmenslow a dit:
Meta "expire" = Indique au robot la date d'expiration de la page. soit 26 juillet 1997

Code:
The following sample META declaration:

<META http-equiv="Expires" content="Tue, 20 Aug 1996 14:25:27 GMT">

will result in the HTTP header:

Expires: Tue, 20 Aug 1996 14:25:27 GMT

This can be used by caches to determine when to fetch a fresh copy of the associated document

Je ne sais pas si cela concerne les robots ou seulement les navigateurs pour savoir s'ils doivent utiliser une copie en cache ou recharger la page.

Source : http://www.w3.org/TR/html401/struct/glo ... #h-7.4.4.2
 
WRInaute passionné
Je pense que la meta "expires" donne la date de validite de la page => La date etant depasse google ne la prend pas en compte. Etant donne que c'est l'index du site, googlebot is bloqued :D
 
WRInaute accro
(alors si je ne dis pas de bêtise)

seul <meta http-equiv="Expires" content=" Mon, 26 Jul 1997 05:00:00 GMT" /> peut être utilisé par les robots justement pour savoir si la page de leur indexe doit être rafraichie ou non.

elle peu donc être utile..

maintenant je ne sais pas comment procède les robots au vue de cette balise.

mais étant donné que la date est justement antécédente, soit "plus valide" cela incite les robots qui la prenne en compte à réindexer la page concernée.

donc toutes ces balises ne change rien à ton pb.
 
WRInaute passionné
thierry8 a dit:
mais étant donné que la date est justement antécédente, soit "plus valide" cela insite les robots qui la prenne en compte à réindexer la page concernée.

C'est aussi comme cela que je le comprends.
 
WRInaute impliqué
oui mais vu qu'il n'a JAMAIS indexé la page d'accueil du site, il ne l'indexera jamais, parce que la balsie lui dit qu'elle est déjà expirée...
 
WRInaute passionné
Avec la balise "expires" Google a dut classer "sa page périmée" donc ne doit pas continuer le crawl.

Cette balise peut-etre interessante pour un quotidien en ligne en permettant a Google une mise en cache des articles pendant une durée limitée

Page expirée = desindexation
 
WRInaute passionné
De toute façon, à moins que tu ais spécifiquement besoin de ces balises, (et cela ne semble pas être le cas), je pense qu'on est d'accord pour dire que tu peux les virer.
Après, savoir si ce sont-elles qui ont empêché l'indexation ???
 
WRInaute impliqué
bon, j'ai viré les balises dont on vient de parler, je vous tient au courant dans les jours qui viennent (au passage, j'ai re proposé l'index de mon site dans l'index de google via A propos de google > suggérer une URL)
 
WRInaute impliqué
Monty973 a dit:
De toute façon, à moins que tu ais spécifiquement besoin de ces balises, (et cela ne semble pas être le cas), je pense qu'on est d'accord pour dire que tu peux les virer.
Après, savoir si ce sont-elles qui ont empêché l'indexation ???
de toute façon, j'ai trouvé une combine pour forcer l'affichage des pages mises à jour (pôur un jeu online, c'est vital)....
Je vous tiens au courant pour la suite...
 
WRInaute accro
sebnutt a dit:
oui mais vu qu'il n'a JAMAIS indexé la page d'accueil du site, il ne l'indexera jamais, parce que la balsie lui dit qu'elle est déjà expirée...
c'est pas expirée dans le sens plus valable, mais que la dernière mise à jour correspond à celle que tu lui indique...

ta page sera toujours "valable" seulement on lui donne un élément supplémentaire pour indiqué qu'il s'agit d'une nouvelle version de la page, et donc à mettre à jour...

comme pour le navigateur, il va t'afficher la page dans tous les cas, seulement en fonction de la date indiquée et celle de ces éléments en cache, il sait s'il doit rafraichir le cache ou non.


mais de toute manière le problème est réglé, sans compter que l'on n'est pas certain que les bots regardent cette balise (mais il me semble que oui pour GG, je ne sais plus ou j'avais lu cela)
 
WRInaute impliqué
je confirme que les autres bots ne regardent pas cette balise (on n'est deja bien postionné sur livesearch et yahoo par ex)
pour google, je plussoie pour le oui...
 
WRInaute impliqué
j'ai pensé à un truc... mon site serait-il pas dans la sandbox a cause d'un <div class="truc" style="display:none"> contenant des liens vers des annuaires divers et véraiés contenant quelques mot-clés ?
j'ai supprimés ce div, pour voir.

comment vérifier si on est en sandbox ?
 
WRInaute impliqué
y a une aucun triche de ma part : juste une succession de liens vers des annuaires (pour le référencement), que je préférais masquer...
je n'ai pas ajouter de mots clé pour booster le référencement.
 
WRInaute accro
sebnutt a dit:
y a une aucun triche de ma part : juste une succession de liens vers des annuaires (pour le référencement), que je préférais masquer...
je n'ai pas ajouter de mots clé pour booster le référencement.
oui m'enfin cacher des liens, signifie qu'ils n'ont pas d'intérêt pour l'internaute, donc pourquoi les mettrent ?
 
WRInaute impliqué
parce que c'était obligé... ;)
sinon, sur le newsgroup google-sitemaps-fr on m'a dit d'éviter les id de div et privilégier les class de div...

qu'en pensez-vous ?
 
WRInaute accro
sebnutt a dit:
les spans n'empechent pas le referencement ????
gné ? :p
c'est une blagouze :?:


biensûr que non!! les span, les id, les class, etc.. n'influencent pas le référencement :!: :roll:

tu as la réponse à ton problème et je le répète:

triche préméditée = sanction = faut pas s'étonner

et pour être plus clair:

liens cachés = triche préméditée
 
WRInaute impliqué
ok, je pensais pas... j'ai supprimé le div en question et resoumis mon site à google.
honnetenement, je pensais pas les robots si "intelligents" en terme d'interprétation de contenu...
 
Discussions similaires
Haut