Indexation et cache

WRInaute impliqué
Bonjour,

avec environ 1763 pages/requetes vu par le googlebot depuis début le 2 octobre sur mon site je n'ai toujours pas d'indexation de mon site "meme partielle" hormis la page d'acueil, sur combien de temps faut il tabler pour etre indexer? un mois deux mois,Est ce que la taille du site
peut retarder cette échéance?
:cry:
Autre question j'ai eu une tres vielle page dans le cache de GG ces derniers temps malgré ces fréquents passage sur mon site, est il possible de savoir à combien de temps gg est susceptible d'afficher une page ancienne avant d'en retenir une autre car j'amerai bien qu'il me l'oublie cette page sic!! :evil:

Florent
 
WRInaute occasionnel
Pour mon site entre la pages d'accueil et le reste du site il lui a fallu 2 mois et 2 googledance pour reférencer les 72 pages du sites...
 
WRInaute discret
Ben voilà ce que vois google de ton site.....
h**p://www.delorie.com/web/lynxview.cgi?url=http%3A%2F%2Fwww.lesentreprenautes.com%2F

normal donc qu'il n'aille pas plus loin!!!! page blanche!!
je ne sais pas comment est générée ta page , si tu utilise beaucoup de javascript , si y a des redirections mais en tout cas dés la page d'accueil de ton nom de domaine y a un grand vide pour google :(

le pire c'est que quand j'ai essayé pour les pages interne genre h**p://www.delorie.com/web/lynxview.cgi?url=http%3A%2F%2Fwww.lesentreprenautes.com%2Findex.php%3Fcat%3D855
pareil page blanche :?

perso chui une bille en developpement donc je vais pas pouvoir beaucoup t'aider mais a mon avis t'as un pb au niveau de la conception de tes pages, du code en lui meme...
bon courage quand meme :wink:
 
WRInaute impliqué
arf tu me fais peur là!!!

je connais pas ton outils, est ce que ce test est en rapport avec l'indexation?
le ggbot suit mes liens donc il voit bien mes pages.
monsite est en dynamique et formatter en css! j'aimerai croire que c'est la raison de cette page blanche!
 
WRInaute discret
L'outil en question simule ce que "voit" un crawler du type de google donc là ce qu'on voit c'est qu'il ne vois rien, aucun lien. ce qui me chiffonne c'est que toi tu dis que gbot suis bien tes liens , tu le vois grace a quoi? c bizarre....

Essaye peut-etre de mettre des liens en dehors de ton formattage en css ou de faire une page d'accueil statique temporairement pour voir si ça vient des css....

j'ai pas trop d'idée autrement
 
WRInaute impliqué
Hier j'ai du rajouter ces méta qui je ne pense n'ont rien à voir avec le pb!
<meta http-equiv="Content-Language" content="fr">
<meta name="category" content="annuaire">
<meta name="copyright" content="annuaire">
<meta name="Author" lang="fr" content="les_entreprenautes">

ggbot c'est arreté à la home cette nuit, mais la veille ou l'avant veille il a suivi 400 liens
je le vois sur un script php qui m'affiche les ip et les pages consulté et sur les log apaches
et puis s'il ne voyait rien GG, j'aurai pas la page d'accueil en cache non plus avec le contenu ??

et je vois pas de groosiere erreur dans la page générée, connais tu d'autres outils similaire au tiens
 
WRInaute discret
Moi tu sais je connais pas d'autre outil de ce type... j'en ai la connaissance grace a WRI et j'ai pu vérifier a diverses reprises que ce qu'il affiche ou pas donne une véritable aide par rapport au fait de savoir si les carwler visualisent ou pas les pages comme on le souhaiterais et en particulier s'ils voient bien tous les liens que l'on a mis en place...

Grace a cela j'ai pu me rendre compte par exemple que les listes déroulantes sont par exemple carément invisible pour les crawler... maintenant si tu as un script qui t'assure que google va bien suivre tout tes liens là je peux pas grand chose, j'ai pas trop d'idée sur ce qui peux se passer sur tes pages.... moi je vois juste que ton code visiblement il est pas super lisible...
:?: ...
 
WRInaute impliqué
merci Kob,

Bon me voila dans l'incertitude complete, ras le bol :? :? j'en attends aux grands manitous de ce forum!!! j'esepre que mon indexation n'est pas retardé par cette découverte!!
 
WRInaute discret
tu sais faut pas te prendre trop le choux , moi jt'ai donné mon avis sur la question , maintenant c'est clair que t'aura ptetre plus de précision par exemple avec quelqu'un qui utilise le meme procédé de construction de page que toi....
en tout cas bon courage et au passage jme suis inscrit sur ton site...
 
WRInaute impliqué
En lisant ce post, j'ai fait une verif avec lynx... aucun lien n'est visible non-plus.

Pourtant pas de liens javascript ni de liste déroulante, quelqu'un a une idée ?

Adresse du site: h**p://www.ouetu.com/enseignant
 
WRInaute accro
en effet... c'est bizarre... seule la page d'index est visible avec lynx :roll:


la seule différence entre la page d'index et la page que tu mentionnes, et celle des gendarmes, c'est ce class="invisible" ... il y aurait il un problème avec ça ? :roll:
 
WRInaute impliqué
J'y ai pensé aussi mais les class "invisible" sont en fait des liens non-soulignés. De plus d'autre liens sont du même class et il n'apparaisse pourtant pas.
 
WRInaute impliqué
Je viens de refaire l'esperience avec toutes les pages de mon site et aucune n'est visible.

Le problème viendrai peut-être de l'entete ?
 
WRInaute accro
Maintenant que je sais que Google n'aime pas les javascripts... je les étudie à la loupe :wink:

en ne fermant pas la balise... toute ta page est considérée comme un script :lol:
 
WRInaute impliqué
Vous m'inquietez !
parce que moi je ne vois pas d'erreur dans mes balises donc si je ne vois pas dans lynx
est ce que je dois en tirer de consequences facheuse par rapport à l'indexation de mon site?? ou dois considerer que lynx est un browser qui n'interprete pas mes pages et que al vie continue :)
si qqi peut savoir d'ou cela peut venir?

Sinon j'ai trouvé cet outil sur le meme site et la je peux voir mon site!!! on peut visionne son site en mode texte ausi :http://www.delorie.com/web/wpbcv.html
 
WRInaute accro
Lentreprenaute a dit:
Vous m'inquietez !
parce que moi je ne vois pas d'erreur dans mes balises donc si je ne vois pas dans lynx
est ce que je dois en tirer de consequences facheuse par rapport à l'indexation de mon site??

Ben pourtant il y voit pas beau lui : http://validator.w3.org/check?uri=http% ... tes.com%2F

Et mon éditeur HTML me signal aussi plein de </div> et de </font> et <noscript> qui sont des balises orphelines.
 
WRInaute impliqué
eh eh indigne,

merci pour le lien j'ai fais le test et je dois dire que j'y comprends rien
Code:
Line 83, column 67: cannot generate system identifier for general entity "a" 
Line 83, column 76: cannot generate system identifier for general entity "g" 
Line 111, column 47: cannot generate system identifier for general entity "emailexp" 
Line 213, column 153: cannot generate system identifier for general entity "p"
je ne comprends pas ce que ca veut dire et les lignes

et les lignes qui me pointent ce signe ^ sur des guillements ca veut dire quoi
Code:
Line 8, column 51: required attribute "TYPE" not specified (explain...). 
  <script language="JavaScript" src="inc/annuaire.js"></script>
                                                                                    ^

si tu peux m'éclairer? des noscript j'en ai qu'en bas de page c'est du code xiti, certes j'ai quelques </div> qui trainent ca peut bloquer lynx mais surment ggbot j'espere.

Sinon un décryptage du validateur w3c est bienvenue car je ne comprends pas bien les codes encadrés!!
 
WRInaute accro
Code:
Line 8, column 51:  required attribute "TYPE" not specified  (explain...).

  <script language="JavaScript" src="inc/annuaire.js"></script>

Veut simplement dire que ta balise script n'est pas conforme car il manque l'attribut TYPE et le petit chapeau t'indique à l'endroit où il a trouvé l'erreur (c'est à dire le > de fin de balise car il a balayé toute la balise et c'est à la fin qu'il se rend compte qu'il manque un truc.

Il faudrait ajouter : type="text/javascript" quelque part dans la balise

Pour la ligne 83 je pense qu'il manque un espace avant le mot TARGET et il y comprend plus rien

Il y a aussi une colonne de ta table que tu nomme x fois avec le même identifiant. Il faudrait ne pas la nommer du tout.

Tu utilises aussi l'attribut valign="center" qui ne veut rien dire du tout en html mais là je pense que le validator est assez explicite, il te dit qu'il faut utiliser middle

Une fois les erreurs qui se retrouvent le plus supprimées ça sera plus clair je pense.
Et quelques \n dans ton code php rendrait la page plus lisible aussi

Mais concernant le fait que l'outil n'affiche rien j'arrive pas du tout à comprendre pkoi.
 
WRInaute passionné
Lentreprenaute a dit:
Sinon un décryptage du validateur w3c est bienvenue car je ne comprends pas bien les codes encadrés!!

Bonjour,

Utilise ce validateur, les explications des erreurs sont plus claires que sur le W3C (tu cliques sur l'élément en cause pour avoir les recommandations du W3C et des exemples).

Pour le JavaScript, la bonne syntaxe est
Code:
<script type="text/javascript" src="inc/annuaire.js"></script>
Remplace id="maincontent" par class="maincontent" (l'attribut id ne peut être utilisé qu'une seule fois sur une page)
Ajoute l'attribut alt à tes images.
Vois aussi toutes les balises qui ne sont pas fermées (ou pas à leur place)
définis les attributs width, font, margin... dans la feuille de style
... le nombre d'erreurs va déjà diminuer sérieusement !

Amicalement,
Monique
 
WRInaute accro
c'est bon... j'arrive à le voir ton site ... ou plutot ta page avec lynx !!! :)

J'ai fait un test en regardant le code source de la page d'index... j'ai retiré une portion du code et la page s'affiche

bien sûr... j'ai du faire ça sur mon site... pour voir la page :wink:

http://www.delorie.com/web/lynxview.cgi ... autes.html

voici la partie du code que j'ai retiré après <!-- annuiare inc-->
à toi de voir où est l'erreur :wink:

<div align="center">
<a href="p_rech.php?rech=webdesigner">*</a><a href="p_rech.php?rech=flash">*</a><a href="p_rech.php?rech=webmaster">*</a><a href="p_rech.php?rech=communication">*</a><a href="p_rech.php?rech=informatique">*</a><a href="p_rech.php?rech=paris">*</a><a href="p_rech.php?rech=webagency">*</a>&
<a href="index.php?cat="> Annuaire</a> -
<a href="contact.php?cat="> Contact</a> -
<a href="p_rech.php?cat="> Recherche</a> -
<a href="#"> FAQ</a> -
<a href="http://www.cnil.fr" target="_blank">CNIL : 874855</a> -
<a href="http://trafic.xiti.com/stats/frequentation/publique.asp?site=128116" target="_blank">Audience</a>
& <a href="p_rech.php?rech=freelance">*</a><a href="p_rech.php?rech=entreprise">*</a><a href="p_rech.php?rech=collaborateur">*</a><a href="p_rech.php?rech=web">*</a><a href="p_rech.php?rech=internet">*</a><a href="p_rech.php?rech=DA">*</a><a href="p_rech.php?rech=infographiste">*</a><br>
<br></div>
 
WRInaute passionné
Monique a dit:
Lentreprenaute a dit:
Sinon un décryptage du validateur w3c est bienvenue car je ne comprends pas bien les codes encadrés!!

Bonjour,

Utilise ce validateur, les explications des erreurs sont plus claires que sur le W3C (tu cliques sur l'élément en cause pour avoir les recommandations du W3C et des exemples).
Monique

J'ai utilisé ce test pour mon site et j'obtient ce genre d'erreur:

Line 63, character 99:
... .gif" width="220" height="40">
^Error: required attribute ALT not specified

Que cela signifie t'il?

Merci.
Seb.
 
WRInaute accro
sdamain a dit:
Bonsoir,

Quelqu'un peut il m'expliquer pourquoi je ne vois pas ma page :

http://www.delorie.com/web/lynxview.cgi ... loc.com%2F

Voilà... ya un problème au niveau du menu "les grandes villes" :wink:

j'ai fait un test en copiant le code source de ta page sur mon site et en retirant quelques liens... ça fonctionne. :)

il semblerait que la page ne s'affiche pas correctement avec lynx si tu as plus de 15 liens dans ton menu... ne me demande pas pourquoi... j'en sais rien 8O

alors j'ai retiré quelques lien du menu... et voici ce que cela donne :

http://www.delorie.com/web/lynxview.cgi ... coloc.html
 
WRInaute impliqué
Merci Monique, Indigène,América, Kob,

Comment tu as fais pour trouver le bloc America :lol: qui peche, je viens de faire le test
en supprimant le bloc incriminé et ca passe! je vais corrigé au plus vite, il ya a juste un point l'id css à utiliser une fois dans une page, j'ai jamais lu ca!
Merci

icroyable mais vrai! sur le bloc incriminé, j'ai supprimé des etoiles liens pour que ca marche
dès que je veux en mettre une 3ieme, lynx ne voit plus mon site!
 
WRInaute accro
Lentreprenaute a dit:
Merci Monique, Indigène,América, Kob,

Comment tu as fais pour trouver le bloc America :lol: qui peche, je viens de faire le test
en supprimant le bloc incriminé et ca passe!

La méthode empirique... ya rien de mieux !!! :wink: tu retires du code tout ce qui te semble suspect et tu fais un test... j'ai du procéder par étape pour me rendre compte que l'erreur venait de là...

à savoir pourquoi Lynx ne voyait pas cette partie et pourquoi il refusait d'affichait la page alors que 70% de tout ce qui était en haut de la page était bon... ça... je n'en sais rien... il pourrait au moins afficher le code valide :roll:
 
WRInaute impliqué
comme tu dis la methode empirique!
Vu la construction de mes pages j'aurai jamais cherché sur cette partie, :lol:
un des seuls blocs statiques du site fait avec dreamweaver;

ce qui est bizarre si je mets trois etoiles sur la partie gauche ca ne passe pas???
deux oui, enfin je laisse comme ca dans un premier temps, j'espere qu GG ca va lui plaire
et un grand merci, pour le peine que tu t'es donné!!
 
WRInaute accro
Lentreprenaute a dit:
un des seuls blocs statiques du site fait avec dreamweaver;

Tu utilises cette usine à gaz ??? 8O Moi... quand j'ai vu le code généré par ce truc... j'ai vite abandonné... rien de mieux que des petits éditeurs style webexpert et le notepad de windows :lol:
 
WRInaute impliqué
Pour info,

J'avais un probleme de visiblité de mon site avec le lynx qui affichait page blanche,mais mon site est indéxé depuis aujourd'hui avec les pages qui correspondent à celle que lynx n'affichait pas.

voila pour info donc
 
WRInaute accro
crindor a dit:
désolé de vous casser la baraque les gars, mais votre Dolorie machin truc pour soi disant tester votre site , c'est de la daube en palette

visez la première place de cette page
https://www.google.fr/search?sourceid=navclient&hl=fr&ie=UTF-8&oe=UTF-8&q=charter+mexico

et regarder avec DolorieDaube
http://www.delorie.com/web/lynxview.cgi?url=http://www.airbillet.com/charter/charter_mexico.php

no comment

Faudrait regarder de plus près :wink:

La page arrive en première position sur ta requête... mais si la page n'est pas visible sur lynx... c'est qu'il y a un problème...

Pour s'en rendre compte il suffit de faire :
https://www.google.fr/search?hl=fr&ie=UT ... ogle&meta=

Aucun backlink :roll: ... le problème est réel :lol:

Il y a de fortes chances que le site ait perdu ses backlinks parce que Google n'a pu suivre les liens :wink:
 
WRInaute impliqué
pas du tout, ce site a été mis en ligne depuis moins d'une semaine
il n'a pas eu le temps d'avoir des blacklinks le bougre
 
WRInaute accro
Tu utilises un générateur de mots clés ou quoi sur ce site ? 8O
La plupart des pages indexées dan Google ont presque toutes en début de page la mention : Votre demande est " truc bidule" 8O

Je connais d'autres sites qui font ça... à plus grande échelle car ils sont là depuis plusieurs mois et ils trustent les premières positions :evil:
 
WRInaute impliqué
non, j'ai simplement une liste de destinations et chacune d'elles a sa page
si c'est le meme titre c'est simplement parce que je ne suis pas inventif

ceci dit, çà me vexerait si tu me compares au truc qui commence par fr et et qui finit par oo
 
WRInaute impliqué
perso, je vais dans le sens de crindor, après m'etre soucié que mon site ne s'indexait pas, ce qui est le cas depuis peu, google a indexé des pages que lynx ne voyait pas!!
que j'ai corrigé par la suite
 
WRInaute accro
crindor a dit:
ceci dit, çà me vexerait si tu me compares au truc qui commence par fr et et qui finit par oo

Après avoir regarder sur ton site... en effet... ce n'est pas un générateur de liens. Excuse-moi pour mas suspicion, mais comme les pages mettent un certain temps avant de s'afficher, j'ai pensé à la présence d'un script générant ces mots clés :oops:

Mais c'est vrai qu'il y en a marre de ces sites qui commencent en fr et qui finissent en oo... surtout quand on essaye de se positionner sur un secteur où ils trustent les premières places...

Bon... il ne me reste plus qu'à faire comme toi... générer des pages par destinations avec toute une liste de mots clés placés sur les pages... merci pour l'idée :wink:
 
WRInaute impliqué
plus qu'une liste de mots clés , c'est surtout un moyen pour que les moteurs suivent les liens sans être obligé de faire un plan de site avec 300 urls

mais le contenu n'est que provisoire, je voulais juste gagner du temps pour le référencement, de plus çà sera utile aussi pour le visiteur
 
Discussions similaires
Haut