Indexation et cache

Discussion dans 'Crawl et indexation Google, sitemaps' créé par Lentreprenaute, 4 Novembre 2003.

  1. Lentreprenaute
    Lentreprenaute WRInaute impliqué
    Inscrit:
    18 Octobre 2003
    Messages:
    713
    J'aime reçus:
    0
    Bonjour,

    avec environ 1763 pages/requetes vu par le googlebot depuis début le 2 octobre sur mon site je n'ai toujours pas d'indexation de mon site "meme partielle" hormis la page d'acueil, sur combien de temps faut il tabler pour etre indexer? un mois deux mois,Est ce que la taille du site
    peut retarder cette échéance?
    :cry:
    Autre question j'ai eu une tres vielle page dans le cache de GG ces derniers temps malgré ces fréquents passage sur mon site, est il possible de savoir à combien de temps gg est susceptible d'afficher une page ancienne avant d'en retenir une autre car j'amerai bien qu'il me l'oublie cette page sic!! :evil:

    Florent
     
  2. albert
    albert WRInaute occasionnel
    Inscrit:
    27 Août 2003
    Messages:
    372
    J'aime reçus:
    0
    Pour mon site entre la pages d'accueil et le reste du site il lui a fallu 2 mois et 2 googledance pour reférencer les 72 pages du sites...
     
  3. Lentreprenaute
    Lentreprenaute WRInaute impliqué
    Inscrit:
    18 Octobre 2003
    Messages:
    713
    J'aime reçus:
    0
    merci Albert de ton retour!

    hepl google s'arrete a ma home page, moi c'est pour de vrai :lol:
     
  4. kob-one
    kob-one WRInaute discret
    Inscrit:
    25 Juin 2003
    Messages:
    100
    J'aime reçus:
    0
    Ben voilà ce que vois google de ton site.....
    h**p://www.delorie.com/web/lynxview.cgi?url=http%3A%2F%2Fwww.lesentreprenautes.com%2F

    normal donc qu'il n'aille pas plus loin!!!! page blanche!!
    je ne sais pas comment est générée ta page , si tu utilise beaucoup de javascript , si y a des redirections mais en tout cas dés la page d'accueil de ton nom de domaine y a un grand vide pour google :(

    le pire c'est que quand j'ai essayé pour les pages interne genre h**p://www.delorie.com/web/lynxview.cgi?url=http%3A%2F%2Fwww.lesentreprenautes.com%2Findex.php%3Fcat%3D855
    pareil page blanche :?

    perso chui une bille en developpement donc je vais pas pouvoir beaucoup t'aider mais a mon avis t'as un pb au niveau de la conception de tes pages, du code en lui meme...
    bon courage quand meme :wink:
     
  5. Lentreprenaute
    Lentreprenaute WRInaute impliqué
    Inscrit:
    18 Octobre 2003
    Messages:
    713
    J'aime reçus:
    0
    arf tu me fais peur là!!!

    je connais pas ton outils, est ce que ce test est en rapport avec l'indexation?
    le ggbot suit mes liens donc il voit bien mes pages.
    monsite est en dynamique et formatter en css! j'aimerai croire que c'est la raison de cette page blanche!
     
  6. kob-one
    kob-one WRInaute discret
    Inscrit:
    25 Juin 2003
    Messages:
    100
    J'aime reçus:
    0
    L'outil en question simule ce que "voit" un crawler du type de google donc là ce qu'on voit c'est qu'il ne vois rien, aucun lien. ce qui me chiffonne c'est que toi tu dis que gbot suis bien tes liens , tu le vois grace a quoi? c bizarre....

    Essaye peut-etre de mettre des liens en dehors de ton formattage en css ou de faire une page d'accueil statique temporairement pour voir si ça vient des css....

    j'ai pas trop d'idée autrement
     
  7. Lentreprenaute
    Lentreprenaute WRInaute impliqué
    Inscrit:
    18 Octobre 2003
    Messages:
    713
    J'aime reçus:
    0
    Hier j'ai du rajouter ces méta qui je ne pense n'ont rien à voir avec le pb!
    <meta http-equiv="Content-Language" content="fr">
    <meta name="category" content="annuaire">
    <meta name="copyright" content="annuaire">
    <meta name="Author" lang="fr" content="les_entreprenautes">

    ggbot c'est arreté à la home cette nuit, mais la veille ou l'avant veille il a suivi 400 liens
    je le vois sur un script php qui m'affiche les ip et les pages consulté et sur les log apaches
    et puis s'il ne voyait rien GG, j'aurai pas la page d'accueil en cache non plus avec le contenu ??

    et je vois pas de groosiere erreur dans la page générée, connais tu d'autres outils similaire au tiens
     
  8. kob-one
    kob-one WRInaute discret
    Inscrit:
    25 Juin 2003
    Messages:
    100
    J'aime reçus:
    0
    Moi tu sais je connais pas d'autre outil de ce type... j'en ai la connaissance grace a WRI et j'ai pu vérifier a diverses reprises que ce qu'il affiche ou pas donne une véritable aide par rapport au fait de savoir si les carwler visualisent ou pas les pages comme on le souhaiterais et en particulier s'ils voient bien tous les liens que l'on a mis en place...

    Grace a cela j'ai pu me rendre compte par exemple que les listes déroulantes sont par exemple carément invisible pour les crawler... maintenant si tu as un script qui t'assure que google va bien suivre tout tes liens là je peux pas grand chose, j'ai pas trop d'idée sur ce qui peux se passer sur tes pages.... moi je vois juste que ton code visiblement il est pas super lisible...
    :?: ...
     
  9. Lentreprenaute
    Lentreprenaute WRInaute impliqué
    Inscrit:
    18 Octobre 2003
    Messages:
    713
    J'aime reçus:
    0
    merci Kob,

    Bon me voila dans l'incertitude complete, ras le bol :? :? j'en attends aux grands manitous de ce forum!!! j'esepre que mon indexation n'est pas retardé par cette découverte!!
     
  10. kob-one
    kob-one WRInaute discret
    Inscrit:
    25 Juin 2003
    Messages:
    100
    J'aime reçus:
    0
    tu sais faut pas te prendre trop le choux , moi jt'ai donné mon avis sur la question , maintenant c'est clair que t'aura ptetre plus de précision par exemple avec quelqu'un qui utilise le meme procédé de construction de page que toi....
    en tout cas bon courage et au passage jme suis inscrit sur ton site...
     
  11. cleden
    cleden WRInaute impliqué
    Inscrit:
    6 Janvier 2003
    Messages:
    917
    J'aime reçus:
    0
    En lisant ce post, j'ai fait une verif avec lynx... aucun lien n'est visible non-plus.

    Pourtant pas de liens javascript ni de liste déroulante, quelqu'un a une idée ?

    Adresse du site: h**p://www.ouetu.com/enseignant
     
  12. Americas
    Americas WRInaute accro
    Inscrit:
    24 Septembre 2003
    Messages:
    2 587
    J'aime reçus:
    0
    en effet... c'est bizarre... seule la page d'index est visible avec lynx :roll:


    la seule différence entre la page d'index et la page que tu mentionnes, et celle des gendarmes, c'est ce class="invisible" ... il y aurait il un problème avec ça ? :roll:
     
  13. cleden
    cleden WRInaute impliqué
    Inscrit:
    6 Janvier 2003
    Messages:
    917
    J'aime reçus:
    0
    J'y ai pensé aussi mais les class "invisible" sont en fait des liens non-soulignés. De plus d'autre liens sont du même class et il n'apparaisse pourtant pas.
     
  14. cleden
    cleden WRInaute impliqué
    Inscrit:
    6 Janvier 2003
    Messages:
    917
    J'aime reçus:
    0
    Je viens de refaire l'esperience avec toutes les pages de mon site et aucune n'est visible.

    Le problème viendrai peut-être de l'entete ?
     
  15. Americas
    Americas WRInaute accro
    Inscrit:
    24 Septembre 2003
    Messages:
    2 587
    J'aime reçus:
    0
    ce doit être ça !!! regarde ton code de fermeture de script... il manque le ">"

    </script

    idem sur la page gendarme
     
  16. cleden
    cleden WRInaute impliqué
    Inscrit:
    6 Janvier 2003
    Messages:
    917
    J'aime reçus:
    0
    Bien joué Callagan !!!

    Un simple > suffisait à interidre l'accès de G à mes pages...

    Merci :wink:
     
  17. Americas
    Americas WRInaute accro
    Inscrit:
    24 Septembre 2003
    Messages:
    2 587
    J'aime reçus:
    0
    Maintenant que je sais que Google n'aime pas les javascripts... je les étudie à la loupe :wink:

    en ne fermant pas la balise... toute ta page est considérée comme un script :lol:
     
  18. Lentreprenaute
    Lentreprenaute WRInaute impliqué
    Inscrit:
    18 Octobre 2003
    Messages:
    713
    J'aime reçus:
    0
    Vous m'inquietez !
    parce que moi je ne vois pas d'erreur dans mes balises donc si je ne vois pas dans lynx
    est ce que je dois en tirer de consequences facheuse par rapport à l'indexation de mon site?? ou dois considerer que lynx est un browser qui n'interprete pas mes pages et que al vie continue :)
    si qqi peut savoir d'ou cela peut venir?

    Sinon j'ai trouvé cet outil sur le meme site et la je peux voir mon site!!! on peut visionne son site en mode texte ausi :http://www.delorie.com/web/wpbcv.html
     
  19. indigene
    indigene WRInaute accro
    Inscrit:
    7 Septembre 2003
    Messages:
    3 716
    J'aime reçus:
    79
    Ben pourtant il y voit pas beau lui : http://validator.w3.org/check?uri=http% ... tes.com%2F

    Et mon éditeur HTML me signal aussi plein de </div> et de </font> et <noscript> qui sont des balises orphelines.
     
  20. Lentreprenaute
    Lentreprenaute WRInaute impliqué
    Inscrit:
    18 Octobre 2003
    Messages:
    713
    J'aime reçus:
    0
    eh eh indigne,

    merci pour le lien j'ai fais le test et je dois dire que j'y comprends rien
    Code:
    Line 83, column 67: cannot generate system identifier for general entity "a" 
    Line 83, column 76: cannot generate system identifier for general entity "g" 
    Line 111, column 47: cannot generate system identifier for general entity "emailexp" 
    Line 213, column 153: cannot generate system identifier for general entity "p" 
    
    je ne comprends pas ce que ca veut dire et les lignes

    et les lignes qui me pointent ce signe ^ sur des guillements ca veut dire quoi
    Code:
    Line 8, column 51: required attribute "TYPE" not specified (explain...). 
      <script language="JavaScript" src="inc/annuaire.js"></script>
                                                                                        ^
    
    si tu peux m'éclairer? des noscript j'en ai qu'en bas de page c'est du code xiti, certes j'ai quelques </div> qui trainent ca peut bloquer lynx mais surment ggbot j'espere.

    Sinon un décryptage du validateur w3c est bienvenue car je ne comprends pas bien les codes encadrés!!
     
  21. indigene
    indigene WRInaute accro
    Inscrit:
    7 Septembre 2003
    Messages:
    3 716
    J'aime reçus:
    79
    Code:
    Line 8, column 51:  required attribute "TYPE" not specified  (explain...).
    
      <script language="JavaScript" src="inc/annuaire.js"></script>
    Veut simplement dire que ta balise script n'est pas conforme car il manque l'attribut TYPE et le petit chapeau t'indique à l'endroit où il a trouvé l'erreur (c'est à dire le > de fin de balise car il a balayé toute la balise et c'est à la fin qu'il se rend compte qu'il manque un truc.

    Il faudrait ajouter : type="text/javascript" quelque part dans la balise

    Pour la ligne 83 je pense qu'il manque un espace avant le mot TARGET et il y comprend plus rien

    Il y a aussi une colonne de ta table que tu nomme x fois avec le même identifiant. Il faudrait ne pas la nommer du tout.

    Tu utilises aussi l'attribut valign="center" qui ne veut rien dire du tout en html mais là je pense que le validator est assez explicite, il te dit qu'il faut utiliser middle

    Une fois les erreurs qui se retrouvent le plus supprimées ça sera plus clair je pense.
    Et quelques \n dans ton code php rendrait la page plus lisible aussi

    Mais concernant le fait que l'outil n'affiche rien j'arrive pas du tout à comprendre pkoi.
     
  22. Monique
    Monique WRInaute passionné
    Inscrit:
    16 Septembre 2002
    Messages:
    1 154
    J'aime reçus:
    0
    Bonjour,

    Utilise ce validateur, les explications des erreurs sont plus claires que sur le W3C (tu cliques sur l'élément en cause pour avoir les recommandations du W3C et des exemples).

    Pour le JavaScript, la bonne syntaxe est
    Code:
    <script type="text/javascript" src="inc/annuaire.js"></script>
    Remplace id="maincontent" par class="maincontent" (l'attribut id ne peut être utilisé qu'une seule fois sur une page)
    Ajoute l'attribut alt à tes images.
    Vois aussi toutes les balises qui ne sont pas fermées (ou pas à leur place)
    définis les attributs width, font, margin... dans la feuille de style
    ... le nombre d'erreurs va déjà diminuer sérieusement !

    Amicalement,
    Monique
     
  23. Americas
    Americas WRInaute accro
    Inscrit:
    24 Septembre 2003
    Messages:
    2 587
    J'aime reçus:
    0
    c'est bon... j'arrive à le voir ton site ... ou plutot ta page avec lynx !!! :)

    J'ai fait un test en regardant le code source de la page d'index... j'ai retiré une portion du code et la page s'affiche

    bien sûr... j'ai du faire ça sur mon site... pour voir la page :wink:

    http://www.delorie.com/web/lynxview.cgi ... autes.html

    voici la partie du code que j'ai retiré après <!-- annuiare inc-->
    à toi de voir où est l'erreur :wink:

    <div align="center">
    <a href="p_rech.php?rech=webdesigner">*</a><a href="p_rech.php?rech=flash">*</a><a href="p_rech.php?rech=webmaster">*</a><a href="p_rech.php?rech=communication">*</a><a href="p_rech.php?rech=informatique">*</a><a href="p_rech.php?rech=paris">*</a><a href="p_rech.php?rech=webagency">*</a>&
    <a href="index.php?cat="> Annuaire</a> -
    <a href="contact.php?cat="> Contact</a> -
    <a href="p_rech.php?cat="> Recherche</a> -
    <a href="#"> FAQ</a> -
    <a href="http://www.cnil.fr" target="_blank">CNIL : 874855</a> -
    <a href="http://trafic.xiti.com/stats/frequentation/publique.asp?site=128116" target="_blank">Audience</a>
    & <a href="p_rech.php?rech=freelance">*</a><a href="p_rech.php?rech=entreprise">*</a><a href="p_rech.php?rech=collaborateur">*</a><a href="p_rech.php?rech=web">*</a><a href="p_rech.php?rech=internet">*</a><a href="p_rech.php?rech=DA">*</a><a href="p_rech.php?rech=infographiste">*</a><br>
    <br></div>
     
  24. sdamain
    sdamain WRInaute passionné
    Inscrit:
    14 Octobre 2003
    Messages:
    1 070
    J'aime reçus:
    0
    J'ai utilisé ce test pour mon site et j'obtient ce genre d'erreur:

    Line 63, character 99:
    ... .gif" width="220" height="40">
    ^Error: required attribute ALT not specified

    Que cela signifie t'il?

    Merci.
    Seb.
     
  25. sdamain
    sdamain WRInaute passionné
    Inscrit:
    14 Octobre 2003
    Messages:
    1 070
    J'aime reçus:
    0
  26. tuisp
    tuisp WRInaute passionné
    Inscrit:
    27 Juin 2003
    Messages:
    1 169
    J'aime reçus:
    0
  27. Americas
    Americas WRInaute accro
    Inscrit:
    24 Septembre 2003
    Messages:
    2 587
    J'aime reçus:
    0
    Voilà... ya un problème au niveau du menu "les grandes villes" :wink:

    j'ai fait un test en copiant le code source de ta page sur mon site et en retirant quelques liens... ça fonctionne. :)

    il semblerait que la page ne s'affiche pas correctement avec lynx si tu as plus de 15 liens dans ton menu... ne me demande pas pourquoi... j'en sais rien 8O

    alors j'ai retiré quelques lien du menu... et voici ce que cela donne :

    http://www.delorie.com/web/lynxview.cgi ... coloc.html
     
  28. sdamain
    sdamain WRInaute passionné
    Inscrit:
    14 Octobre 2003
    Messages:
    1 070
    J'aime reçus:
    0
    Merci beaucoup, je vais regarder à ca de plus près.
     
  29. Lentreprenaute
    Lentreprenaute WRInaute impliqué
    Inscrit:
    18 Octobre 2003
    Messages:
    713
    J'aime reçus:
    0
    Merci Monique, Indigène,América, Kob,

    Comment tu as fais pour trouver le bloc America :lol: qui peche, je viens de faire le test
    en supprimant le bloc incriminé et ca passe! je vais corrigé au plus vite, il ya a juste un point l'id css à utiliser une fois dans une page, j'ai jamais lu ca!
    Merci

    icroyable mais vrai! sur le bloc incriminé, j'ai supprimé des etoiles liens pour que ca marche
    dès que je veux en mettre une 3ieme, lynx ne voit plus mon site!
     
  30. Americas
    Americas WRInaute accro
    Inscrit:
    24 Septembre 2003
    Messages:
    2 587
    J'aime reçus:
    0
    La méthode empirique... ya rien de mieux !!! :wink: tu retires du code tout ce qui te semble suspect et tu fais un test... j'ai du procéder par étape pour me rendre compte que l'erreur venait de là...

    à savoir pourquoi Lynx ne voyait pas cette partie et pourquoi il refusait d'affichait la page alors que 70% de tout ce qui était en haut de la page était bon... ça... je n'en sais rien... il pourrait au moins afficher le code valide :roll:
     
  31. Lentreprenaute
    Lentreprenaute WRInaute impliqué
    Inscrit:
    18 Octobre 2003
    Messages:
    713
    J'aime reçus:
    0
    comme tu dis la methode empirique!
    Vu la construction de mes pages j'aurai jamais cherché sur cette partie, :lol:
    un des seuls blocs statiques du site fait avec dreamweaver;

    ce qui est bizarre si je mets trois etoiles sur la partie gauche ca ne passe pas???
    deux oui, enfin je laisse comme ca dans un premier temps, j'espere qu GG ca va lui plaire
    et un grand merci, pour le peine que tu t'es donné!!
     
  32. Americas
    Americas WRInaute accro
    Inscrit:
    24 Septembre 2003
    Messages:
    2 587
    J'aime reçus:
    0
    Tu utilises cette usine à gaz ??? 8O Moi... quand j'ai vu le code généré par ce truc... j'ai vite abandonné... rien de mieux que des petits éditeurs style webexpert et le notepad de windows :lol:
     
  33. Lentreprenaute
    Lentreprenaute WRInaute impliqué
    Inscrit:
    18 Octobre 2003
    Messages:
    713
    J'aime reçus:
    0
    Pour info,

    J'avais un probleme de visiblité de mon site avec le lynx qui affichait page blanche,mais mon site est indéxé depuis aujourd'hui avec les pages qui correspondent à celle que lynx n'affichait pas.

    voila pour info donc
     
  34. crindor
    crindor WRInaute impliqué
    Inscrit:
    22 Novembre 2002
    Messages:
    888
    J'aime reçus:
    0
  35. Americas
    Americas WRInaute accro
    Inscrit:
    24 Septembre 2003
    Messages:
    2 587
    J'aime reçus:
    0
    Faudrait regarder de plus près :wink:

    La page arrive en première position sur ta requête... mais si la page n'est pas visible sur lynx... c'est qu'il y a un problème...

    Pour s'en rendre compte il suffit de faire :
    https://www.google.fr/search?hl=fr&ie=UT ... ogle&meta=

    Aucun backlink :roll: ... le problème est réel :lol:

    Il y a de fortes chances que le site ait perdu ses backlinks parce que Google n'a pu suivre les liens :wink:
     
  36. crindor
    crindor WRInaute impliqué
    Inscrit:
    22 Novembre 2002
    Messages:
    888
    J'aime reçus:
    0
    pas du tout, ce site a été mis en ligne depuis moins d'une semaine
    il n'a pas eu le temps d'avoir des blacklinks le bougre
     
  37. Americas
    Americas WRInaute accro
    Inscrit:
    24 Septembre 2003
    Messages:
    2 587
    J'aime reçus:
    0
    Tu utilises un générateur de mots clés ou quoi sur ce site ? 8O
    La plupart des pages indexées dan Google ont presque toutes en début de page la mention : Votre demande est " truc bidule" 8O

    Je connais d'autres sites qui font ça... à plus grande échelle car ils sont là depuis plusieurs mois et ils trustent les premières positions :evil:
     
  38. crindor
    crindor WRInaute impliqué
    Inscrit:
    22 Novembre 2002
    Messages:
    888
    J'aime reçus:
    0
    non, j'ai simplement une liste de destinations et chacune d'elles a sa page
    si c'est le meme titre c'est simplement parce que je ne suis pas inventif

    ceci dit, çà me vexerait si tu me compares au truc qui commence par fr et et qui finit par oo
     
  39. Lentreprenaute
    Lentreprenaute WRInaute impliqué
    Inscrit:
    18 Octobre 2003
    Messages:
    713
    J'aime reçus:
    0
    perso, je vais dans le sens de crindor, après m'etre soucié que mon site ne s'indexait pas, ce qui est le cas depuis peu, google a indexé des pages que lynx ne voyait pas!!
    que j'ai corrigé par la suite
     
  40. Americas
    Americas WRInaute accro
    Inscrit:
    24 Septembre 2003
    Messages:
    2 587
    J'aime reçus:
    0
    Après avoir regarder sur ton site... en effet... ce n'est pas un générateur de liens. Excuse-moi pour mas suspicion, mais comme les pages mettent un certain temps avant de s'afficher, j'ai pensé à la présence d'un script générant ces mots clés :oops:

    Mais c'est vrai qu'il y en a marre de ces sites qui commencent en fr et qui finissent en oo... surtout quand on essaye de se positionner sur un secteur où ils trustent les premières places...

    Bon... il ne me reste plus qu'à faire comme toi... générer des pages par destinations avec toute une liste de mots clés placés sur les pages... merci pour l'idée :wink:
     
  41. crindor
    crindor WRInaute impliqué
    Inscrit:
    22 Novembre 2002
    Messages:
    888
    J'aime reçus:
    0
    plus qu'une liste de mots clés , c'est surtout un moyen pour que les moteurs suivent les liens sans être obligé de faire un plan de site avec 300 urls

    mais le contenu n'est que provisoire, je voulais juste gagner du temps pour le référencement, de plus çà sera utile aussi pour le visiteur
     
Chargement...
Similar Threads - Indexation cache Forum Date
Desindexation de pages avec erreur de cache Google Crawl et indexation Google, sitemaps 25 Septembre 2014
Divs cachées en CSS et indexation des moteurs Débuter en référencement 12 Février 2010
Indexation des liens contenus dans un menu caché Débuter en référencement 20 Mars 2009
Texte caché et indexation ?! Crawl et indexation Google, sitemaps 19 Janvier 2009
Indexation Google refusée Crawl et indexation Google, sitemaps il y a 18 minutes
WordPress Désindexation / réindexation Débuter en référencement Jeudi à 12:21
Indexation longue depuis quelques jours :/ Problèmes de référencement spécifiques à vos sites Mercredi à 08:29
Site piraté - indexation massive Problèmes de référencement spécifiques à vos sites Mardi à 16:46
Comment accélérer la désindexation de pages en noindex Crawl et indexation Google, sitemaps Dimanche à 16:54
Problèmes d'indexation et robots.txt Crawl et indexation Google, sitemaps 14 Octobre 2019
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice