Seulement 1/7 de pages indexées

Discussion dans 'Crawl et indexation Google, sitemaps' créé par logokala, 19 Octobre 2007.

  1. logokala
    logokala Nouveau WRInaute
    Inscrit:
    15 Mars 2007
    Messages:
    15
    J'aime reçus:
    0
    Bonjour,
    je reviens sur ce forum après avoir appliqué les conseils qui m'y ont été donnés.

    Petite recap : mon site inkiti.com a plus de 1700 pages (des dizaines de nouvelles par jour). A l'époque où j'ai posté mon premier message il y avait seulement 190 pages indexées. Depuis, j'ai soumis à Google un sitemap et obtenu beaucoup de nouveaux liens entrants.

    Malgré ce, je reste bloqué à 260 pages indexées, pas plus.

    Mes questions :
    1/ cette situation est-elle normale ? Y a t il autre chose a faire pour indexer les pages qui ne le sont pas encore ?

    2/ Comment font les sites qui ont des centaines de nouvelles pages tous les jours pour les indexer très vite dans Google ?

    Merci à tous, une nouvelle fois, pour votre analyse.

    LG
     
  2. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 974
    J'aime reçus:
    121
  3. logokala
    logokala Nouveau WRInaute
    Inscrit:
    15 Mars 2007
    Messages:
    15
    J'aime reçus:
    0
    Ok merci du tuyau pour les ID de session, je ne savais pas.

    Question : comment faire pour supprimer les ID de session ? (l'url rewriting ne change rien au probleme d'apres ce que j'ai compris). Donc il faut obligatoirement utiliser les cookies ?

    LG
    PS: pour la commande, oui c'est bien celle que j'utilise (elle montre seulement 260 pages indexées)
     
  4. erestrebian
    erestrebian WRInaute occasionnel
    Inscrit:
    15 Juin 2007
    Messages:
    411
    J'aime reçus:
    0
    Code:
    	ini_set("session.use_trans_sid", "0");
    en début de code devrait te permettre d'avoir des url "propres".... J'avais le même problème au tout début...
     
  5. logokala
    logokala Nouveau WRInaute
    Inscrit:
    15 Mars 2007
    Messages:
    15
    J'aime reçus:
    0
    ça nettoie les url mais est-ce que ça permet vraiment de régler le probleme des id session ?

    Ça a été efficace dans ton cas ?
     
  6. erestrebian
    erestrebian WRInaute occasionnel
    Inscrit:
    15 Juin 2007
    Messages:
    411
    J'aime reçus:
    0
    pour ton site on voit:

    Code:
    &PHPSESSID=bda934154ad07a6bd41bf7a6a8ba5d38
    avec "session.use_trans_sid" l'identifiant de session est transmis de manière invisible de page en page...

    pour ça :

    Code:
    ?scrw=1280 
    il faut que tu vois dans la partie url rewritting de ce forum...

    je sais qu'à une époque il était pénalisant au niveau référencement d'avoir des url avec des variables... Est-ce toujours le cas? Je ne sais pas mais je trouve que ça fait plus professionnel d'utiliser la réécriture d'url!

    poru répondre à ta question
    de pas référencé du tout (à cause de l'extension en .php5) à un tout petit peu (5 pages après avoir remplacer .php5 par .html), je suis passé à 40 pages pour un site qui n'en comprenait pas tant que ça (après avoir virer l'identifiant session de l'url) et depuis que je me suis mis au sitemap et à wri : 738 mais je suis limité par la vitesse d'exploration (quand googlebot passe en vitesse le site est quasiment out), c'est pourquoi je m'occupe à virer tous les tableaux que notre gentil professeur de html nous avait suggérer à l'époque pour faire les présentations de nos sites (je le maudis sur 5 générations)...
     
  7. logokala
    logokala Nouveau WRInaute
    Inscrit:
    15 Mars 2007
    Messages:
    15
    J'aime reçus:
    0
    je me trompe peut-être mais le fait que l'id de session soit rendu invisible ne change rien pour l'indexation Google. Le robot continue, lui, de voir qu'il y a des id de sessions. Ce qui rend toujours aussi difficile un bonne indexation des pages. Je me trompe ?
     
  8. erestrebian
    erestrebian WRInaute occasionnel
    Inscrit:
    15 Juin 2007
    Messages:
    411
    J'aime reçus:
    0
    quand tu regarde mon -www- il n'y a plus aucun identifiant session passé dans l'url.

    si tu utilises les outils pour le webmaster de google tu t'aperçois qu'il référence tes pages avec l'identifiant de session... si tu en est pas persuadé :

    https://www.google.fr/search?hl=fr&q=sit ... cher&meta=

    du coup pour lui

    monsite/mapage.php?PHPSESSID=123

    et

    monsite/mapage.php?PHPSESSID=3456

    sont deux pages différentes donc contenu dupliqué. Si tes url ne comportent pas d'identifiant session, google ne prend que l'url qui est affiché et n'est pas capable de connaitre l'id qui lui a été attribué.
    D'autre part, ça pose un problème au niveau de la sécurité puisque les gens qui cliquent dans google se voient attribuer l'id de session qu'avait le googlebot lors de son passage (ça je n'en suis pas sûr mais il me semble l'avoir vu quelque part). Du coup, à un instant T, deux sessions peuvent avoir le même id (à vérifier)...
     
Chargement...
Similar Threads - Seulement indexées Forum Date
3% des images du sitemap indexées seulement Crawl et indexation Google, sitemaps 9 Avril 2018
Seulement 3 pages de mon site sur 8 sont indexées, pourquoi ? Crawl et indexation Google, sitemaps 6 Mai 2014
748 pages dans google sitemap mais seulement 446 indexées ? Crawl et indexation Google, sitemaps 13 Mars 2010
Seulement 66 pages indexées sur 1752 Crawl et indexation Google, sitemaps 14 Septembre 2009
Mon site a 3 mois mais seulement 4 pages indexées Problèmes de référencement spécifiques à vos sites 23 Mars 2009
Seulement 5% de mes pages indexées sur Google Actualités Google : l'entreprise, les sites web, les services 26 Janvier 2006
seulement deux pages indexées... pourquoi ? Débuter en référencement 17 Août 2005
Seulement deux pages indexées par Google : pourquoi ? Débuter en référencement 27 Avril 2005
Prise en compte de GA seulement de la page de connexion Google Analytics 3 Mai 2022
Beaucoup d'articles et seulement 12 visites/jour Problèmes de référencement spécifiques à vos sites 25 Juin 2021
80k page vues /jour mais seulement 1,5k sur adsense AdSense 21 Avril 2021
Search Console +1000 pages valides sur Search console mais seulement 4 sur les résultats de "site:" Problèmes de référencement spécifiques à vos sites 18 Septembre 2020
Etre dans le top 3 des résultats de recherche seulement avec une stratégie de contenu ? Référencement Google 17 Septembre 2019
email (seulement) vers hotmail impossible alors que tout est au vert Développement d'un site Web ou d'une appli mobile 9 Septembre 2019
1 catégorie seulement sur le site Demandes d'avis et de conseils sur vos sites 14 Octobre 2018
Générer du trafic avec les photos : sitemap ou seulement "alt" ? Débuter en référencement 31 Juillet 2017
Comment Autoriser seulement Google à avoir un lien direct URL Rewriting et .htaccess 13 Février 2017
Desindexation page accueil et pages menu seulement Crawl et indexation Google, sitemaps 4 Août 2016
Seulement certains articles en anglais dans un site français Référencement international (langues, pays) 13 Juin 2016
Problème de maillage interne et pas seulement Problèmes de référencement spécifiques à vos sites 12 Janvier 2016