[Problème] Indexation/Crawl d'un site

Discussion dans 'Crawl et indexation Google, sitemaps' créé par mikaelka, 18 Mars 2009.

  1. mikaelka
    mikaelka Nouveau WRInaute
    Inscrit:
    24 Décembre 2007
    Messages:
    30
    J'aime reçus:
    0
    Bonjour,
    j'ai un problème d'indexation sur mon site, en effet Google n'indexe pas voir peu de page (seulement 100/33000 en 2 mois).

    Voici les quelques informations concernant mon site :
    Adresse : misterio.fr
    Date d'ouverture à Google le 24/01/2009
    site:www.misterio.fr = 108 pages indexées

    Je ne trouve pas la raison qui fait que mon site n'est pas correctement indexé, et ce malgré mes BL. En effet cela fait 3 semaines voir plus que je stagne à une centaine de page...
    Je suis sur 90 plan j'ai donc pensé que le problème venait de là, étant donné que Ovh a connu des soucis le mois derniers (mais ils sont normalement réglés...).

    Je ne pense pas avoir fait d'erreur dans mes balises meta, la structuration de mes pages semble correcte, et des robots de crawl qui permettent de créer des sitemap arrivent a crawler entièrement le site... Les pages sont basées sur le mm rewrite et certaines sont indexés d'autre pas, je ne pense donc pas que le problème vienne de là non plus mais sait-on jamais...

    Cela n'a peut être rien avoir mais mon blog (hébergé sur le même mutualisé à connu un gros coup de (dé)référencement (sur certaines requêtes).. j'ai pensé à un blacklistage de l'ip du serveur par Google mais un autre site que j'héberge est encore fonctionnel sur GG.

    Si j'ai mal fait quelque chose ou omis un détail, important. Si quelqu'un a une idée d'où pourrait provenir le problème, j'ai essayé de donner le plus d'infos possibles.

    Merci d'avance pour votre aide.
    Mika.
     
  2. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    31 566
    J'aime reçus:
    280
    Bon retour mikaelka sur le forum de WebRankInfo.

    Vous pouvez ajouter un Sitemaps dans les outils de Google Webmaster Tools :
    https://www.google.com/webmasters/tools/ .
    Vous pouvez aussi vérifier les crawls de Google sur les outils du Webmaster Tools.

    Google en ce moment met un peu plus de temps à indexer les nouvelles pages.

    Compléments OVH :
    forum.webrankinfo.com/ovh-90plan-googlebot-again-t106651.html
    travaux.ovh.net/?do=details&id=2881

    N’hésitez pas mikaelka à participer sur le forum, pour partager vos connaissances, donnez votre avis sur d'autres topics,
    vous aurez alors un rôle constructif dans notre communauté et chacun pourra ainsi évoluer dans le référencement.
     
  3. mikaelka
    mikaelka Nouveau WRInaute
    Inscrit:
    24 Décembre 2007
    Messages:
    30
    J'aime reçus:
    0
    Bonjour,
    Je sais naturellement comment ajouter un sitemap sur Webmaster Tool. Et il n'y a également aucune erreurs signalé sur cet outils.

    Je me m'inquiète simplement car le site à été réalisé en simultané avec un concours de référencement dans ma licence et que comparativement d'autres sites sont très bien indexés malgré qu'ils n'aient aucun BL et qu'il est ouvert il y a seulement Quelques semaines.

    Pour ce qui est des problème Ovh que vous mettez en lien j'ai avant de poster cette demande regardé et la tâche sur Ovh est noté comme Close depuis fin février. (de plus des retours font preuve que le problème est terminé http://blog.websourcing.fr/blog/2009/03/03/breve-probleme-de-crawling-google-regle-chez-ovh/), cela dit je veux bien pensé que le problème existe encore, et si d'autres membres en sont témoins cela validerais cette hypothèse...

    Merci quand même pour cette réponse Madrileño

    EDIT : Je n'hésiterais pas à répondre à d'autres problèmes, si j'ai la solution, comme je le fait sur les forums où je suis inscrit ;)

    Mika
     
  4. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    31 566
    J'aime reçus:
    280
    Le site est assez récent, le manque de liens ou l'architecture sont de possibles explications pour un manque d'indexation des pages.
     
  5. mikaelka
    mikaelka Nouveau WRInaute
    Inscrit:
    24 Décembre 2007
    Messages:
    30
    J'aime reçus:
    0
    Bonjour,
    Je pense aussi que ça peut venir de la construction des pages, j'ai légèrement modifiée celle-ci il y a 4 jours, mais l'effet ne se ressent pas et c'est sûrement normal...

    GG tourne en rond sur les même page il visite environ 40 pages par jour mais ce sont tjs les même (cf : graph, Nombre de kilo-octets téléchargés par jour et Temps de téléchargement d'une page (en millisecondes), qui sont tous les deux à 0 et Nombre de pages explorées par jour étant à 40).

    Je vais voir à faire de nouvelles modifications à ce niveau là.
    Si vous avez d'autres points de vues je suis preneur.

    Merci Madrileño pour vos réponses. ;)

    Bonne journée.
    Mika.
     
  6. HawkEye
    HawkEye WRInaute accro
    Inscrit:
    23 Février 2004
    Messages:
    13 858
    J'aime reçus:
    5
    "33.000" m'ayant mis la puce à l'oreille (proche du nombre de localités en France), je suis allé voir ton site et, effectivement, il semble bien que tu t'attendes à ce que Google te crawl 33.000 pages pratiquement identiques - et vides.

    Lorsque tu conçois un site comme ça, tu dois veiller à ce que le maillage soit restreint aux pages qui présentent du contenu, et éviter à tout prix de laisser indexer des milliers de pages en total duplicate.

    En plus de ça, je crains fort que ton footer ne te place ipso facto dans la catégorie "vilain petit spammeur" :( Faire des échanges de liens c'est bien... mais il faut tout de même rester un poil raisonnable :D
     
  7. mikaelka
    mikaelka Nouveau WRInaute
    Inscrit:
    24 Décembre 2007
    Messages:
    30
    J'aime reçus:
    0
    J'apprécie votre réponse HawkEye (vraiment).

    Oui c'est bien les localités de France ;)

    Je pense que vous avez raison sur le duplicate, ce doit être le facteur (avec d'autres sûrement) prédominant dans mon problème. Je ne vais malheureusement pas pouvoir le réglé (tout du moins pas pour l'instant... enfin bon bref ^^), il est dur d'indexer des pages qui n'ont pas de contenus tant que les utilisateurs n'en n'ont pas laissé et la version "alpha/beta" est loin d'être terminée, j'ai mis le site en ligne pour un TP dont le sujet est en partie d'indexer le plus grand nombre de page, je suis donc très mal partit (voir arrivé puisque c'est bientôt terminé ^^).

    Pour ce qui est du "vilain petit spammeur", mon footer est assez immonde en effet et ça ne sert strictement à rien, cela dit je les retirerais dans un mois, une fois le TP terminé, se sont simplement tous les sites qui font le même TP ^^, je n'aurais jamais mit autant de lien sur un de mes sites dans un autre cas ^^.

    Mais bon tous les étudiants ont fait "le même footer" et n'ont pas "vraiment" de problème d'indexation, je pense donc que c'est plus la "faute" du duplicate,

    Merci HawkEye, de m'avoir éclairé sur la source du problème, je pensais que la "pauvre desc" avec la localité ainsi que les titres qui diffèrent et des liens aléatoires auraient suffit à "contrer" l'effet duplicate, mais enfin bon tant pis pour moi je vais difficilement pouvoir faire autrement...

    Merci, Bonne soirée.
    Mika.
     
  8. Mpic
    Mpic WRInaute occasionnel
    Inscrit:
    22 Août 2008
    Messages:
    313
    J'aime reçus:
    1
    + 1 Pour le footer, Enlève les sans un mois sans faute alors :)

    J'ai un de mes site où j'ai quelques pages en plus chaque jours (contenu créée par les visiteurs) et google les index en quelques heures, donc à ce niveau là Google reste efficace bien que, un de mes autre site a du mal pour la mise à jour des metas description sur le moteur de recherche :? (description changé depuis 4 jours et toujours aucun changement)

    As tu un sitemap bien fait (fonctionnel), les liens entre les pages sont-ils optimisés?

    Enfin, a tu du nouveau contenu fréquemment? autrement dit, donnes tu au bot Google l'envie de resté sur le site.
     
  9. mikaelka
    mikaelka Nouveau WRInaute
    Inscrit:
    24 Décembre 2007
    Messages:
    30
    J'aime reçus:
    0
    Sans faute ;)

    Fonctionnel je sais pas trop, mais je le fais grâce a des scripts perso, c'est basique http://www.misterio.fr/Sitemap/annuaire.xml (si vous voulez me donner votre avis) mais bon c'est organisé comme il faut trié par date de mise à jour du plus récent au plus ancien, normal...
    J'avoue que la structuration des pages et l'indexation n'est pas une science que je maîtrise pour le moment, j'ai bien mis les url des régions tout en haut pour qu'il suive l'arborescence mais bon si vous avez des critiques ou des conseil sur ce point je suis preneur.

    Cette méthode ne s'avère pas très efficace sur des sites jeune, autant sur des blogs ou des sites étant plus anciens, le ping de google + date dans le sitemap est utile autant sur les site nouveau c'est totalement inutile.

    Merci Mpic pour ton message !!!

    Mika.
     
  10. HawkEye
    HawkEye WRInaute accro
    Inscrit:
    23 Février 2004
    Messages:
    13 858
    J'aime reçus:
    5
    De diverses manières, il est possible d'intégrer à ton script une petite vérification du nombre de résultats pour chaque "catégorie", et de sauver ce résultat dans une colonne supplémentaire de la db.

    A partir de là, il devient très simple de conditionner l'affichage du lien vers la catégorie (ajouter un rel="nofollow" sur celles qui n'ont pas de contenu), ainsi que l'affichage d'une meta robots en "noindex" ;)

    C'est la solution que j'utilise.
     
  11. mikaelka
    mikaelka Nouveau WRInaute
    Inscrit:
    24 Décembre 2007
    Messages:
    30
    J'aime reçus:
    0
    Merci Hawk Bonne idée ;)

    Cela dit cela prouve bien que Google n'aime vraiment pas le duplicate xD (seulement 190 pages indexées à ce jour)

    Merci à tous pour vos réponses !
     
  12. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    31 566
    J'aime reçus:
    280
    Merci pour votre participation sur le forum.
     
Chargement...
Similar Threads - [Problème] Indexation Crawl Forum Date
[Resolu][Probleme] Desindexation des pages impossible Crawl et indexation Google, sitemaps 7 Février 2007
[Problème] Affichage des 10 derniers sujets de mon forum Développement d'un site Web ou d'une appli mobile 31 Mars 2016
[Problème] Suppression Admin impossible Google Analytics 4 Mai 2015
le css d'une page web [probleme] Développement d'un site Web ou d'une appli mobile 23 Décembre 2009
passer une var $_GET['page'] ou non [Probleme] URL Rewriting et .htaccess 23 Décembre 2009
[Problème] Affichage des accents ! Développement d'un site Web ou d'une appli mobile 12 Octobre 2009
[PROBLEME] Référencement Croisé, mauvaise adresse Noms de domaine et référencement 25 Octobre 2008
[Problème] - Fatal error Joomla_1[1].5.2_to_1.5.7 Développement d'un site Web ou d'une appli mobile 15 Septembre 2008
[problème] probleme de récriture dynamique URL Rewriting et .htaccess 24 Avril 2008
[probleme] css onglet = penalite ? Développement d'un site Web ou d'une appli mobile 27 Mars 2007
[Problème] Démonstration de math Le café de WebRankInfo 14 Septembre 2004
référencement site en anglais : indexation plus longue Référencement international (langues, pays) Vendredi à 00:39
Problème d'indexation Produits Prestashop Crawl et indexation Google, sitemaps 28 Avril 2022
Problème indexation pages précises en React.js Débuter en référencement 19 Avril 2022
Pourquoi ne pas utiliser le robots.txt pour interdire l'indexation ? Débuter en référencement 14 Avril 2022
Conseil pour accélérer l'indexation de mon nouveau site Problèmes de référencement spécifiques à vos sites 9 Avril 2022
Comment puis-je obtenir l'indexation instantanée de Google ? Débuter en référencement 28 Mars 2022
Questions URL canonique, crawl et indexation Débuter en référencement 25 Mars 2022
Indexation de mon site dans Google Problèmes de référencement spécifiques à vos sites 13 Mars 2022
Search Console Problème d'indexation Crawl et indexation Google, sitemaps 24 Février 2022