cas très curieux : certaines pages de mon site sont complétement ignorées par google

Discussion dans 'Crawl et indexation Google, sitemaps' créé par aladdin, 17 Mars 2010.

  1. aladdin
    aladdin WRInaute passionné
    Inscrit:
    29 Avril 2005
    Messages:
    1 246
    J'aime reçus:
    0
    Bonjour à tous

    Je suis entrain d'étudier un cas curieux sur mon site, en effet certaines pages présentes depuis des mois n'ont jamais été indexées par google !
    exemple d'une page ignorée: -http://www.oujdacity.net/staff-oujdacity-fr.html
    et là c une rubriques carrement qui est ignorée : -http://www.oujdacity.net/service-emploi-fr.html

    à la limite si google avait indexé ces pages puis les a caché à cause d'un duplicate content ou autre j'aurais compris mais le fait qu'il les ignore carrément ... je ne comprend pas.


    Quelqu'un aurait une idée ? :D
     
  2. HawkEye
    HawkEye WRInaute accro
    Inscrit:
    23 Février 2004
    Messages:
    13 932
    J'aime reçus:
    4
    Code:
    <link rel="canonical" href="http://www.oujdacity.net/">
    Si tu déclares que l'URL canonique est la racine du site, c'est normal qu'il désindexe la page... :roll:
     
  3. aladdin
    aladdin WRInaute passionné
    Inscrit:
    29 Avril 2005
    Messages:
    1 246
    J'aime reçus:
    0
    arf ! celle là je l'avais complètement mais complétement zappé :s
    j'ai mis un code qui genère automatiquement le link canonical .... je pense qu'il faudrais revoir l'algo !

    merci en tout cas je regarde ca de suite :)
     
  4. aladdin
    aladdin WRInaute passionné
    Inscrit:
    29 Avril 2005
    Messages:
    1 246
    J'aime reçus:
    0
    voilà, bug corrigé !

    google est assez malin pour detecter le changement ? ou je dois lui notifier ? :)
     
  5. artscoop
    artscoop WRInaute discret
    Inscrit:
    17 Octobre 2008
    Messages:
    238
    J'aime reçus:
    0
    Ok, j'espère que ce cas-là est résolu, mais si quelqu'un peut résoudre le même mystère pour cette page : http://www.lovelive.fr/page/video/palindrome-rever-cest-se-crever
    (Page ignorée par Google depuis le 12 décembre). Ça m'intéresserait.

    Page de recherche : https://www.google.fr/search?hl=fr&safe=off&client=firefox-a&rls=com.ub ... =&gs_rfai=
    (Les résultats de recherche contiennent des liens vers la page mais pas la page)

    Je n'ai ce problème qu'avec des pages contenant des vidéos, mais seulement quelques unes.
     
  6. dd32
    dd32 WRInaute accro
    Inscrit:
    9 Septembre 2005
    Messages:
    2 732
    J'aime reçus:
    0
  7. aladdin
    aladdin WRInaute passionné
    Inscrit:
    29 Avril 2005
    Messages:
    1 246
    J'aime reçus:
    0
    faut dire qu'il est sevère le nouveau filtre du duplicate content :lol: , c'est pour celà d'ailleur que je me suis précipité à écrire un algo pour detecter moi même mes duplicates et générer le canonical url :)
     
  8. artscoop
    artscoop WRInaute discret
    Inscrit:
    17 Octobre 2008
    Messages:
    238
    J'aime reçus:
    0
    C'est étrange. Si tu vas jeter un coup d'œil à ces pages (qui n'ont pas changé depuis décembre) tu verras que le texte n'est pas celui que Google affiche. Même le cache des pages ne contient pas ce texte.

    D'ailleurs, je viens de tester « Analyser comme GoogleBot » dans GWT, et Google m'indique que cette page qui n'apparaît pas dans les SERP est un 404. Pourtant n'importe qui peut y accéder...
     
  9. artscoop
    artscoop WRInaute discret
    Inscrit:
    17 Octobre 2008
    Messages:
    238
    J'aime reçus:
    0
    Sur mes articles de blog j'ai ajouté le canonical pour éviter les conneries (on sait jamais).
    Sur mes pages avec vidéos j'y ai pas pensé mais là on est dans la quatrième dimension : cache incohérent avec la description dans les SERP, page présente et accessible mais en 404 selon Google...
    Ou pas pour le 404, j'ai testé une mauvaise URL :oops: Mais ça ne change rien, c'est toujours incompréhensible :?:
     
  10. aladdin
    aladdin WRInaute passionné
    Inscrit:
    29 Avril 2005
    Messages:
    1 246
    J'aime reçus:
    0
  11. artscoop
    artscoop WRInaute discret
    Inscrit:
    17 Octobre 2008
    Messages:
    238
    J'aime reçus:
    0
    Je pense que ce n'est pas ça, parce que le canonical est présent sur toutes les autres pages d'articles du site (avec un 301 vers l'URL clean), et toutes celles sans vidéo sont indexées un jour ou l'autre. :?

    Je viens de modifier les pages qui apparaissent en duplicate, je verrai bien ce que ça donnera d'ici quelques jours...
     
Chargement...
Similar Threads - très curieux complétement Forum Date
FB "Votre message ne peut être envoyé car d’autres personnes ont signalé son contenu comme abusif." Facebook 28 Juin 2020
WordPress Passer d'une bonne position à une très bonne position Débuter en référencement 18 Juin 2020
Exploiter une page très active Demandes d'avis et de conseils sur vos sites 4 Juin 2020
Search Console Problème indexation très faible Crawl et indexation Google, sitemaps 19 Mai 2020
Astuce URL + paramètres VS balise noindex Demandes d'avis et de conseils sur vos sites 13 Mai 2020
Extensions Chrome très utiles au SEO Référencement Google 30 Avril 2020
Besoin de booster mon référencement très rapidement :) Débuter en référencement 19 Avril 2020
Accepter des paiements autres que via Paypal (CB, RICE, cryptos, what else?) Monétisation d'un site web 8 Avril 2020
Profiter d'une page bien référencée pour orienter vers d'autres contenus (en particulier Youtube) Demandes d'avis et de conseils sur vos sites 28 Mars 2020
Astuce Otage financier: OVH et autres, une nouvelle tendance? Le café de WebRankInfo 6 Mars 2020
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice