cas très curieux : certaines pages de mon site sont complétement ignorées par google

Discussion dans 'Crawl et indexation Google, sitemaps' créé par aladdin, 17 Mars 2010.

  1. aladdin
    aladdin WRInaute passionné
    Inscrit:
    29 Avril 2005
    Messages:
    1 246
    J'aime reçus:
    0
    Bonjour à tous

    Je suis entrain d'étudier un cas curieux sur mon site, en effet certaines pages présentes depuis des mois n'ont jamais été indexées par google !
    exemple d'une page ignorée: -http://www.oujdacity.net/staff-oujdacity-fr.html
    et là c une rubriques carrement qui est ignorée : -http://www.oujdacity.net/service-emploi-fr.html

    à la limite si google avait indexé ces pages puis les a caché à cause d'un duplicate content ou autre j'aurais compris mais le fait qu'il les ignore carrément ... je ne comprend pas.


    Quelqu'un aurait une idée ? :D
     
  2. HawkEye
    HawkEye WRInaute accro
    Inscrit:
    23 Février 2004
    Messages:
    13 933
    J'aime reçus:
    4
    Code:
    <link rel="canonical" href="http://www.oujdacity.net/">
    Si tu déclares que l'URL canonique est la racine du site, c'est normal qu'il désindexe la page... :roll:
     
  3. aladdin
    aladdin WRInaute passionné
    Inscrit:
    29 Avril 2005
    Messages:
    1 246
    J'aime reçus:
    0
    arf ! celle là je l'avais complètement mais complétement zappé :s
    j'ai mis un code qui genère automatiquement le link canonical .... je pense qu'il faudrais revoir l'algo !

    merci en tout cas je regarde ca de suite :)
     
  4. aladdin
    aladdin WRInaute passionné
    Inscrit:
    29 Avril 2005
    Messages:
    1 246
    J'aime reçus:
    0
    voilà, bug corrigé !

    google est assez malin pour detecter le changement ? ou je dois lui notifier ? :)
     
  5. artscoop
    artscoop WRInaute discret
    Inscrit:
    17 Octobre 2008
    Messages:
    238
    J'aime reçus:
    0
    Ok, j'espère que ce cas-là est résolu, mais si quelqu'un peut résoudre le même mystère pour cette page : http://www.lovelive.fr/page/video/palindrome-rever-cest-se-crever
    (Page ignorée par Google depuis le 12 décembre). Ça m'intéresserait.

    Page de recherche : https://www.google.fr/search?hl=fr&safe=off&client=firefox-a&rls=com.ub ... =&gs_rfai=
    (Les résultats de recherche contiennent des liens vers la page mais pas la page)

    Je n'ai ce problème qu'avec des pages contenant des vidéos, mais seulement quelques unes.
     
  6. dd32
    dd32 WRInaute accro
    Inscrit:
    9 Septembre 2005
    Messages:
    2 733
    J'aime reçus:
    0
  7. aladdin
    aladdin WRInaute passionné
    Inscrit:
    29 Avril 2005
    Messages:
    1 246
    J'aime reçus:
    0
    faut dire qu'il est sevère le nouveau filtre du duplicate content :lol: , c'est pour celà d'ailleur que je me suis précipité à écrire un algo pour detecter moi même mes duplicates et générer le canonical url :)
     
  8. artscoop
    artscoop WRInaute discret
    Inscrit:
    17 Octobre 2008
    Messages:
    238
    J'aime reçus:
    0
    C'est étrange. Si tu vas jeter un coup d'œil à ces pages (qui n'ont pas changé depuis décembre) tu verras que le texte n'est pas celui que Google affiche. Même le cache des pages ne contient pas ce texte.

    D'ailleurs, je viens de tester « Analyser comme GoogleBot » dans GWT, et Google m'indique que cette page qui n'apparaît pas dans les SERP est un 404. Pourtant n'importe qui peut y accéder...
     
  9. artscoop
    artscoop WRInaute discret
    Inscrit:
    17 Octobre 2008
    Messages:
    238
    J'aime reçus:
    0
    Sur mes articles de blog j'ai ajouté le canonical pour éviter les conneries (on sait jamais).
    Sur mes pages avec vidéos j'y ai pas pensé mais là on est dans la quatrième dimension : cache incohérent avec la description dans les SERP, page présente et accessible mais en 404 selon Google...
    Ou pas pour le 404, j'ai testé une mauvaise URL :oops: Mais ça ne change rien, c'est toujours incompréhensible :?:
     
  10. aladdin
    aladdin WRInaute passionné
    Inscrit:
    29 Avril 2005
    Messages:
    1 246
    J'aime reçus:
    0
  11. artscoop
    artscoop WRInaute discret
    Inscrit:
    17 Octobre 2008
    Messages:
    238
    J'aime reçus:
    0
    Je pense que ce n'est pas ça, parce que le canonical est présent sur toutes les autres pages d'articles du site (avec un 301 vers l'URL clean), et toutes celles sans vidéo sont indexées un jour ou l'autre. :?

    Je viens de modifier les pages qui apparaissent en duplicate, je verrai bien ce que ça donnera d'ici quelques jours...
     
Chargement...
Similar Threads - très curieux complétement Forum Date
Redirection url avec paramètres tracking Google Analytics 23 Novembre 2019
WordPress La densité des mots-clés et autres - Arnaques SEO ? Rédaction web et référencement 22 Novembre 2019
Testeur Neilpatel : nb de visites TRES différent de Google Analytics Référencement Google 18 Novembre 2019
Très peu de pages indexées par Google Problèmes de référencement spécifiques à vos sites 8 Octobre 2019
Trafic direct très élevé Google Analytics 8 Octobre 2019
Affichage des urls dans google : url de la home et urls des autres pages d'un site Problèmes de référencement spécifiques à vos sites 1 Octobre 2019
Résultats issus de Google Contacts et autres Référencement Google 3 Septembre 2019
Logiciel de montage vidéo très simple ? Le café de WebRankInfo 12 Août 2019
recherche lettres dans mysql Développement d'un site Web ou d'une appli mobile 11 Juillet 2019
Google analytics, sous-domaine et filtres Google Analytics 21 Juin 2019
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice