cas très curieux : certaines pages de mon site sont complétement ignorées par google

WRInaute passionné
Bonjour à tous

Je suis entrain d'étudier un cas curieux sur mon site, en effet certaines pages présentes depuis des mois n'ont jamais été indexées par google !
exemple d'une page ignorée: -http://www.oujdacity.net/staff-oujdacity-fr.html
et là c une rubriques carrement qui est ignorée : -http://www.oujdacity.net/service-emploi-fr.html

à la limite si google avait indexé ces pages puis les a caché à cause d'un duplicate content ou autre j'aurais compris mais le fait qu'il les ignore carrément ... je ne comprend pas.


Quelqu'un aurait une idée ? :D
 
WRInaute accro
Code:
<link rel="canonical" href="http://www.oujdacity.net/">

Si tu déclares que l'URL canonique est la racine du site, c'est normal qu'il désindexe la page... :roll:
 
WRInaute passionné
arf ! celle là je l'avais complètement mais complétement zappé :s
j'ai mis un code qui genère automatiquement le link canonical .... je pense qu'il faudrais revoir l'algo !

merci en tout cas je regarde ca de suite :)
 
WRInaute passionné
voilà, bug corrigé !

google est assez malin pour detecter le changement ? ou je dois lui notifier ? :)
 
WRInaute discret
Ok, j'espère que ce cas-là est résolu, mais si quelqu'un peut résoudre le même mystère pour cette page : http://www.lovelive.fr/page/video/palindrome-rever-cest-se-crever
(Page ignorée par Google depuis le 12 décembre). Ça m'intéresserait.

Page de recherche : https://www.google.fr/search?hl=fr&safe=off&client=firefox-a&rls=com.ub ... =&gs_rfai=
(Les résultats de recherche contiennent des liens vers la page mais pas la page)

Je n'ai ce problème qu'avec des pages contenant des vidéos, mais seulement quelques unes.
 
WRInaute passionné
faut dire qu'il est sevère le nouveau filtre du duplicate content :lol: , c'est pour celà d'ailleur que je me suis précipité à écrire un algo pour detecter moi même mes duplicates et générer le canonical url :)
 
WRInaute discret
C'est étrange. Si tu vas jeter un coup d'œil à ces pages (qui n'ont pas changé depuis décembre) tu verras que le texte n'est pas celui que Google affiche. Même le cache des pages ne contient pas ce texte.

D'ailleurs, je viens de tester « Analyser comme GoogleBot » dans GWT, et Google m'indique que cette page qui n'apparaît pas dans les SERP est un 404. Pourtant n'importe qui peut y accéder...
 
WRInaute discret
aladdin a dit:
faut dire qu'il est sevère le nouveau filtre du duplicate content :lol: , c'est pour celà d'ailleur que je me suis précipité à écrire un algo pour detecter moi même mes duplicates et générer le canonical url :)
Sur mes articles de blog j'ai ajouté le canonical pour éviter les conneries (on sait jamais).
Sur mes pages avec vidéos j'y ai pas pensé mais là on est dans la quatrième dimension : cache incohérent avec la description dans les SERP, page présente et accessible mais en 404 selon Google...
Ou pas pour le 404, j'ai testé une mauvaise URL :oops: Mais ça ne change rien, c'est toujours incompréhensible :?:
 
WRInaute discret
aladdin a dit:
Je pense comprendre ton problème :)
en fait tu as un canonical vers http://www.lovelive.fr/node/3043 qui lui fais une redirection vers http://www.lovelive.fr/page/video/palindrome-rever-cest-se-crever qui lui indique que le canonical est http://www.lovelive.fr/node/3043 ...
Je pense que google s'y perd, c'est comme une redirection cyclique.
Je pense que ce n'est pas ça, parce que le canonical est présent sur toutes les autres pages d'articles du site (avec un 301 vers l'URL clean), et toutes celles sans vidéo sont indexées un jour ou l'autre. :?

Je viens de modifier les pages qui apparaissent en duplicate, je verrai bien ce que ça donnera d'ici quelques jours...
 
Discussions similaires
Haut