cas très curieux : certaines pages de mon site sont complétement ignorées par google

aladdin · 17 Mars 2010

Bonjour à tous

Je suis entrain d'étudier un cas curieux sur mon site, en effet certaines pages présentes depuis des mois n'ont jamais été indexées par google !
exemple d'une page ignorée: -http://www.oujdacity.net/staff-oujdacity-fr.html
et là c une rubriques carrement qui est ignorée : -http://www.oujdacity.net/service-emploi-fr.html

à la limite si google avait indexé ces pages puis les a caché à cause d'un duplicate content ou autre j'aurais compris mais le fait qu'il les ignore carrément ... je ne comprend pas.

Quelqu'un aurait une idée ?

HawkEye · 17 Mars 2010

Code:

<link rel="canonical" href="http://www.oujdacity.net/">

Si tu déclares que l'URL canonique est la racine du site, c'est normal qu'il désindexe la page... :roll:

aladdin · 17 Mars 2010

arf ! celle là je l'avais complètement mais complétement zappé :s
j'ai mis un code qui genère automatiquement le link canonical .... je pense qu'il faudrais revoir l'algo !

merci en tout cas je regarde ca de suite

aladdin · 17 Mars 2010

voilà, bug corrigé !

google est assez malin pour detecter le changement ? ou je dois lui notifier ?

artscoop · 17 Mars 2010

Ok, j'espère que ce cas-là est résolu, mais si quelqu'un peut résoudre le même mystère pour cette page : http://www.lovelive.fr/page/video/palindrome-rever-cest-se-crever
(Page ignorée par Google depuis le 12 décembre). Ça m'intéresserait.

Page de recherche : https://www.google.fr/search?hl=fr&safe=off&client=firefox-a&rls=com.ub ... =&gs_rfai=
(Les résultats de recherche contiennent des liens vers la page mais pas la page)

Je n'ai ce problème qu'avec des pages contenant des vidéos, mais seulement quelques unes.

dd32 · 17 Mars 2010

duplicate : https://www.google.com/search?q=J%27ai+d%C3%A9got%C3%A9+une+vid%C3%A9o+ ... =firefox-a

aladdin · 17 Mars 2010

faut dire qu'il est sevère le nouveau filtre du duplicate content :lol: , c'est pour celà d'ailleur que je me suis précipité à écrire un algo pour detecter moi même mes duplicates et générer le canonical url

artscoop · 17 Mars 2010

C'est étrange. Si tu vas jeter un coup d'œil à ces pages (qui n'ont pas changé depuis décembre) tu verras que le texte n'est pas celui que Google affiche. Même le cache des pages ne contient pas ce texte.

D'ailleurs, je viens de tester « Analyser comme GoogleBot » dans GWT, et Google m'indique que cette page qui n'apparaît pas dans les SERP est un 404. Pourtant n'importe qui peut y accéder...

artscoop · 17 Mars 2010

aladdin a dit:
faut dire qu'il est sevère le nouveau filtre du duplicate content :lol: , c'est pour celà d'ailleur que je me suis précipité à écrire un algo pour detecter moi même mes duplicates et générer le canonical url

Sur mes articles de blog j'ai ajouté le canonical pour éviter les conneries (on sait jamais).
Sur mes pages avec vidéos j'y ai pas pensé mais là on est dans la quatrième dimension : cache incohérent avec la description dans les SERP, page présente et accessible mais en 404 selon Google...
Ou pas pour le 404, j'ai testé une mauvaise URL

Mais ça ne change rien, c'est toujours incompréhensible :?:

aladdin · 17 Mars 2010

Je pense comprendre ton problème

en fait tu as un canonical vers http://www.lovelive.fr/node/3043 qui lui fais une redirection vers http://www.lovelive.fr/page/video/palindrome-rever-cest-se-crever qui lui indique que le canonical est http://www.lovelive.fr/node/3043 ...

Je pense que google s'y perd, c'est comme une redirection cyclique.

artscoop · 17 Mars 2010

aladdin a dit:
Je pense comprendre ton problème
en fait tu as un canonical vers http://www.lovelive.fr/node/3043 qui lui fais une redirection vers http://www.lovelive.fr/page/video/palindrome-rever-cest-se-crever qui lui indique que le canonical est http://www.lovelive.fr/node/3043 ...
Je pense que google s'y perd, c'est comme une redirection cyclique.

Je pense que ce n'est pas ça, parce que le canonical est présent sur toutes les autres pages d'articles du site (avec un 301 vers l'URL clean), et toutes celles sans vidéo sont indexées un jour ou l'autre. :?

Je viens de modifier les pages qui apparaissent en duplicate, je verrai bien ce que ça donnera d'ici quelques jours...