Pages mal indéxées !

  • Auteur de la discussion Auteur de la discussion poupilou
  • Date de début Date de début
WRInaute passionné
Salut,

Est-ce quelqu'un sait pourquoi Google indexe mal certaines pages d'un site, je vais prendre pour exemple cette requête sous Google : cliquez

Il y a certains résultats pour ce site ou les pages ne sont pas indéxées comme il faut, il n'y a pas le titre de la page ni de description mais il y a uniquement par exemple (www.seloger.com/achat_370038.html) comme titre ? Cette page existe bien réellement sur le site et elle a des balises meta ?

Le problème c'est que ce n'est pas un cas isolé, il y a pas mal de pages comme celle là ?

Quelqu'un a-t-il une explication ?

J'ai un site en php ou Google a indéxé correctement mes pages dans un premier temps et dans un second temps je me retrouve avec le problème que je viens de décrire : uniquement des titres commençant par l'url de la page (pas de titres, ni de descriptions) alors que sur mes pages il y a les balises meta : titres, description, etc...
 
WRInaute passionné
D'accord avec toi arsenick, mais dans mon cas, mes pages ont bien été indéxé comme il faut par Google il y a un mois ou deux et puis maintenant je me retrouve avec beaucoup de titres et de descriptions manquantes dans les résultats sous GG.

J'ai modifié il y a quelques mois une page "Plan du site" sur laquelle j'ai rajouté pas mal de liens (de pages), est-ce que le problème vient de là ?

Si Google connait l'url de la page mais qui ne l'indexe pas comme il faut, que peut-on faire de plus ?
 
WRInaute accro
Bonjour poupilou,

Je vois deux explications possibles :

- quelque chose déplait à Google dans ces pages et il les a désindéxées, par exemple, parce qu'il a trouvé un contenu (presque) identique ailleurs.

- depuis les changements du plan du site, les pages en question sont devenues moins importantes aux yeux de Google, parce qu'elles ne sont plus liées de la même façon et qu'elles reçoivent moins de PR (par exemple, liens moins directs venant de la page d'accueil ou de qualité moindre).

Jean-Luc
 
WRInaute passionné
Merci jeanluc pour tes réponses.

2 remarques :

1. GG n'a pas désindéxés mes pages puisque lorsque je fais site:monsite.com ces fameuses pages sont bien listés dans la page de résultats mais pas comme il faut (pas de titres ni de description)

2. Pour toi, si une page devient moins importante GG ne l'indexe pas ? Je crois que non, GG indexe toutes les pages qu'il trouve (ou ne les indexe pas, parce qu'elles ne remplissent pas certains critères) mais indexer à moitié, je comprends pas ? Soit GG indexe, soit il n'indexe pas...
 
Nouveau WRInaute
Je rencontre le meme probleme sans raison apparente. Google conserve le rang de sortie mais n'affiche plus que l'URL.

Plusieurs pistes :

- contenus similaires ?
- serveur momentanément indisponible lors du passage du crawler ?

As tu essayé de mettre à jour qques contenus et meta pour voir si cela avait un effet ?
 
WRInaute accro
Bonjour poupilou,

Ta première remarque est tout à fait juste. Il n'y a pas désindexation à proprement parler.

Pour la deuxième remarque, je suis convaincu que certaines pages ne sont pas indexées parce qu'elles ne sont pas assez "importantes", pas assez "populaires".

Mais c'est vrai que mon explication n'est pas super... :wink: Il n'est pas logique d'indexer des pages à moitié. D'ailleurs, si le problème est au niveau de la popularité, c'est le lien lui-même qui devrait logiquement disparaître. Tout cela est bien mystérieux...

Jean-Luc
 
Nouveau WRInaute
Bonjour à tous (et oui, c'est mon premier message sur ce forum ! 8) ).
J'ai été confronté au même problème, et j'ai une explication à proposer (mais bon, difficile d'être vraiment sûr avec Google...) :
mon site est assez récent (1/01/2005) et n'à qu'un PR de 3 (je pense que cela à une importance, dans le sens ou il semblerait, d'après ce que j'ai pu lire sur le forum, que le PR influe sur le nombre de page et/ou de niveau d'arborescence pris en compte). J'ai modifié quelques liens depuis la page d'accueil et amélioré le contenu de pas mal de pages, et quelques jours après, beaucoup de ces pages qui étaient bien prises en compte ont perdues leur descriptif dans les résultats de Google. D'autres pages qui, au tout début, n'avaient jamais été présentée avec leur descriptif sont maintenant affichées avec... :?
Je pense donc que sur les sites récents et/ou avec un PR faible, Google à des critères assez durs qui font que des pages sont très rapidement, quelque soit la raison, partiellement sorties de l'index. J'imagine que c'est une protection contre des nouveaus sites qui "tricheraient" pour être bien placés (voir toutes les discussions sur la soi-disant SandBox). Comme Google ne peut être certain de la bonne foi ou non de ces nouveaux sites qui procèdent à des changements importants, il applique une sorte de pénalité temporaire. (Bon, j'espère que ça va pas trop durer, il a fait ça pour la moitié des pages de mon site, et ça fait bien 2 mois qu'elles sont dans cet état... Et je n'ai en aucune façon utilisé de pratique douteuse, bien au contraire !).
Voilà, juste ma petite expérience sur ce problème...
 
WRInaute passionné
Bonjour à tous,

Merci pour vos réponses.

Concernant les réponses de CAPLAT je ne crois pas que GG supprime les pages similaires d'un site de son index, il faudrait qu'il compare toutes les pages entre elles, quel travail et pour quel résultat final ? Quand au serveur momentanément indisponible, il me semble que les crawlers de GG reviennent plus tard sur le site s'ils rencontrent ce type d'erreur, donc je ne crois pas non plus que ce soit l'explication.

Concernant jeanluc je ne crois pas que GG n'indexe pas certaines pages d'un site parce qu'elles ne sont pas assez « populaires », c'est trop incertains comme critère et difficilement quantifiable (mise à part avec le Page Rank).

Concernant ParmeZan, ce que tu expliques ressemble fort à une SandBox-bis. Dans ce cas là je ne vois pas l'intérêt pour GG d'indéxer correctement les pages de mon site et puis au bout d'un mois ou deux de les désindéxer à moitié en supprimant les titres et les descriptions... c'est pas très logique tout ça, non ? Soit tes pages vont dans le bac à sable, soit elles n'y vont pas...
 
WRInaute discret
J'ai le même problème depuis plus d'un an. Certaines pages php venant d'une base de données ne sont indexées qu'à moitié, donc sans titre et sans descriptif. seulement ces pages changent régulièrement, à chaque ajout dans la base de données. J'ajouterai que seulement 20 pages php ont reçu un pr, les 500 autres ont été ignorées. J'avais pr4 pour ma page index au moment ou il était encore d'actualité.
 
WRInaute passionné
Cette desindexation partielle est bien connue, encore qu'on en parlait moins ces derniers temps (il y a eu des moments ou c'etait massif).

Les pistes de la detection de pages quasi-similaires (ex. si le design et les menus sont une bonne part du contenu) ou d'une sorte d'effet fraicheur pour l'indexation (les pages neuves qui commencent fort puis descendent - comme pour les classements en somme?) sont interessantes.

Ca n'arrive, normalement, que pour les sites avec beaucoup de pages (plus de 100 donc trop pour tenir dans un plan de site). Je suppose que vous avez beaucoup de pages (ou un faible PR / peu de liens vers votre site?)
 
WRInaute impliqué
Je pense aussi que c'est une question de pages trop similaires.

J'ai cela sur des pages où j'affiche une photo en gros plan. Le contenu spécifique à chaque page est trop réduit.
J'ai d'ailleurs eu beau mettre ces pages en 'noindex', Google continue de les afficher.
 
WRInaute discret
En effet, cela me parait assez plausible. Mes pages php ont toutes un design similaire et parfois le contenu (une recette par page) est assez court. J'ajouterai que les titres et metas sont tous différents. De plus les pages à moitié indexées changent régulièrement: certaines pages perdent leur descriptions et titres et les retrouvent le lendemain.
 
WRInaute passionné
Salut à tous,

foodstyling mes pages sont en php, j'utilise une base de données et les titres et metas sont tous différents, donc a on pas mal de ressemblances pour nos 2 sites. Mon site a plus de 5000 pages (certains sites tel que lemonde.fr ont beaucoup plus de pages que cela, environ 380000 pages et elles sont toutes, à priori, correctement indéxés par GG : titre + description).

Quand à la question : est-ce une question de pages trop similaires ?
Je trouve que cela est beaucoup trop aléatoire et difficile à mettre en place pour GG : à partir de quoi les crawlers de GG peuvent dire qu'une page est trop similaire par rapport à une autre, j'ai du mal à voir concrètement comment vous allez dire à un robot que non ces 2 pages sont trop similaires donc GG ne les indèxe pas, ou les indèxe à moitié. Et puis en quoi c'est mal d'avoir une page qui ressemble à une autre, par exemple dans le cas d'une fiche (d'une page) par produits que l'on vend. Si ton site vend des ordinateurs, il y a de fortes chances pour que les différentes pages qui présente (propose) tes produits se ressemble, non ?

Je pense que les données indéxées par GG ne sont pas extensibles à l'infinie, à un moment ou à un autre leur capacité maximum est atteinte, pour l'instant GG indéxerait environ 8 058 044 651 de pages. Il se passe quoi si une de mes pages arrive en 8 058 044 652 ièmes positions ?
 
Nouveau WRInaute
Je reviens sur ce topic après... un déménagement et de nouvelles observations sur ces pages qui perdent leur description.
Comme je le disais, il me semblait que Ggle avait fait ça avec des pages dont j'avais modifié quelques éléments, notamment les balises alt des images. Je mettais ça sur le compte de la nouveauté de mon site.
Néanmoins, et comme mes pages étaient relativement similaires (en fait, surtout en ce qui concernait les balises title et les métas keywords et description), j'ai modifié ces éléments en même temps que quelques éléments du contenu. Maintenant Ggle à réindexé mes pages correctement, ce qui me fait pencher du côté de l'explication de niceunef concernant la similarité (et effectivement, mon site contient plus de 100 pages).
Ceci dit, et je n'ai malheureusement pas noté assez précisement les changements apportés, mais je pense quand même qu'il existe un effet "fraîcheur" qui influe sur l'indexation et le positionnement. Ce serait un des moyens pour Ggle de pénaliser les pages modifiées uniquement pour... correspondre aux critères de Ggle ! (N'oublions pas que Ggle doit proposer des résultats pertinents. Donc si les changements apportés ne touchent que des critères accessoires - titre et balises alt, par exemple - Ggle peut estimer qu'il s'agit d'une petite tromperie et pénaliser ces pages). Bon, c'est une théorie un peu vague (et pas très clairement exprimée, sans doute), mais je vais essayer de faire des tests un peu plus précis sur certaines pages pour tester les réactions de notre moteur "préféré"...
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut