pages dynamiques et contenu non parsé

maali · 10 Mars 2003

Bonjour à tous,

Je travaille sur le référencement de plusieurs site dynamiques (JSP), et ne parviens actuellement pas à un résultat satisfaisant... je vais essayer d'être claire...

Dans un premier temps, les sites ont été ajoutés sur google, comme ça, tranquille... En fait, google n'a référencé que les pages qui n'avaient pas de paramètres dans l'url, çàd la page d'accueil en gros

Cependant, on dirait que google est tout de même passé sur ces pages, puisque lorsqu'on recherche ceci : "site:www.univ-nantes.fr nantes", il renvoit dans les pages 10 et +, les liens vers les pages dynamiques, mais sans titre ni contenu!

C'est vrai qu'aucun tag meta n'est spécifié, mais la page d'accueil non plus n'en a pas et ELLE est très bien référencée.

Voilà, si vous avez des idées... je suis toute à l'écoute de vos remarques.

Concernant le fichier robots.txt de ce site, n'y faites pas attention, il a été modifié sous peu, et ce n'est donc pas cela le problème.

Merci d'avance

hetzeld · 10 Mars 2003

Maali,

Bonjour et bienvenue sur le forum WebRanIinfo
Une recherche Google sur site:www.univ-nantes.fr -xxyyzz sort 357 pages.
Par contre, beaucoup de pages ont une inclusion temporaire, en ce sens qu'il n'y a pas encore de version "en cache" chez Google.
C'est la raison pour laquelle seule l'URL apparaît.
Cela devrait rentrer dans l'ordre avec le "full crawl" qui doit démarrer incessament, comme les pages que j'ai vérifiées -pas les 357 :wink: - ont bien un titre qui devrait donc être repris.

Dan

PS: Intéresse-toi aux articles de fond qui décrivent notamment la vie d'une page web, ainsi qu'à la FAQ. Tu y trouveras cette réponse.

maali · 11 Mars 2003

Autre hypothèse?

Merci pour ta réponse, mais j'ai un doute sur ce que tu dis, étant donné que ces fichiers ont été indexés par google au mois de décembre... ce qui commence à faire.

Actuellement, nous avons modifié le robots.txt donc de toute façon, google ne pourra plus faire de full crawl, mais je pense qu'il l'aurait déjà fait...
Est ce que ce full crawl correspond à ce que vous appelez la google dance? si c'est le cas, google aurait du lire le contenu de mes pages lors de la google dance du 1er janvier... et meme du 26 janvier.

Une dernière hypothèse : le blanc(sauts de lignes successifs) situé en haut de mes pages avant le début du contenu peut-il poser des problèmes pour la lecture par googlebot?

Merci pour ton aide.

Suede · 11 Mars 2003

Re: Autre hypothèse?

maali a dit:
Actuellement, nous avons modifié le robots.txt donc de toute façon, google ne pourra plus faire de full crawl, mais je pense qu'il l'aurait déjà fait...
.

Le full crawl est la collecte d'info qui sert à Google pour construire son index (le changement d'index et le calcul des PR est à l'origine de la google dance).
Si tu empeches le full-crawl, tu empeches egalement le referencement de tes pages.

François

pierro · 4 Janvier 2004

pour rester dans ce sujet, car je n'ai pas tout à faiut saisi, il n'y a aucun probleme ou precaussion a prendre avec les pages qui ont un contenu dynamique, google les lit comme du texte ?

BadProcESs · 5 Janvier 2004

pierro a dit:
pour rester dans ce sujet, car je n'ai pas tout à faiut saisi, il n'y a aucun probleme ou precaussion a prendre avec les pages qui ont un contenu dynamique, google les lit comme du texte ?

Oui, aucun soucis, Google vois ce que le serveur lui renvoi, donc des pages interprétés, donc du texte...