De 6500 pages indexées a 150 en une nuit

WRInaute passionné
Bonjour bonjour (pour moi mon jour commence mal)

En effet, j'ai pour habitude de taper la commande link: dans GG pour suivre l'indexation de mon site.

Vendredi dernier, site: donne 5080 pages, hier site: donne 6350 pages, ce matin, 142.

La question est: POURQUOI ?

Pour info: les seules modifs importantes que j'ai faites hier sont l'ajout de <lastmod>0000-00-00</lastmod> dans le sitemap (ligne que j'avais oubliée) et Deny from 000.000.000.00 dans le .htaccess pour bloquer l'accès à un cher ami ivoirien.

Pensez vous que Google ais mis de coté mes pages pour les rajouter une fois recrawlée depuis la date que j'ai ajouté dans mon sitemap (chose que j'espère) ou bien que je suis victime d'une punition quelconque ?

Autre info: la commande link: me donnait 2 liens jusqu'à ce matin où il n'y en a plus qu'un.

Merci pour votre aide si vous savez ce que c'est :?
 
Membre Honoré
Combien avez-vous d'articles proposés sur votre site ?
Le duplicate content n'est pas apprécier des internautes.
La commande link n'affiche pas tous les liens il faut utiliser GWT.
 
WRInaute passionné
J'ai environ 3000 articles + toutes les pages annexes (rubriques et autres) + les pages fabricants

Ok pour la commande link, dans GWT j'ai beaucoup plus de BL que 1 seul ^^

J'avoue que ça me fait un peu peur, est ce possible que GG supprime mes pages pour les remettre à jour ??

Merci bcp
 
Membre Honoré
Madrileño a dit:
Le duplicate content n'est pas apprécier des internautes.
Est-ce votre dernier mot ? Oui Jean-Pierre. :mrgreen:

Ce qui est très étonnant aussi est que les images de votre site affichent une url différente de votre site. :|
 
WRInaute passionné
Tu t'auto-cite ? :lol:

Alors c'est ça, je suis victime de DC ?

De qu'elles images parles-tu ? Lorsque l'on affiche le zoom ?

Edit: Ruddy c'est pas drole :cry:
 
Membre Honoré
lambi521 a dit:
Tu t'auto-cite ? :lol:
Alors c'est ça, je suis victime de DC ?
De qu'elles images parles-tu ?
Quand la réponse est déjà citée oui.
Les utilisateurs n'apprécient pas le duplicate content.

Quelques exemples d'images :
images/TK18%2520X.jpg
images/SD449EE.jpg
images/T080740.jpg
qui affichent cartouches-imprimantes.fr au lieu de imprimantes.fr . :?
 
WRInaute passionné
Moi qui attendait avec impatience la mise à jour du site, voilà que Google vire mes fiches produits.

Je ne vois pas comment faire en sorte qu'elles ne soient plus en DC les produits ont les mêmes caractéristiques, les mêmes marques, tout. Et même si je met du texte du constructeur, ce sera le même à chaque fois aussi.

Quelqu'un à une idée ? Y'a t'il un test quelque part pour voir si on est en DC ?
 
WRInaute passionné
Non je n'ai pas de messages. Merci de me réponde je sais pas quoi faire.

Dans site: il n'y a plus que 120 pages mais dans GWT ça n'a pas bougé...

Connais-tu le ratio minimum entre deux pages pour ne pas être en DC ?...
 
Membre Honoré
Il est possible que Google crawl à nouveau le site, mais il y a du duplicate content et certaines pages un peu vides.

Vous pouvez améliorer le texte de certains produits et plus généralement votre site.
Le design du site est aussi un peu discothèque ce qui n'aide pas à la navigation.

lambi521 a dit:
Connais-tu le ratio minimum entre deux pages pour ne pas être en DC ?...
Il n'y a pas de ratio minimum.
 
WRInaute passionné
Bon je vais pas modifier tout le site aujourd'hui je verrai bien demain.

Si je n'ai pas d'alerte GWT, si le chiffre site: n'a pas rebaissé ou qu'il a ré-augmenter je ne m'affolerai pas.

En tout cas je sais pas ce que je ferais sans WRI, merci à tous, je vous retient au courant par la suite.

@Madri: Moi j'aime bien les discothèques... Les bots n'ont pas d'yeux, changer le design ne changera rien à mon problème, chaque chose en son temps :wink:

Edit: Est-que si vous faites site:www.monsite.fr vous avez les memes résultats ? Merci à ceux qui répondront c'est pour comparer
 
Membre Honoré
lambi521 a dit:
Edit: Est-que si vous faites site:www.monsite.fr vous avez les memes résultats ? Merci à ceux qui répondront c'est pour comparer
Avec la commande site: il y a 157 "url" indexées.

Pour les exemples sur votre site il existe des URL prévues : "example.com" ou encore "example.org".
 
WRInaute passionné
Madrileño a dit:
lambi521 a dit:
Edit: Est-que si vous faites site:www.monsite.fr vous avez les memes résultats ? Merci à ceux qui répondront c'est pour comparer
Avec la commande site: il y a 157 "url" indexées.

Pour les exemples sur votre site il existe des URL prévues : "example.com" ou encore "example.org".

Moi j'en ai 118... ça sers à quoi example.com et example.org ? Lorsque je parle d'une url il faut que je dises ça ?
 
WRInaute passionné
J'ai déjà vu ce truc mais je dois t'avouer que je ne comprends strictement rien, ni ce que c'est, ni à quoi ça sers
 
Membre Honoré
Si vous souhaitez présenter une "url" en exemple vous utiliser "example.com" qui est un domaine réservé pour les exemple.
 
WRInaute passionné
Ok c'est bien ce que je pensais...

Sinon que dois-je faire pour mon problême ?

Je veux bien Google mette de côté certaines pages qui ressemblent à d'autres, mais pratiquement toutes !!

C'est déjà arrivé à quelqu'un ?
 
WRInaute passionné
Merci pour le topic, j'ai cherché pas mal d'autres cas similaires aussi...

Par contre j'ai une question, lorsque des pages sont considérées comme DC par Google, elles se trouvent dans les "pages à contenu similaires" sur la dernière page des résultats de recherche avec la commande site:www.example.com, je me trompe ?

Donc là en fait, c'est comme si GG ne les connaissais pas puisqu'elle ne se trouvent pas dans ce que je viens de citer, elles ont juste disparue de la commande site:

J'ai également trouvé la commande info: et j'ai testé sur plusieurs fiches produits qui ne sont pas dans site, et rien de spécial...

Je précise également que dans GWT, le nombre de mes pages de sitemap dans l'index web n'a pas bougé

Je suis vraiment largué là, quelle M***E ce Gogole
 
Membre Honoré
lambi521 a dit:
Par contre j'ai une question, lorsque des pages sont considérées comme DC par Google, elles se trouvent dans les "pages à contenu similaires" sur la dernière page des résultats de recherche avec la commande site:www.example.com, je me trompe ?
Vous vous trompez.
lambi521 a dit:
Je précise également que dans GWT, le nombre de mes pages de sitemap dans l'index web n'a pas bougé
Les outils de GWT ne sont pas à jour en temps réel.
lambi521 a dit:
Je suis vraiment largué là, quelle M***E ce Gogole
Pour faire simple, Google fait un travail pour les utilisateurs.
 
WRInaute passionné
Bon et bien je crois que j'ai cerné mon probleme.

En fait la commande site:www.example.com ne veut rien dire. Il faut en effet mettre un mot clef derriere, par exemple site:www.example.com example. De cette manière ça ressort toutes les pages contenant "example".

Pour avoir toutes les pages j'ai trouvé l'astuce ici https://www.webrankinfo.com/forum/t/comment-sortir-des-pages-ignorees-par-google.69870/ en tapant un mot clef qui n'existe pas avec le "-" devant comme par exemple site:www.example.com -gfgdgdghhdsb

Je cite celà au cas où quelqu'un ayant le même problème soit passe par là, bye !
 
WRInaute passionné
Bonjour à tous,

Je remonte ce topic car je pense avoir trouver mon problème.

J'aimerais avoir des précisions sur GoogleBot et l'URL rewriting. Sur mon site, je fais de l'URL rewriting et je me suis aperçu que lorsque que GoogleBot visitait mes pages, l'URL en cours qui s'affiche via l'admin n'est pas rewritée.

Ma question est la suivante:
Est-ce que googleBot crawl une page avec sa "vrai" adresse puis seulement après il lui attribue sont URL rewritée pour son indexation ?

Car j'avais bloqué certains paramètres d'URL dans GWT qui étaientt nécessaires à l'affichage des pages non rewritées mais n'étaient plus utiles pour les nouvelles URL afin de désindexé les anciennes. Donc si Google connait malgré tout les "vrai" URL, il avait besoin de ses paramètres pour y accéder et donc c'est pour cela qu'il aurait désindexé toutes mes fiches produits.

Personnelement je ne pense pas puisque tout les paramètres que j'ai mis sur "ignorer" ne sont plus utilisé dans les URL rewritée de mon site, mais sait-on jamais....
 
Membre Honoré
Le robot va faire un crawl sur les pages disponibles pour les utilisateurs.
Si vous avez des problèmes en référencement vous pouvez aussi contacter un professionnel.
 
Discussions similaires
Haut