****** de Google !

Nouveau WRInaute
Alors j'ai eu la mauvaise surprise début janvier de voir mes pages disparaitre de google petit à petit (ou plutot par gros lots).

Une possible cause : 2 semaines avant
Les urls étaient du type
http://machin/voir?categorie=x&souscategorie=y
et son passé en :
http://machin/voir?souscategorie=y

Bon il aurait du s'en sortir (mais je ne suis pas sur que le pb vienne de là)
J'avais 600 GoogleBot/jour avant et dès lors 6/jour et uniquement -en dehors- de cse urls !

Bref, après 2 semaines je décide de faire un urlrewriting (clean, avec 301), on sait jamais, mais rien n'y fait.

Référencement yahoo!... rien.

Je réduit la densité des mots clefs (blacklistage par erreur?) et ca ne fait rien.

email Google répond dans le vent as usual :/

Bref, aucun moyen que google revienne sur les URL !
Donc au lieu de 12000page, je tombe à 30 :/ et je perd des euros par centaine...

Je track google depuis janvier et il fait aucun fullcrawl ou autre sur le site...

HELP! Google met en péril ma boîte! (et c'est peu dire)
 
Olivier Duffez (admin)
Membre du personnel
depuis combien de temps ton site était dans Google ? quel PR as-tu en moyenne sur tes pages ?
au fait, n'est-ce pas dangereux d'avoir tes revenus entièrement dépendants d'une position dans Google ? enfin ça ne nous regarde pas :oops:
 
WRInaute passionné
BFraser a dit:
Quant aux revenus dépendant de google, c'est pas ma faute si google amène 90% du traffic des sites...
Dans ce cas, une solution rapide serait d'acheter des "Adwords" pour parer au plus pressé !

As-tu récemment changé quelque chose sur ton site ?
En cherchant sur google avec "inul:prixmateriel.com" on tombe sur un certain nombre d'urls d'un site roumain (?) price.ro , c'est à toi celui là?

Pour Google, il semble qu'un certain nombre de pages anciennes datent d'avant l'URL rewriting et n'ont pas de titre en cache... Tu as mis l'URL rewriting en place récemment ?

Dan
 
WRInaute discret
Dans ce cas, une solution rapide serait d'acheter des "Adwords" pour parer au plus pressé !

j'ai eu la même idée! mais bon faut voir le prix "des termes" dans son secteur et faudrait connaitre son ratio vente/visiteurs.

sinon BFraser

dans ton index

tu as
<META HTTP-EQUIV="robots" CONTENT="index,follow">
<META NAME="robots" CONTENT="ALL">

ca risque de poser pb ça non ?

sinon en passant ton index à un "validator html"
entre autre:
Line 129, column 41: cannot generate system identifier for general entity "PM_Session"
Line 231, column 228: cannot generate system identifier for general entity "partner"
Line 231, column 245: cannot generate system identifier for general entity "p1"
Line 231, column 253: cannot generate system identifier for general entity "p2"
Line 231, column 261: cannot generate system identifier for general entity "p3"
Line 231, column 269: cannot generate system identifier for general entity "url"
This page is not Valid HTML 4.01 Transitional!

essaye d'avoir un code propre (meta-tag, tag, html,...)

a+nico
 
Nouveau WRInaute
hetzeld a dit:
BFraser a dit:
Quant aux revenus dépendant de google, c'est pas ma faute si google amène 90% du traffic des sites...
Dans ce cas, une solution rapide serait d'acheter des "Adwords" pour parer au plus pressé !
C'est déjà fait. Mais quand le coût du visiteur est plus cher que ce qu'on peut gagner par lui (selon mes ratios), ce n'est pas un solution à long terme.

hetzeld a dit:
BFraser a dit:
As-tu récemment changé quelque chose sur ton site ?
En cherchant sur google avec "inul:prixmateriel.com" on tombe sur un certain nombre d'urls d'un site roumain (?) price.ro , c'est à toi celui là?

Rien à part ce qui à été expliqué ci dessus.
Le site roumain, je l'ai déjà repéré mais je n'ai aucune idée. Probablement qu'il utilise certaines ressources non officielles. Ou alors c'est volontaire pour polluer mais est-ce bien possible ?

euh, le keyword 'inul:' fonctionne pas sur google... erreur ?

hetzeld a dit:
BFraser a dit:
Pour Google, il semble qu'un certain nombre de pages anciennes datent d'avant l'URL rewriting et n'ont pas de titre en cache... Tu as mis l'URL rewriting en place récemment ?
Dan

Autour du 20 janvier. Je ne comprend pas.
 
Nouveau WRInaute
bshop a dit:
dans ton index

tu as
<META HTTP-EQUIV="robots" CONTENT="index,follow">
<META NAME="robots" CONTENT="ALL">

ca risque de poser pb ça non ?
Normalement non... je lui dit explicitement d'indexer et de suivre les liens, comme dans le
robots.txt.

bshop a dit:
essaye d'avoir un code propre (meta-tag, tag, html,...)
a+nico
C'est déjà en cours. (je pensais aussi que ca pouvait 'bloquer')
 
WRInaute passionné
euh, le keyword 'inul:' fonctionne pas sur google... erreur ?
Effectivement, une lettre est "restée dans le clavier"... :oops:
La syntaxe est inurl:prixmateriel.com (avec un r...) - désolé, je devrais mieux me relire !

Si tu dis que tu as mis l'URL rewriting en place vers le 20 janvier... cela pourrait être une piste. Tes anciennes URL fonctionnent toujours, non ?
As-tu eu une période d'essai, disons entre le 6 et le 20 janvier, où l'accès à tes pages aurait pû générer des erreurs ?

Ton site ne doit pas tomber sous le coup d'une pénalité, car il a toujours un PR5... c'est déjà quelque chose.

Dan
 
Nouveau WRInaute
hetzeld a dit:
euh, le keyword 'inul:' fonctionne pas sur google... erreur ?
Effectivement, une lettre est "restée dans le clavier"... :oops:
La syntaxe est inurl:prixmateriel.com (avec un r...) - désolé, je devrais mieux me relire !

Si tu dis que tu as mis l'URL rewriting en place vers le 20 janvier... cela pourrait être une piste. Tes anciennes URL fonctionnent toujours, non ?
As-tu eu une période d'essai, disons entre le 6 et le 20 janvier, où l'accès à tes pages aurait pû générer des erreurs ?

Ton site ne doit pas tomber sous le coup d'une pénalité, car il a toujours un PR5... c'est déjà quelque chose.
Dan

Intéresant le inurl: , je l'avais pas vu auparavant. A part le related: y'en a encore bcp comme çà ?

Il n'y a pas de période d'essai. Tout est testé et débuggé au maximum avant l'upload. Ensuite toutes les redirections ont été faites proprement. (sauf peut être sans 301 les premiers jours). Mais de toutes façons, les pages avaient disparues avant l'urlrewriting (que j'avais essayé en solution). C'est justement là ou ca bloque, je ne trouve pas la cause (je me documente partout, je check tout et j'attend bcp mais aucune solution :/)


'Pénalité' c'est à dire ?
Je dois blacklister le site roumain ? un peu tard non ?
 
WRInaute passionné
Après analyse plus poussée de la source de ta page d'accueil, je pense que ton souci vient de ta déclaration <!DOCTYPE ...> non compatible avec le xml utilisé.

Tu as un grand nombre d'erreurs données suite à une validation:
http://www.htmlhelp.com/cgi-bin/validat ... &input=yes
venant principalement de cette incompatibilité.

Je ne crois pas qu'il faille chercher beaucoup plus loin :? Ces modifs datent de quand ?

Dan
 
WRInaute passionné
BFraser a dit:
'Pénalité' c'est à dire ?
Je dois blacklister le site roumain ? un peu tard non ?
Je disais qu'il ne semblait PAS y avoir une quelconque pénalité. :wink:
Tu devrais à tout le moins essayer de découvrir d'où viennent les URLs fantaisistes de ce site roumain.

Dan
 
Nouveau WRInaute
hetzeld a dit:
Après analyse plus poussée de la source de ta page d'accueil, je pense que ton souci vient de ta déclaration <!DOCTYPE ...> non compatible avec le xml utilisé.

Tu as un grand nombre d'erreurs données suite à une validation:
http://www.htmlhelp.com/cgi-bin/validat ... &input=yes
venant principalement de cette incompatibilité.

Je ne crois pas qu'il faille chercher beaucoup plus loin :? Ces modifs datent de quand ?

Dan

Le doctype est le meme depuis 2 ans... j'ai juste ajouté il y a 2 jours les xml: .
Je crois que je vais le dégager tout court.
 
WRInaute passionné
En fait, ton <!DOCTYPE...> est bon si ton site est en HTML 4.01 transitional, ce qui n'est pas du tout le cas. Il vaut encore mieux ne pas mettre de <!DOCTYPE...> que d'en mettre un qui ne reflète pas la syntaxe de la page.
Dans ton cas, la page apparaît comme truffée d'erreurs à cause de cela. Si un validateur voit ces erreurs, il y a de fortes chances qu'un robot s'y arrête aussi. :?

Dan
 
WRInaute occasionnel
j'ai remarqué que google a indexé l'adresse du domaine avec et sans les WWW
( il y a un lien pointant sur l'accueil sans les WWW ) et leur donne le meme PR5.

A mon avis faudrait éviter d'utiliser l'url courte. Mais ca n'a peu etre pas d'incidence sur le référencement .. ??
 
Nouveau WRInaute
Google ne prend pas en compte les 301 il semble. j'ai des googlebot sur une meme url avec 11 jours d'intervalle sans qu'il prenne en compte la redirection. Bref, mail à help@google, mais je sais pas s'il vont analyser l'erreur.

Quand au www ou non, je sais pas mais moi je ne considère jamais le www. C'est un sous domaine absurde/obsolète (la quasi totalité des domaines ont leur service web sur la racine) qui n'est plus utilisé que par les newbies et dont on a extremement de mal à se défaire. Le problème c'est que les gens qui font un lien ajoutent le 'www'... on est donc obligé de le conserver.
 
WRInaute passionné
BFraser a dit:
Google ne prend pas en compte les 301 il semble. j'ai des googlebot sur une meme url avec 11 jours d'intervalle sans qu'il prenne en compte la redirection. Bref, mail à help@google, mais je sais pas s'il vont analyser l'erreur.

Quand au www ou non, je sais pas mais moi je ne considère jamais le www. C'est un sous domaine absurde/obsolète (la quasi totalité des domaines ont leur service web sur la racine) qui n'est plus utilisé que par les newbies et dont on a extremement de mal à se défaire. Le problème c'est que les gens qui font un lien ajoutent le 'www'... on est donc obligé de le conserver.
Une chose est certaine, Google prend en compte les 301 ! C'est même la précédure qu'ils recommandent.
Quant-à dire que l'utilisation du www est obsolète et réservée aux newbies, je pense que tu exagères car c'est encore le cas de l'immense majorité des sites web.
Pour ne citer que Google, Microsoft, HP, Apple... qui ne sont pas à proprement parler des "newbies" :wink:
Un hébergement bien configuré doit par contre donner la même page, avec ou sans le www qui est un sous-domaine souvent défini comme alias du domaine principal, sur ce point là je suis d'accord avec toi.

Dan

PS: moi je n'utilise pas le www pour mon site :wink:
 
WRInaute discret
salut Dan

par contre h**p://www.wildcroft.com est redirigé vers -immo.wildcroft.com/index.php

ca serait mieux -immo.wildcroft.com (sans index.php)

a+nico
 
WRInaute passionné
Bshop,

Juste, j'ai corrigé! J'avais tendance à oublier celui là :wink:
Par contre le -www.immo.wildcroft.com est bien un alias de -immo.wildcroft.com...

Merci pour l' :idea:

Dan
 
Nouveau WRInaute
hetzeld a dit:
BFraser a dit:
Une chose est certaine, Google prend en compte les 301 ! C'est même la précédure qu'ils recommandent.
Ben apparemment moi il les veut pas.
J'ai dans les logs des accès page (toujours la même) qui lui balance bien la correspondance et ca empèche pas google de revenir presque tous les jours et de se reprendre le 301 (je peux sortir des logs sur + de 10 jours ou il y passe sans modifier ses url). Bref, il bloque dessus. Ca commence sérieusement à me taper sur les nerfs.
 
WRInaute passionné
BFraser a dit:
hetzeld a dit:
BFraser a dit:
Une chose est certaine, Google prend en compte les 301 ! C'est même la précédure qu'ils recommandent.
Ben apparemment moi il les veut pas.
J'ai dans les logs des accès page (toujours la même) qui lui balance bien la correspondance et ca empèche pas google de revenir presque tous les jours et de se reprendre le 301 (je peux sortir des logs sur + de 10 jours ou il y passe sans modifier ses url). Bref, il bloque dessus. Ca commence sérieusement à me taper sur les nerfs.
Donne-moi l'URL complète de la page incriminée...
Ton entête n'est peut-être pas bonne

Dan
 
Nouveau WRInaute
hetzeld a dit:
Donne-moi l'URL complète de la page incriminée...
Ton entête n'est peut-être pas bonne
Dan

non l'entete est correcte :/

HTTP/1.1 301
Date: Wed, 19 Feb 2003 09:13:00 GMT
Server: Apache
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Pragma: no-cache
X-Powered-By: PHP/4.3.0
Set-Cookie: PM_Session=69a7c9e245bc281825ac167bd435beba; path=/
Location: /cartesmeres_5/cat.html
Connection: close
Content-Type: text/html
 
Discussions similaires
Haut