Google peut il recommencer le référencement d'un site à 0 ?

WRInaute occasionnel
Voila mon problème :

J'ai un site internet qui tourne pas mal, et je le met à jour régulièrement. Seulement j'ai eu un problème de référencement dernièrement, car j'ai changé l'organisation de mon site.

Ce changement est avant tout une modification des paramètres PHP sur mes pages. Le problème est donc que mes pages ne sont plus accessibles aux meme URL qu'avant (puisque les paramètres PHP ont changés), mais les anciennent URL pointent toujours vers des pages existantes, avec de mauvais paramètres donc des pages inexploitable (car la base des URL reste inchangée).

Mais Google ne fait pas la différence entre page exploitable et inexploitable, et il indexe mes pages inexploitables sans fin, au détriment des autres !!!

Ce dont j'ai besoin est donc que Google reparte à 0 (de ma page d'accueil) pour l'indexation de mon site, et non plus qu'il parte des fichiers indexé dans sa base...

De cette facon tout rentrerait dans l'ordre..

Cela est il possible ???
 
Nouveau WRInaute
Re: Google peut il recommencer le référencement d'un site à

easyzik a dit:
Ce dont j'ai besoin est donc que Google reparte à 0 (de ma page d'accueil) pour l'indexation de mon site, et non plus qu'il parte des fichiers indexé dans sa base...

De cette facon tout rentrerait dans l'ordre..

Cela est il possible ???

Tu peut effacer tous les liens indexés de ton site avec un fichier robots.txt
l'operation peut etre réalisé (pour moi en 3 heures plus rien !) en demandant expressement la manip a google :p http://services.google.com:8882/urlcons ... cmd=robots

voir sur wri pour la structure du robots.txt
ou essaye ça a la racine du site (ou le path du dossier)

dans un fichier texte

User-agent: Googlebot
Disallow: /


heuuu ! c'est vrais que le pb de tes parametres php sont un peut vagues
 
WRInaute occasionnel
mahefarivony a dit:
C'est a dire ?
Qui affiche n'importe quoi ? Qui tombe en 404 ?

Pas du tout, des pages avec du HTML, mais par exemple, du vide à la place des parametres.

Si par exemple tu demandes d'afficher la page "index.php?p=fred", tu devrais avoir
"Salut FRED !!!"
C'est un exemple à la con, mais c'est pour m'expliquer.

Imagine que tu decides dans ton code de ne plus appeler ton parametre "p" mais "a". Tu devra accéder à ta page par "index.php?a=fred"
Or Google visite toujours la page "index.php?p=fred", et donc, met en memoire une page avec marqué "Salut !!!" puisque le paramètre "a" n'est pas trouvé donc vide.

Ce qui n'est pas ce que je souhaite.

J'espère avoir répondu a ta question
 
WRInaute accro
ok c'est bon...

pour reprendre ton exemple, si "c'est juste p a remplacer par a", le .htaccess devrait etre ton ami..

soit par un redirect soit par un rewriterule mais bon, chuis pas un cador sur la question.
 
Nouveau WRInaute
easyzik a dit:
mahefarivony a dit:
C'est a dire ?
Qui affiche n'importe quoi ? Qui tombe en 404 ?

Pas du tout, des pages avec du HTML, mais par exemple, du vide à la place des parametres.

Si par exemple tu demandes d'afficher la page "index.php?p=fred", tu devrais avoir
"Salut FRED !!!"
C'est un exemple à la con, mais c'est pour m'expliquer.

Imagine que tu decides dans ton code de ne plus appeler ton parametre "p" mais "a". Tu devra accéder à ta page par "index.php?a=fred"
Or Google visite toujours la page "index.php?p=fred", et donc, met en memoire une page avec marqué "Salut !!!" puisque le paramètre "a" n'est pas trouvé donc vide.

Ce qui n'est pas ce que je souhaite.

J'espère avoir répondu a ta question

pas completement , que fait tu de ton parametre pour appeler ta page ? une inclusion d'un fichier local, une "remonté" dynamique d'une base sql ?
la recher de ton parametre dans un tableau ??
 
WRInaute occasionnel
En fait, vos solutions ne suffisent pas...

Le système de suppression de page de Google fonctionne ainsi :

"Si vous estimez que le changement requis est urgent et que vous ne souhaitez pas attendre la prochaine exploration de Google, utilisez notre système automatique de suppression d'URL. Ce système automatique fonctionne seulement si votre webmaster a inséré la balise appropriée dans le code HTML de ces pages."

c'est a dire qu'il faut ajouter dans les pages une balise <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

Or si je l'insert dans "index.php" , il ne va plus indexer "index.php?p=fred" , mais il ne va plus non plus indexer "index.php?a=fred"
Donc ce n'est pas possible de faire comme ça.

Puis-je mettre dans mon robot.txt l'URL "index.php?p=fred" ?
Le fichier robot.txt prend-il en compte les paramètres PHP ? Je ne sais pas a vrai dire...
 
WRInaute occasionnel
Je ne vois pas le problème...

fredozi a dit:
pas completement , que fait tu de ton parametre pour appeler ta page ? une inclusion d'un fichier local, une "remonté" dynamique d'une base sql ?
la recher de ton parametre dans un tableau ??

Je ne vois pas ou est le problème... On a pas besoin de ça pour resoudre le probleme. Le truc, c'est que je veux simplement que Google recommence l'indexatoin de mon site depuis la page racine en ignorant tous les scans qu'il a déja fait auparavant...

Ca resoudrait tous les problemes mais ce n'est pas possible apparement...

Sinon, pour plus de details, je t'encourage a aller faire un tour sur mon site, et tu verras que c'est plus compliqué que mon petit exemple tout simple d'affichage de Bonjour, donc c'est dur de t'expliquer comment ca marche exactement
 
WRInaute occasionnel
Si il n'y a que ca pour vous faire plaisir...

mahefarivony a dit:
donne nous 2 vraies URL "avant" et "apres"

Sachant qu'il n'y a pas que celles là :

AVANT : -http://www.easyzik.net/forums.php?file=forum-sujets&id_forum=41
(page actuellement indexée par google...)

APRES : http://www.easyzik.net/forums.php?id_forum=41
(page non indexée par google...)

/!\ Mais il y a plus grave, parfois mes anciennes URL pointent vers d'autres anciennes pages, ce qui donne une boucle sans fin de page valides pour googlebot mais non exploitable pour un humain...

[mahé : j'ai edité, inutile de rajouter un lien direct de plus vers la vieille page :wink: ]
 
Nouveau WRInaute
Re: Je ne vois pas le problème...

easyzik a dit:
Je ne vois pas ou est le problème... On a pas besoin de ça pour resoudre le probleme. Le truc, c'est que je veux simplement que Google recommence l'indexatoin de mon site depuis la page racine en ignorant tous les scans qu'il a déja fait auparavant...

Ca resoudrait tous les problemes mais ce n'est pas possible apparement...

bon bon .. te fache pas :wink: peut etre q'un un cierge a Lourde... :D

le "petit" pb c'est que tu va, si tu resoud ton pb d'erreur 404 avoir le meme contenu que celuis indexé par google accessible via une nouvelle url et google va comparer tes nouvelle urls (au niveau du contenu) et il va trouver tes ancienne pages avec un contenu identique !?

p'tet q'une entete 301 serai judicieuse sur tes pages indexées, a mois que comme moi tu ne te retouve avec 600 liens perdu !!


visiblement pour ce qui me concerne meme une redirection 301 n'a pas suffis a eviter le "duplicat content" .

donc pour tout recomencer du debut, robots.txt et soumition du domaine
 
Nouveau WRInaute
Re: En fait, vos solutions ne suffisent pas...

easyzik a dit:
c'est a dire qu'il faut ajouter dans les pages une balise <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

Or si je l'insert dans "index.php" , il ne va plus indexer "index.php?p=fred" , mais il ne va plus non plus indexer "index.php?a=fred"
Donc ce n'est pas possible de faire comme ça.

bon si tu gére correctement tes erreur php la non resolution de tes parametre doit etre pris en compte. la detection d'un pamametre passer par url ?param=valeur et simple dans l'utilisation du php ou cgi ou asp ou language future, en fait on est dans une logique de developement tout simplement.

la modification d'architecture de tes scipts est loin d'etre insurmontable et en tout cas ne depend que de toi et pas de google.

il semble logique que les appels erroné soit pris en charge par ton php
de toute facon , toujour de maniere simple on reprend ton exemple
easyzik a dit:
Imagine que tu decides dans ton code de ne plus appeler ton parametre "p" mais "a". Tu devra accéder à ta page par "index.php?a=fred"
Or Google visite toujours la page "index.php?p=fred"

une simple condition pour un simple exemple:

if($p==""){$p = $a;}; // si p est vide atibuer la valeur de $a a $p
ou encore

if($p=="fred"){$a ="fred";};

genial non ??
bien sur ton site est beaucoup plus compliqué que ça !!

mais cele peut t'aider a generer des entete 301 pour les parametre qui te preocupe.

un petit tour sur un forum php peut etre utile ?
 
WRInaute occasionnel
pas grave...

Bon merci tout le monde... mais apprement, vous ne voyez pas bien comment mon code est super compliqué ce qui implique que je ne veut pas le modifier pour les beau yeux de Google.

Donc je crois que je vais blinder mon "robot.txt" avec un "disalow :/" et puis je re-soumettrais mon site une fois qu'il n'apparaitra plus dans Google....
Mais ca va me prendre un temps fou tout ça... Au moins 4 mois avant d'être de nouveau correctement référencé !!

C fou.......

Alors que Google devrait avoir un formulaire pour ré-initialiser un site dans sa base... Ce qui serait bien pratique... Car mes pages vont disparaitre de google PETIT à PETIT et réapparaitre PETIT à PETIT (comme elles sont apparues), et non pas d'un bloc. C naze. :evil:
 
Nouveau WRInaute
Re: pas grave...

easyzik a dit:
Alors que Google devrait avoir un formulaire pour ré-initialiser un site dans sa base... Ce qui serait bien pratique... Car mes pages vont disparaitre de google PETIT à PETIT et réapparaitre PETIT à PETIT (comme elles sont apparues), et non pas d'un bloc. C naze. :evil:

oui C pas cool , ta 10 pages visibles sur google...


par contre avec robots.txt té netoyer en 24 H max !! donc pas petit a petit

pour le formulaire qui supprime un site hereusement google n'execute que les ordre du webmaster !!!

Héé oui c'est ça le robots.txt

sinon y t'appele au téléphone ou il degage le site que tu choisis sur ta demande ? :wink:
 
WRInaute occasionnel
Alors effectivement, la demande de "dégagement" à été effectuée très rapidement (24 h). A condition bien sûr de passer par le formulaire adéquate dans lequel on entre le chemin de son fichier "robots.txt"... Ce que je n'avais pas vraiment compris au début, puisque j'attendais simplement que google visite mon fichier robot de lui meme.

Donc me voici invisible sur le web coté Google...

Je vous tiens au courant pour vous dire en combien de temps mon site reviens dans l'index Google, mais ça risque de prendre un peu plus de temps j'en ai peur ! :roll:

@+
 
Nouveau WRInaute
easyzik a dit:
Alors effectivement, la demande de "dégagement" à été effectuée très rapidement (24 h).
Je vous tiens au courant pour vous dire en combien de temps mon site reviens dans l'index Google, mais ça risque de prendre un peu plus de temps j'en ai peur ! :roll:

@+

voila voila.....

tu voi tu peut "parler dans le creux de l'oreille" de google.
c'est donc possible et tu voie que l'on ta bien compris....

easyzik a dit:
Bon merci tout le monde... mais apprement, vous ne voyez pas bien comment mon code est super compliqué ce qui implique que je ne veut pas le modifier pour les beau yeux de Google.

ceci dit pour l'avenir, vue les modif de fond engager par google pour la lutte contre les site "pas clair" et meme si ton site est "super compliqué" une gestion des erreur 404 , 301 et des url et meta me semble INDISPENSSSSSABLE ! au maintient de TON site dans l'index gogle , de plus, 2 ou 3 paramétres par l'url c'est pas la mer a boire.

maintenant ce que j'en dit......
au fait google a vraiment des beau yeux, a toi de voir.

A pluche.....
 
WRInaute occasionnel
fredozi a dit:
de plus, 2 ou 3 paramétres par l'url c'est pas la mer a boire.

Ne t'inquiète pas, je ne m'arrête pas à 2 ou 3 paramètres... :lol: Ca me fait un peu rire qd je lis ça d'ailleurs...
Ce qui est compliqué dans mon site, ce ne sont pas les paramètres mais sa structure. J'ai bossé sa structure à fond, ce qui en fait un site à part, meme si de plus en plus de "gros" sites en PHP fonctionnent maintenant comme ça (mais c'est loin d'être la majorité car cela demande de connaitre parfaitement le langage).
Car si tu regardes de plus près, avec la meme URL, je peux afficher des pages totalement différentes.
La structure de mon site est donc invisible vis à vis du simple visiteur, car une "pseudo page" PHP gère en fait l'affichage de tout un dossier et meme de ses sous dossiers ; soit en fait une section.
Cela signifie aussi que la même page peut etre accessible via des URL totalement différentes. (Ce qui m'a value un petit cafouillage de la par de GoogleBot en passant... le pauvre, il fut désorienté... :p )

Quand au erreur 404 et tout le blabla des meta, ne t'inquiète pas, cela fait bien longtemps que c'est géré. Tu peux meme faire des tests si jamais tu veux mettre à l'épreuve mon site...

Yop !

.: EazY :.
 
WRInaute passionné
y'a un truc que je ne comprends pas trop.
moi aussi j'ai changé des paramètres dans mes pages php, effectivement, google a pendant un certain temps redirigé vers ces pages (et fournit des résultats pas cohérents aux internautes), mais trés rapidement ces pages ont étées supprimées de son index.
j'ai l'impression qu'in ne suffit pas qu'il puisse se connecter sur la page, il faut aussi qu'il trouve des liens y aboutissant, sinon, il la dégage au bout d'un certain temps.
je dis des bêtises ?
 
WRInaute accro
moi je m'embete pas ... j'ai des milliers de page en doublons a cause de l'URL rewriting mais je m'en fiche completement.. mais j'ai observé que le google est intelligent, il n'affiche que les .html et pas l'equivallent en .php..

enfin, intelligent intelligent est un bien grand mot, en y reflechissant deux secondes, c'est normal que les pages .html soient privilégiées dans la mesure ou .. les backlinks pointent sur elles :mrgreen:
 
WRInaute occasionnel
jeroen a dit:
Mais alors pourquoi s'embêter à dégager toutes les pages avec des variables dépassées ?

Dans mon cas, Google à mis une éternité à detecter ces pages dépassées (peut etre que certains sites pointaient encore vers elles, je ne sais pas..). Apres plusieurs mois, il ne les avait toujours pas viré et ca commencait a me lourder.

Sauf que pour l'instant Google n'a toujours pas ré-indexé mon site , et cela se ressent sur les visites.
Je patiente en me disant que qd ca va revenir, mon référencement sera optimum... Vous n'auriez pas des idées pour faire accelérer le processus d'ailleurs ? :idea:
 
WRInaute occasionnel
:evil: VOILA PLUS DE 3 SEMAINES QUE GOOGLE M'A SUPPRIME DE SA LISTE... ET IL N'A TOUJOURS PAS RECOMENCE SON REFERENCEMENT :evil:

C'est normal que ca mette autant de tant à revenir, alors que mon site à un pageRank pas trop mauvais (5 normalement...)
Google devrait le scanner tous les 3 à 4 jours...
 
WRInaute accro
C'est normal que ca mette autant de tant à revenir

je ne sais pas si on peut considérer que Google "voit" ton site comme étant un nouveau site mais si c'était le cas, oui c'est tres long.

1 mois chez moi pour qu'un nouveau site soit enfin crawlé et indexé.. Mais bon, apparement, c'est variable.. Des fois c'est 48 heures ... des fois.. bin c'est un mois :lol:
 
WRInaute occasionnel
Ecrire à Google

J'ai envie d'écrire à Google pour leur dire. Qqn l'as-il déja fait ? Est ce que je vais pas me faire rembarrer, voir blacklister ??
C'est vrai que je voudrais pas les embeter non plus, mais je pense que peut etre qqch ne fonctionne pas bien dans leur système. Car 1 mois pour n'etre toujours pas référencé, c'est un peu long...
 
Nouveau WRInaute
Je pense que la solution est dans le htaccess

Options +FollowSymlinks
RewriteEngine on
RewriteRule ^index.php?p=fred$ index.php?a=fred [L]
RewriteRule ^http://www.easyzik.net/forums.php?file=([a-z0-9]*)&id_forum=([a-z0-9]*)$http://www.easyzik.net/forums.php?id_forum=$2
en considérant que ( forum-sujets) est un entier
A verifier si ça marche mais je pense que tu regles le probleme instantanément !
si j'ai tout compris ;)
 
WRInaute occasionnel
En fait si je ne suis pas toujours pas référencé, voici la raison (je l'ai trouvé dernièrement en lisant attentivement le "a propos" de Google) :

En fait, si on passe par le formulaire de suppression de site pour enlever de Google toutes les pages référencées, Google va les supprimer pendant 3 mois, et il ne visitera plus le site pendant ce laps de temps (ça je suis pas sur mais je pense)

Bref, C naze. Il n'y a aucun moyen de recommencer son référencement à parti de 0 proprement.

Donc a bon entendeur, ne passez pas par ce formulaire si vous ne voulez pas vous faire Blacklister pdt 90 jours.

;-( ;-( ;-( ;-( ;-( ;-(
 
Nouveau WRInaute
Bonjour,

J'ai effacé une dizaine de page par le formulaire, il y a de l'inertie mais bon, ça marche. une semaine aprés google m'a referencé 150 pages !!

je ne pense pas qu'il faille supprimer l'ensemble du site !!

ciao ciao
 
Discussions similaires
Haut