Suppression du referencement

WRInaute discret
Salut à tous,

J'ai un site : h**p://perso.wanadoo.fr/inedispirou

qui a récemment changé d'adresse en

http://www.inedispirou.kalikoba.com/

Or, lorsque l'on lance la requete "InediSpirou" dans google, c'est le premier site qui arrive en tete...

Je voudrait supprimer le referencement du premier site et j'ai placé un robots.txt dans la racine :

http://perso.wanadoo.fr/inedispirou/robots.txt

Pensez vous que ce fichier est bien apte à supprimer de l'index google l'integralité de mon site?

Et si oui, combien de temps cela peut prendre? Comment faire pour accelerer la suppression de l'URL de mon site de l'index google?

Merci d'avance ;)
 
WRInaute passionné
petit-ourson a dit:
Pourquoi ne pas rediriger les pages avec les anciennes adresses vers les pages avec les nouvelles adresses ?
Parce que c'est un site perso Wanadoo ... :roll: et qu'à ma connaissance, il n'y a rien d'excellent pour rediriger vers le nouveau site chez cet hébergeur...tout en préservant son travail de réf.
 
WRInaute accro
Juho_05 a dit:
Je voudrait supprimer le referencement du premier site et j'ai placé un robots.txt dans la racine :

http://perso.wanadoo.fr/inedispirou/robots.txt

Pensez vous que ce fichier est bien apte à supprimer de l'index google l'integralité de mon site?
Malheureusement, pour les robots, la racine du site, c'est http://perso.wanadoo.fr/. Le seul robots.txt qu'ils vont lire, c'est celui à l'adresse http://perso.wanadoo.fr/robots.txt. Donc, tu ne peux pas utiliser cette technique.

Jean-Luc
 
WRInaute passionné
jeanluc a dit:
Juho_05 a dit:
Je voudrait supprimer le referencement du premier site et j'ai placé un robots.txt dans la racine :

http://perso.wanadoo.fr/inedispirou/robots.txt

Pensez vous que ce fichier est bien apte à supprimer de l'index google l'integralité de mon site?
Malheureusement, pour les robots, la racine du site, c'est http://perso.wanadoo.fr/. Le seul robots.txt qu'ils vont lire, c'est celui à l'adresse http://perso.wanadoo.fr/robots.txt. Donc, tu ne peux pas utiliser cette technique.

Jean-Luc
Je ne suis pas certain de ton affirmation Jean-Luc... J'ai moi même placé un fichier robots.txt... qui me semble-t-il avait été pris en compte par les moteurs...
Attention les adresses perso. wanadoo sont aussi des sous-domaines, et le site est aussi accessible à l'adresse : http://inedispirou.perso.wanadoo.fr/
 
WRInaute accro
Je confirme que les robots ne liront pas http://perso.wanadoo.fr/inedispirou/robots.txt, mais je suis d'accord pour dire qu'ils liront http://inedispirou.perso.wanadoo.fr/robots.txt.

Il s'agit bien de deux adresses différentes et l'effet sera différent. On obtiendra la désindexation de http://inedispirou.perso.wanadoo.fr/, mais pas celle de http://perso.wanadoo.fr/inedispirou/. Selon que Google a indexé une version ou l'autre, le robots.txt aura ou non de l'effet.

Autres précisions:

- robots.txt ne provoque pas la désindexation immédiate. Il a seulement pour effet que les adresses concernées ne sont plus visitées par les robots. Parfois il n'y a, d'ailleurs, pas de désindexation du tout. Seul l'emploi d'une balise META (à mettre entre <HEAD> et </HEAD>) peut garantir la non-indexation :
Code:
<meta name="robots" content="noindex,nofollow">

- désindexation de l'ancienne adresse ne veut pas dire indexation de la nouvelle. Une redirection serait une meilleure solution, mais je n'ai aucune idée des possibilités de Wanadoo à ce sujet.

- pour en savoir plus : Protocole d'Exclusion des Robots

Jean-Luc
 
WRInaute passionné
Un rappel issu de Wanadoo-it-tout-seul Advice Services :
Pour que votre site ne soit pas référencé par les moteurs de recherche, vous avez la possibilité d'inclure dans votre fichier HTML, dans l'entête (délimité par les tags et ) la commande :
La commande noindex signifie " ne pas cataloguer ", la commande nofollow veut dire " ne pas regarder les liens présents dans cette page ".
Et cela confirme ce que dit Jean-Luc...
A plusieurs niveaux, le référencement sur l'url (peu connue) de type : -http://example.perso.wanadoo.fr/ est préférable à celui sur -http://perso.wanadoo.fr/example/
 
WRInaute discret
Merci beaucoup pour vos nombreuses réponses ;)

Je ne suis malheuresement pas indexé sous la forme example.perso.wanadoo

mais sous perso.wanadoo/example

Donc, mon fichier robots.txt ne sert à rien...

Et si je supprime toute les pages html de l'ancien site, google va tomber sur des 404, et va les supprimer de son index, non?
 
WRInaute passionné
Oui... pas immédiatement mais au bout de quelques semaines, tu devrais voir les snippets disparaitre puis la page être totalement désindéxée...
 
WRInaute discret
Aye-Aye a dit:
Attention les adresses perso. wanadoo sont aussi des sous-domaines, et le site est aussi accessible à l'adresse : -http://inedispirou.perso.wanadoo.fr/
Impressionnant ! Possédant moi-même un site perso, je ne savais pas... Je pensais que ce n'était possible qu'avec les pages -http://monsite.wanadoo.fr/xxx
On n'en apprend vraiment tous les jours sur WRI

Juho_05 a dit:
Et si je supprime toute les pages html de l'ancien site, google va tomber sur des 404, et va les supprimer de son index, non?
Non, il va tomber (comme tous les autres moteurs d'ailleurs) sur la page d'erreur par défaut de Wanadoo ou sur celle que tu as éventuellement personnalisée, à savoir : Status Ok
 
WRInaute discret
Et si googlebot tombe sur la page d'erreur par defaut de wanadoo, il ne supprimera pas l'URl de son index quand meme?

Si non, alors, si je comprend bien, il ne me reste plus qu'a faire une redirection vers mon nouveau site... Comment faire, alors?
 
WRInaute passionné
C'est le problème avec Wanadoo, tu peux personnaliser l'affichage de ta page 404 mais pas la réponse serveur et il renvoie toujours l'état 200 OK.

Tu ne peux pas non plus faire de redirection car tu n'as pas accès au répertoire racine et au .htaccess.

PS: les snippets, ce sont les extraits de texte de ta page fournient par les moteurs dans les résultats de recherche
 
WRInaute passionné
Juho_05 a dit:
Et si googlebot tombe sur la page d'erreur par defaut de wanadoo, il ne supprimera pas l'URl de son index quand meme?
Mon avis est que dans ce cas, il désindexera tes pages... autrement dit, je ne te conseille pas de personnaliser ta 404... :roll:
 
WRInaute discret
Justement c'est ca le probleme, je n'ai meme pas acces au htaccess...

J'ai réinitialisé les pages d'error par defaut et j'ai tout de meme laissé le robots.txt...

j'espère que je serait desindexé rapidement...
 
WRInaute discret
Ah, si on peut tout de meme se servir d'un .htaccess mais seulement pour verrouiller un repertoire. J'ai verrouillé la racine, vous pensez que ca va forcer googlebot à desindexer mes pages?
 
WRInaute discret
Les pages risquent de devenir "résiduelles" car les moteurs n'y accèderaient plus, et la seule solution est de les conserver sur le serveur après les avoir modifier comme ci-dessous par exemple :

Code:
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<title>Erreur 404</title>
<meta name="description" content="Erreur 404">
<meta name="robots" content="noindex">
</head>
<body>
<h1>Erreur 404 - Page non trouv&eacute;e</h1>

... ici, tu peux placer une phrase expliquant le pourquoi d'une telle page
... ici tu peux placer un lien sur ta nouvelle page d'accueil

</body>
</html>

La page d'accueil doit lier toutes les pages (un plan de site en fait) afin que les moteurs puissent lirent <meta name="robots" content="noindex"> et donc les supprimer définitivemment.

Evidemment, si tu as un nombre important de pages, cette technique (*) est fastidieuse.

Dans ton cas, je pense que la méthode du verouillage du site est la meilleure !

(*) Personnellement, j'ai utilisé cette technique avec succès en plaçant un lien discret sur la page d'accueil vers la page prévue à lier les pages à supprimer. J'ai ainsi supprimé +80 pages qui restaient indexées/en cache alors qu'elles n'avaient plus de raison d'être.
 
WRInaute discret
Que pense tu de ma nouvelle page d'accueil?

C'est trop tard pour le faire sur les autres pages, je les avait deja supprimées depuis un certain temps.
 
WRInaute discret
OK, donc tout est parfait, attendons maintenant la visite de Google bot.

Merci beaucoup pour votre aide à tous ;)
 
Discussions similaires
Haut