Duplicata content : "Google, indexe moins, steuplé&quot

  • Auteur de la discussion Auteur de la discussion twin
  • Date de début Date de début
WRInaute passionné
Hello à tous,

Je rencontre un problème avec mon site. Mes articles sont dispos avec 3 url différentes.

- Url que je souhaite continuer d'indexer :
*www.toilef1.com/mon-jolie-titre.html

- Url que je souhaite supprimer de gg (ex. article 5) :
*www.toilef1.com/article.php3?id_article=5 (utiliser par google actu)
*www.toilef1.com/spip.php?page=article-imprim&id_article=5

J'ai intégré un robot.txt à la racine, mais celui-ci ne fonctionne pas. :
Code:
User-agent:*
Disallow:/spip.php?page=article-imprim

Ma question est de savoir comment faire pour indiquer à google qu'il n'indexe plus mes 3 urls, mais seulement la première ?
Autre question, si je bloque l'url utilisé par google actu - est-ce que le bot de GGActu pourra toujours se connecter ?

Merki d'avance :)
 
WRInaute accro
Un p'tit bout de php pour aller chercher le 'mon_joli_titre' qui correspond à $_GET['id_article'], un petit contrôle d'URI, et si l'URI ne correspond pas à ce qu'il devrait être ('mon-joli-titre.html'), redirection 301 vers cet URI.
 
WRInaute passionné
Tu me croit si je te dis que je n'ai strictement rien compris ? :mrgreen:

Plus sérieusement, est-ce que tu aurait un bout de code que j'adapte à mon site ? Car là, je ne comprend pas tout... :?
 
Nouveau WRInaute
Code:
if('/mon-url-reecrite.html' != $_SERVER['REQUEST_URI'])
{
dbClose();
header('HTTP/1.1 301 Moved Permanently');
header('Location: '.HTTP_HOST.'/mon-url-reecrite.html');
exit();
}

Ceci doit être correct
 
WRInaute passionné
Si tu veux gérer ça via ton robots.txt :

Code:
User-agent: Googlebot
Disallow: /article.php3?id_article=* 
Disallow: /spip.php?page=article-imprim&id_article=*

Par contre je sais plus si les autre smoteurs acceptent les wildcards. Google oui en tout cas. Sinon si tu spécifie les URLs à garder dans ton sitemap XML, Google devrait se débrouiller pour conserver celles-là et ignorer les mauvaises.
 
WRInaute discret
J'ai une p'ti question a ce sujet, la solution du 301 n'est t'elle pas meilleur niveau referencement ? car on conserve tout les backlinks
 
WRInaute accro
doss a dit:
J'ai une p'ti question a ce sujet, la solution du 301 n'est t'elle pas meilleur niveau referencement ? car on conserve tout les backlinks
Si, bien sur, la redirection 301 est la bonne solution d'une part pour les backlinks, mais également pour le transfert du "référencement acquis" éventuel des autres formes d'URL.
Les bloquer par un robots.txt ferait perdre cet acquis.
 
Discussions similaires
Haut