Balise meta robots en "index" sur une page non canonique

Nouveau WRInaute
Bonjour,

Voici ma question :

Sur une page dupliquée (ex : /pageB), est-il possible d'avoir à la fois la balise rel=canonical pointant vers l'URL canonique référente(ex : <link rel="canonical" href="/pageA") ET la balise meta robots avec l'attribut "index" ?

À mon sens, ces deux directives envoient des messages contradictoires à Google :
La balise rel=canonical donne l'indication à Google "cette page est juste une copie, ne l'indexe pas, indexe plutôt sa canonique"
La balise meta robots en index donne la directive à Google "tu peux indexer cette page" même s'il s'agit de la copie

Je trouve l'erreur sur beaucoup de sites donc je me pose la question.

P.S : je sais que l'URL de la canonique doit être en absolue, il me semble juste que le forum me bloquerait une fausse URL complète.

Merci
 
Olivier Duffez (admin)
Membre du personnel
la directive "index" ne sert à rien, car si on ne la met pas, c'est comme si on l'avait mise. C'est la valeur par défaut.
elle n'est pas contradictoire avec la canonique. En effet, Google devrait a priori indexer uniquement l'URL canonique, mais si on met "noindex", alors c'est clair, elle ne sera pas indexée.

es-tu obligé de conserver les 2 pages sur le site ?
 
Nouveau WRInaute
Merci pour ta réponse.

Oui, la directive "index" est effectivement la directive par défaut mais là est du coup le problème :
Si on change la directive en "noindex", alors Google n'indexera pas la copie...ce qui finalement est l'idée vu que, de part rel=canonical, on indique que seule la canonique doit être référencée. À priori cette combinaison des 2 directives me semble donc la plus logique car elle envoie le même message à Google.

En revanche, en spécifiant la directive "index", on indique à Google d'indexer la copie. Par ailleurs, Google (John Mueller) dit que rel=canonical est une INDICATION de préférence à suivre quand la balise meta robots est une DIRECTIVE...donc à priori, la balise index devrait primer sur l'indication que la page en question n'est pas la canonicale ?

Dans les faits, je remarque que les 2 pages sont référencées dans la SERP : la page non canonique (avec la directive "index" ET la balise rel="canonical" avec l'URL de sa canonique) mais aussi la page canonique (avec également la directive "index" et la balise rel="canonical" en self canonical).

En fait c'est surtout une question "théorique". Je suis en train de réaliser l'audit technique d'un site et cette combinaison me laisse perplexe !
 
Olivier Duffez (admin)
Membre du personnel
ce qui prime, c'est le noindex. si tu mets du noindex : fin de la partie (pageB ne sera pas indexée) et alors Google se fiche que la canonique indique une autre URL.

donc si tu veux faire comprendre à Google que plusieurs URL doivent être fusionnées dans l'indexation (sous l'URL canonique), il faut laisser index (ou ne rien mettre, c'est plus simple)

je repose la question : es-tu obligé de conserver les 2 pages sur le site ?
(car la canonique est une rustine)
 
Nouveau WRInaute
Voici le cas réel :

• www. namirial .com est le site à auditer.
• Cette URL possède une redirection en 307 vers la langue du navigateur de l'internaute (/fr , /en...) (ou via l'IP, pas sûr)
• Les pages traduites ont bien les balises hreflang indiquant les versions traduites de cette page en href (/fr, /en...)
• Les pages traduites sont des pages non canoniques et pointent vers leur canonique : href="/"
• Les pages traduites ont la directive meta robots en "index"
• La page avec l'URL racine (/) et les pages traduites (/fr, /en...) sont indexées

Du coup oui je suis obligé de conserver les 2 pages sur le site.
 
Nouveau WRInaute
Les pages traduites (en /fr /en etc...) ont la balise suivante :
<link rel="canonical" href="/"> qui indique donc que ces pages sont non canoniques (non-canonical) et que leur page de référence, la canonique, est la page racine (qui possède donc une redirection en 307 vers les pages traduites)
 
Olivier Duffez (admin)
Membre du personnel
les canoniques ne dépendent pas des hreflang
l'URL canonique de /en est /en

il ne faut jamais indiquer comme URL canonique un truc qui se fait rediriger...
 
Nouveau WRInaute
Tout à fait ! C'est donc bien là le problème. J'aurais également été du même avis de mettre des self canonical sur ces pages là pour éviter de rentrer dans une sorte de boucle chelou.

Donc à priori :
Mettre des self canonical sur les pages traduites et donc pour le coup, bien les laisser en "index"

Quid de l'URL racine ? S'il y a une redirection, il serait judicieux d'y ajouter une balise noindex et d'enlever la balise canonical, non ? Elle serait uniquement utilisée en cas de trafic direct avec la 307 vers la bonne langue.
 
Olivier Duffez (admin)
Membre du personnel
s'il y a une redirection, il ne peut pas y avoir de balise meta (ou d'entête X-Robots-Tag)
faut arrêter de dire "page traduite" comme si c'était une sous-page. c'est une page comme une autre, qui a autant de légitimité que la FR. Logique qu'elle soit en self canonique
 
WRInaute impliqué
Une adresse canonique est l'adresse "officielle" d'une page accessible par plusieurs URL. Considérons les URL suivantes donnant toutes accès à la même page :
Code:
http://www.example.com
http://www.example.com/
http://www.example.com/index.htm
https://www.example.com
https://www.example.com/
https://www.example.com/index.htm
etc.

Du point de vue d'un moteur de recherche, le présupposé est qu'une URL donne toujours accès à la même ressource (même si c'est pas toujours vrai), et que deux URL différentes donnent accès à deux ressources différentes, et là encore, on voir que c'est inexact. L'adresse canonique permet d'indiquer au moteur que la page http://www.example.com/ est en fait identique à https://www.example.com/, et qu'il vaudrait mieux qu'il propose à l'internaute d'y accéder par l'adresse https://www.example.com/ qui est celle que le webmestre "préfère".

Mettre sur une page une canonique qui pointe vers une autre page (pas juste une autre URL) est une hérésie, comme ici, pour une page /en :
HTML:
<meta rel="canonical" href="/">
En fait tu indiques à l'explorateur que la page www.example.com/en devrait être accédée par www.example.com/ qui est une page identique.
 
Discussions similaires
Haut