Problème canonical dans search console.

Nouveau WRInaute
Bonjour tout le monde.

Pour un petit site, j'ai uploadé le sitemap dans "search.google.com" et quelques jours plus tard, il me dit que mes pages ne sont pas indexées avec notamment:

PAGE EN DOUBLE SANS URL CANONIQUE SÉLECTIONNÉE PAR L'UTILISATEUR
URL Dernière exploration
https://www.monurlamoi.com/ 19 oct. 2023
http://monurlamoi.com/ 15 oct. 2023
https://monurlamoi.com/ 8 oct. 2023


Si je comprends bien, ma page "https://www.monurlamoi.com/index.html" qui devrait être LA page d'accueil et qui existe réellement est polluée par https://www.monurlamoi.com/ ET http://monurlamoi.com/ ET http://monurlamoi.com/

Pour infos, hébergement chez OVH.

Quelqu'un peut-il me dire si je dois changer quelque chose dans le fichier "index.html" ou créer des redirections, bref, JE SUIS PERDU.

Merci d'avance pour vos lumières.

Christian
 
WRInaute impliqué
C'est pas exactement ça. Il faut différencier "la page" (le document qui s'affiche) de l'URL (l'adresse qui permet d'accéder à la page). Le truc, c'est qu'une même page peut avoir plusieurs adresses.

C'est le cas chez toi (mais tu n'es pas un cas isolé), la page "index.html" (ou ses variantes) est, par convention, sous-entendue à défaut d'autre page en HTTP ; autrement dit www.example.com pointera naturellement vers www.example.com/index.html, et par ailleurs la dernière oblique (trailing slash) est optionnelle (une histoire de vieille convention UNIX) de sorte que www.example.com/ et www.example.com pointent vers la même ressource.

Par ailleurs, le protocole d'une URL (le truc qui finit par ://) fait partie de l'URL, de sorte que http://www.example.com et https://www.example.com sont deux URL différentes, puisque HTTP et HTTPS sont deux protocoles distincts (de la même manière que ftp://www.example.com est distinct des deux URL précédentes).

Enfin, beaucoup de sites redirigent la racine du NDD vers le sous-domaine www, ce qui fait que http://example.com redirige vers http://www.example.com (ou parfois, l'inverse, suivant le choix et la configuration du webmaster).

Il n'y a pas de page d'accueil vraie ou fausse, toutes ces adresses pointent vers la même page, et sont des adresses valides. Par contre, tu peux indiquer quelle adresse il faudrait retenir. Généralement, on va choisir celle sans redirection (ce qui implique de préférer celle sécurisée HTTPS à celle HTTP), et sans le "index.html", pour le trailing slash, il y a deux écoles, sans aucune différence sur le SEO, perso je suis plutôt sans. Vu que tu as l'air de rediriger vers www, il faudrait ajouter le sous-domaine, ce qui donnerait comme adresse à privilégier https://www.example.com (à adapter suivant les choix exposés ci-avant).

Cette adresse à privilégier pourrait être déclarée comme canonique sur la page en-elle même (balise <link rel="canonical" href="">), comme ça on sait, sans ambiguïté qu'il s'agit bien de la même page, quoiqu'on y ait accédé depuis plusieurs adresses.

Et j'en viens à l'essentiel, à quoi ça sert ? En fait, il faut bien un moyen pour Google (et les autres) de savoir quelles sont les pages qui existent (sur tout internet) et de les distinguer les unes des autres. Pour cela, l'adresse (l'URL) est une bonne idée, puisqu'une même URL pointe en général sur la même page (ce n'est pas toujours vrai, notamment avec les pages dynamiques, mais passons), et que de ce fait deux pages distinctes auront deux URL différentes. Sauf que, la réciproque n'est pas vraie, comme on l'a vu, une même page peut avoir plusieurs URL. C'est le rôle des canoniques : identifier sous une référence unique une page. Mais comme tu le vois, Google apprends à faire sans. Il sait "repérer" une même page accessible depuis plusieurs URL distinctes. Du coup, il n'indexe qu'une seule URL, puisque les autres renvoient vers le même contenu.

Autrement dit, ton "problème" n'en est pas vraiment un : Google a identifié que ces URL pointaient vers une page qu'il connaît déjà.

Il reste quelques avantages à déclarer explicitement des canoniques :
* S'assurer sous quelle URL cette page sera présentée à l'internaute depuis Google (c'est le plus gros avantage)
* Faire explicitement ce que Google fait implicitement (et donc s'assurer que ce soit bien fait)
* Détecter plus aisément les cas où c'est une erreur

Il faut cependant le faire correctement, une mauvaise canonique (genre à la racine du site pour toutes les pages, ça s'est déjà vu), peut faire beaucoup de dégâts, alors qu'une bonne canonique n'apporte rien de fondamental.
 
Dernière édition:
Nouveau WRInaute
Bonjour emualliug

Merci pour la réponse vraiment complète et pour le temps passé.

En d'autres mots, je dois :
- Mettre les fichiers dans le FTP, dans un répertoire "www" puis un répertoire "monurlamoi.com", ce sera plus propre.
- Ajouter <link rel="canonical" href=" " dans le code de ma page index.html et non pas <link rel="canonical" href="https://www.monurlamoi.com/index.html"

Ai-je bien tout compris ?
 
WRInaute accro
Ou alors le site est accessible avec les W, sans les W et/ou avec HTTPS, sans HTTPS. Du coup gros DC. Sans URL, compliqué de voir !
 
WRInaute impliqué
Mettre les fichiers dans le FTP, dans un répertoire "www" puis un répertoire "monurlamoi.com", ce sera plus propre.
Ça dépend de l'architecture du serveur. Possible que chez OVH le répertoire racine du site soit www, par contre je ne vois pas bien l'intérêt du répertoire monurlamoi.com . De façon générale, puisque les pages du site semblent accessibles, je ne vous pas l'intérêt de les déplacer.

- Ajouter <link rel="canonical" href=" " dans le code de ma page index.html et non pas <link rel="canonical" href="https://www.monurlamoi.com/index.html"
Surtout pas. Je ne l'ai pas précisé, ça me semblait tomber sous le sens, mais la valeur de l'attribut href doit être l'URL canonique. On serait donc plus proche de :
HTML:
<link rel="canonical" href="https://www.example.com">
Mais cette valeur de canonique (avec HTTPS, avec www, sans index.html, sans trailing slash) n'est pas forcément valable partout. Elle n'est valable qu'en fonction des choix que j'ai expliqué avant. Ces lignes sont à ajouter dans le <head>.

Tu ne sembles pas à l'aise avec les notions que j'ai exposées, et c'est pas grave en soi. Mais à mon avis, t'aventurer sur la définition d'une canonique me semble trop audacieux pour le moment.

Une fois encore, les gains d'une canonique parfaitement faite sont très très faibles, les pertes d'une canonique mal faite peuvent être importants.
 
Discussions similaires
Haut