Comment ajouter un lien canonique ?

Nouveau WRInaute
Bonjour

Mes outils d’analyse de référencement me signale que je n'ai pas de liens canoniques.
Cependant, recommandé par plusieurs articles, j'ai effectué les redirections dans le .htaccess dont voici un extrait :
RewriteEngine On
Rewritecond %{HTTP_HOST} !^eden-nail\.fr$
Rewriterule ^(.*) <SITE>/$1 [QSA,L,R=301]

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index\.php\ HTTP/
RewriteRule ^index.php$ <SITE>/? [R=301,L]

ce n'est pas suffisant ?

Qu'est-ce que j'ai zappé ?
Je vous remercie
Dionee
 
WRInaute impliqué
En fait, tu as des liens canoniques, mais ils ne servent, pour certains, vraiment à rien.
Par exemple, si je vais sur Actualités et que je rajoute un paramètre à l'URL pour voir :
-http://eden-nail.fr/actualites?fezfe
Dans le code source, je trouve :
Code:
<link href="http://eden-nail.fr/actualites?fezfe=" rel="canonical" />
Par contre si je rajoute index.php à ta page d'accueil, j'ai bien une URL canonique qui a du sens, même si j'ajoute un paramètre. Bref, c'est fait partiellement, mais pas complètement.

Est-ce que c'est vraiment grave ? Pas trop, en fait, car une recherche sur site:eden-nail.fr fait sortir 27 pages, avec quelques pages inutiles mais qui ont visiblement été passées en 404... donc bon, avoir des URL canoniques n'est pas forcément à mettre en haut de ta liste des priorités.

Si tu veux t'amuser, va plutôt dans les dev-tools de Chrome, lance un audit et améliore les performances, corrige ton robots.txt, met à jour (ou trouve un moyen de supprimer) jQuery, protège ton dossier administrator avec un mot de passe Apache, fais une 404 qui permet de naviguer dans ton site...
 
Nouveau WRInaute
Justement, je lisais dans l'article qu'il valait mieux privilégier la configuration du .htacess, celle du <header> étant de la "rustine".

Ou alors, faut-il les 2 ?
 
WRInaute impliqué
Justement, je lisais dans l'article qu'il valait mieux privilégier la configuration du .htacess, celle du <header> étant de la "rustine".

Ou alors, faut-il les 2 ?

Il en faut au moins un : le htaccess peut servir à faire des redirections, le tag canonical permet que quand on accède à des pages via des URL différentes de celles prévues, les robots sachent quelle est l'URL qu'on souhaite voir être référencée.

Dans l'exemple que je donnais avec un paramètre, je ne suis pas redirigé vers l'URL sans paramètre, et la canonical indique que cette adresse farfelue est la "bonne" URL de la page, ça n'est donc pas parfait, mais pour le moment en tout cas, ça n'est pas un problème.
 
Nouveau WRInaute
Merci pour toutes ces infos, Colonies :) Mais je voudrais être sûr de bien tout comprendre.

Je suis clair sur l'exemple : en principe, le lien canonique aurait dù être le lien sans le paramètre. Pourquoi, dans ce cas, ce n'est-ce pas grave ?
Au niveau de la configuration, c'est un soucis dans mon .htaccess ? ou plutot de mon CMS (joomla) ?

Pour le robots.txt, je l'ai testé avec https://fr.ryte.com/ qui n'a pas relevé d'erreurs. Quelles sont celles que tu as vu ?

JQuery est effectivement un fichier qui pompe des ressources et alourdi les perfs. Problème : si je le supprime, ca casse le site :/

<quote>protège ton dossier administrator avec un mot de passe Apache</quote> C'est au niveau du serveur que je dois le protéger ? Si on y accède via le navigateur, un mot de passe est demandéé (ou alors, on ne parle pas de la même chose ?)

Effectivement, je n'ai pas développé une page 404. J'avoue, ce n'était pas ma priorité...

Je vais lancer un audit avec Chrome. Pour le moment, j'utilise sitechecker.pro pour l'analyse.
Je suis preneur de tout conseil, suggestions.

Je te remercie encore :)
Dionee
 
WRInaute impliqué
Je suis clair sur l'exemple : en principe, le lien canonique aurait dù être le lien sans le paramètre. Pourquoi, dans ce cas, ce n'est-ce pas grave ?
C'est pas grave parce que Google n'a pas indexé plein de pages aux URL imprévues. Le genre de problème que ça résous, c'est quand tu t'aperçois que Google explore plein de pages avec par exemple des paramètres comme ?couleur=bleu, ?couleur=rose, ?couleur=gris etc., alors que c'est toujours la même page que le serveur lui renvoie. Mais Google n'a que des URL "propres" pour ton site, tu n'es pas dans ce genre de cas. Si tu mets des canonical en place, ça sera pour éviter des dérapages éventuels, pas pour résoudre un problème que tu as maintenant.

Pour le robots.txt, je l'ai testé avec https://fr.ryte.com/ qui n'a pas relevé d'erreurs. Quelles sont celles que tu as vu ?
Celles rapportées par l'audit de Chrome :
Allow: .js : Pattern should either be empty, start with "/" or "*"
Allow: .css : Pattern should either be empty, start with "/" or "*"
Et c'est vrai, tu devrais avoir une étoile avant les extensions... ou plutôt non, les Allow peuvent être supprimés purement et simplement.

C'est au niveau du serveur que je dois le protéger ? Si on y accède via le navigateur, un mot de passe est demandéé (ou alors, on ne parle pas de la même chose ?
Si, on parle bien de la même chose :)
Là je parle d'expérience personnelle : il y a quelques années, j'utilisais un logiciel pour gérer mes pubs. Il y avait aussi un mot de passe pour accéder à l'admin. Sauf qu'au fil du temps, une faille a été trouvée pour passer outre le login, et ajouter du code malveillant aux pubs qui étaient diffusées sur mon site... et c'est arrivé.
Voilà le problème : tant que tu n'interdis pas carrément l'accès au dossier d'admin sans mot de passe au niveau d'Apache, tu n'es pas à l'abris qu'une faille soit découverte dans ton CMS qui permet de passer outre l'authentification. Et crois-moi, pour Wordpress ou Drupal, il y a du monde qui cherche comment contourner le login.
Si tu mets toute l'admin derrière un mot de passe Apache, tu élèves le niveau de sécurité de ton site de beaucoup de crans, même si tu ne fais pas les mises à jour très fréquemment. C'est vraiment simple à mettre en place, et ça améliore grandement la sécurité.
De plus, actuellement ton site est en http et ton login/mot de passe circulent en clair sur le réseau quand tu te connectes, et ça c'est pas top-top. Mais bon, HTTPS, c'est encore une autre histoire.
 
Nouveau WRInaute
:) Merci


Je présume que c'est en allant voir :site que tu as pu te rendre compte qu'aucune URL "sales" n'a été indexées ?
Dans ce cas, effectivement, il n'y a pas urgence. Ceci dit, pour satisfaire ma curiosité, je souhaiterais aller jusqu'au bout de l'exercice. A commencer quelque chose, autant le finir proprement.
Pour la résolution, je pense rajouter un pattern qui prenne en compte les parametres pour faire une redirection vers la page sans le parametre, dans le .htaccess.
Est-ce une solution acceptable ?


Si je retire les Allows, je ne pourrai pas autoriser le crawler à fouiner les CSS et JS ?


Effectivement....
Je présume que c'est la page qui te redirige vers une 403 au cas où le mdp est mal renseigné ,
Faut que je vois avec mon hébergeur comment mettre ca en place.


Par contre, je ne vois pas ce que je peux faire avec le JQuery.
Sauf en supprimant du code inutile, mais je ne suis pas très chaud pour modifier un fichier générique.
Au moins que je puisse agir autrement ?

Merci à toi
Dionee
 
WRInaute impliqué
Pour la résolution, je pense rajouter un pattern qui prenne en compte les parametres pour faire une redirection vers la page sans le parametre, dans le .htaccess.
Est-ce une solution acceptable ?
Dans ton cas, oui.

Si je retire les Allows, je ne pourrai pas autoriser le crawler à fouiner les CSS et JS ?
Si tu as des CSS et JS dans les dossiers en disallow, effectivement le bot ne pourra pas les crawler.
Si c'est pour ça que tu as des allow, ils devraient être sous cette forme :
Allow: /*.js$
Allow: /*.css$

Je présume que c'est la page qui te redirige vers une 403 au cas où le mdp est mal renseigné ,
Yep. C'est ce genre de choses : https://www.digitalocean.com/commun...rd-authentication-with-apache-on-ubuntu-14-04

Par contre, je ne vois pas ce que je peux faire avec le JQuery.
Bah ça... ça dépend de ton code. Si tu utilises des scripts qui ont besoin de jQuery, ça risque de te demander du boulot.
Toujours est-il qu'en l'état actuel, tu as deux versions de jQuery qui se chargent, deux jQuery Migrate... je ne sais pas à quoi sert RSSocial mais il a une erreur... est-ce qu'il fonctionne ?
Tu as aussi Mootools, encore un framework Javascript (sert-il ?), menu.js est "compressé" avec packer ce qui a plus tendance à ralentir le site qu'autre chose...
Bref, il y a peut-être moyen d'alléger tout ça.

Après, est-ce que ça vaut vraiment le coup d'y passer du temps, c'est une autre histoire. Ça n'est pas forcément en passant beaucoup de temps sur ton site pour bien l'optimiser que ça va faire exploser ton activité.
 
Nouveau WRInaute
Non, c'est vrai... d'autant plus que le site n'est pas trop mal placé.
Ceci dit, j'aime aller jusqu'au bout des choses et les comprendre :)

L'optimisation js ne sera pas fait dans l'immédiat. En revanche, je vais mettre le mdp Apache et finaliser les redirections...

En parcourant différents sites, je vois plusieurs infos différentes concernant le référencement des images. D'après ce que j'en conclus, le nom des images, l'ALT, la description ont toutes leur importance (j'ai impression que cela n'étais pas toujours vrai selon les époques...)
Là où je ne suis pas clair concerne le nom de l'image car j'ai eu 2 sons de cloche : faut-il un "_" ou un "-" pour séparer 2 mots distincts ?
 
Nouveau WRInaute
Je te remercie, ca confirme ce qui avait l'air de se dire.

Un autre problème me fait des noeuds au cerveau : les titres
Je sais qu'il faut un H1 par page, qu'on peut mettre autant de Hn qu'on veut, pourvu qu'il y ait une hiérarchisation et du contenu pertinent.

Or, le template que j'utilise affecte le H1 pour afficher le nom de l'entreprise.
Est-ce que le fait d'avoir le même H1 sur toutes les pages du site est préjudiciable ? Ou mieux vaut-il que je le transforme en <div> ?
 
WRInaute impliqué
Est-ce que le fait d'avoir le même H1 sur toutes les pages du site est préjudiciable ? Ou mieux vaut-il que je le transforme en <div>

En quelque sort / oui. Avoir le nom du site en H1 n'a pas trop de sens, c'est une occasion de perdue d'exposer clairement aux moteurs (et aux synthèses vocales, aussi, entre autres) quel est le thème principal de la page.
 
WRInaute accro
Là où je ne suis pas clair concerne le nom de l'image car j'ai eu 2 sons de cloche : faut-il un "_" ou un "-" pour séparer 2 mots distincts ?

Il n'y a pas 2 sons de cloche... Gogole ne considere pas l'underscore ( _ ) comme etant un separateur de mots, seul le tiret ( - ) est considéré comme separateur... point barre..

pour :
La_petite_maison_dans_la_prairie Gogole lit "lapetitemaisondanslaprairie"
La-petite-maison-dans-la-prairie Gogole lit "La petite maison dans la prairie"

A toi de voir ce qui est le plus logique
 
Discussions similaires
Haut