Search Console Google ne reconnaît pas cette URL ?

Nouveau WRInaute
Bonjour,

Cela fait bien longtemps que je ne me suis pas penché sur l'hébergement web... Et je suis bien rouillé sur ce sujet ! Les temps ont bien changé, les bonnes pratiques et outils SEO me manquent et j'ai vraiment besoin d'aide sur ce coup.

Depuis quelques mois, j'héberge le (petit) site professionnel d'un membre de ma famille suite à un désaccord avec son hébergeur. Ce site était bien référencé par google auparavant, mais depuis la migration chez moi il en a totalement disparu. Il est par contre toujours présent chez les autres moteur de recherche.

Ce site est donc stocké sur un serveur personnel que j'administre depuis des années. Un apache tourne dessus, ainsi que d'autre service. Un certificat SSL valide a été généré chez Let's Encrypt.
J'ai généré un sitemap, ainsi qu'un fichier robots.txt. Puis créé un compte google pour accéder à Search Console (et avec ajout du record TXT qu'il faut dans le domaine).

Et c'est là que ca coince : dès que j'envoie le sitemap, GSC me renvoie "Impossible de lire le sitemap" "Erreur HTTP générique". Aussi, dans l'inspection d'URL, un Test en direct me renvoie "Google ne reconnaît pas cette URL", sans plus d'infos.

Dans les logs d'apache, à aucun moment je ne vois googlebot tenter un accès à mon serveur. Le firewall ne bloque pas google, j'ai d'ailleur un postfix sur ce serveur acceptant les connexions de gmail.


Aurais-je oublié quelque chose ?

Le site en question : https://www.laroulottedessalaisons.fr

Merci grandement par avance !
 
Olivier Duffez (admin)
Membre du personnel
ton URL canonique n'est pas bonne :
Code:
<link href="index" rel='canonical' />

quand je teste la version mobile avec l'outil de Google j'ai aussi : " Page inaccessible
Il est possible que la page soit indisponible ou bloquée par un fichier robots.txt."
 
WRInaute impliqué
Peut-être une question d'encodage ?

Il n'en est pas déclaré et Google indique que "Le format de fichier attendu est du texte brut encodé en UTF-8".

Sur stackoverflow est relaté un problème de fichier considéré comme invalide par Google suivant l'éditeur utilisé qui vicie la première ligne et conseille de laisser la première ligne vide.

Tester le fichier robots.txt, via les outils google pour être sûr.
 
Nouveau WRInaute
Merci pour ces réponses.

Je ne connaissais pas cet outil de google pour tester les sites en mode mobile. Effectivement, ca ne marche pas dessus non plus et je peux constater les mêmes symptomes qu'avec les test URL ou sitemap : je ne vois aucune connexion de googlebot dans mes logs d'apache. La présence ou non de robots.txt n'y change rien.

J'ai donc essayé en créant une page accessible par HTTP et sans vhost (par simple IP donc). Et uniquement dans ce cas, googlebot vient chez moi !

Le problême serait donc coté DNS. Mais là encore, je vois pas de requête de la part de google dans les logs de bind...

Je vais fouiller de ce coté, il y a peut-être une exigence de google sur les records du domaine.
 
Discussions similaires
Haut