Googlebot confusion des sous domaines serveur ou bot en folie?

Discussion dans 'Crawl et indexation Google, sitemaps' créé par longo600, 30 Juin 2013.

  1. longo600
    longo600 WRInaute passionné
    Inscrit:
    24 Février 2005
    Messages:
    2 208
    J'aime reçus:
    5
    Bonjour,

    voila, je n'ai rien touché, mais j'ai de plus en plus d'erreurs de crawl de google qui indexe des pages qui ne correspondent pas au répertoire ou elles se trouvent. Je retrouve ces erreurs par millier dans GWT, et dans mes logs.

    Il m'attribue des pages par exemple nice.html ou cannes.html dans le répertoire et sous domaine 04-alpes-de-haute-provence.annuairefrancais.fr alors qu'il n'y a aucune page de ce nom dans ce répertoire.
    ex dans les serps sur la requête "103 boulevard de la croisette 06 cannes" , mais il n'y a pas de cache sur le lien ...

    Soit c'est une erreur du bot ou de la base, soit (je pense plutot) de mon serveur. Vu que c'est un dédié chez ovh et que je n'ai jamais eut cette erreur, et que je ne connais pas bien cette partie, je suis coincé. Je n'ai ni base sql, ni php, que je n'utilise que de l'HTML depuis des années, et les mêmes fichiers de config.

    QQ1 a une idée? probleme sur fichier htaccess? cache du serveur corrompu (je le redemarre souvent). Le serveur tourne depuis 7 ans chez OVH sans broncher ... merci de votre aide ou piste.
     
  2. longo600
    longo600 WRInaute passionné
    Inscrit:
    24 Février 2005
    Messages:
    2 208
    J'aime reçus:
    5
    un ptit up, desfois que QQ1 aurait une idée lumineuse ... :)
     
  3. longo600
    longo600 WRInaute passionné
    Inscrit:
    24 Février 2005
    Messages:
    2 208
    J'aime reçus:
    5
    Nouveau up car je continus d'avoir des remontées d'erreurs 404 en masse, suite a des pages de sous domaines indexées et mélangées a d'autres sous domaines. Google a indexé des pages n'étants pas dans le répertoire du sous domaines mais d'un autre sous domaine, les mélangeants toutes, ce qui semble impossible, car ce ne sont que des pages statiques et le serveurs n'a pas été modifié depuis des années.

    Ni l'analyse des logs http ni du serveur avec l'aide des techniciens d'OVH n'a pas permi de détecter des erreurs serveurs, ni comprendre pourquoi les pages du répertoire B se retrouvent indexées dans Google dans le répertoire A ou Z ...

    Sur les caches Google, les datent varient de mai a juillet ...

    Je vais finir par croire que soit le BOT a eut un bug (je doute car je ne serait pas seul dans ce cas), soit mon serveur a un bug sur des fichier .htaccess (je viens de le changer et partis sur un neuf et plus de fichier htaccess), soit du négative SEO sur des proxy intermédiaires (si cela est possible?).

    Quelques exemples de pages dans Google (copier l'url dans la zone de recherche donnera l'index par google et le cache) :
    -http://42-loire.annuairefrancais.fr/dentiste/boulogne-billancourt-5.html
    -http://41-loir-et-cher.annuairefrancais.fr/dentiste/index-23.html
    etc etc.

    Je deviens parano du NSEO, même si l'incidence n'est pas importante (-10% de trafic), si quelqu'un a une idée ...merci d'avance.
     
Chargement...
Similar Threads - Googlebot confusion domaines Forum Date
Comment augmenter la fréquence de passage de GoogleBot Crawl et indexation Google, sitemaps Mardi à 23:41
Site inaccessible pour GoogleBot Crawl et indexation Google, sitemaps 21 Octobre 2019
En décembre 2019 changement de l'user agent de Googlebot Crawl et indexation Google, sitemaps 5 Octobre 2019
googlebot crawle des pages inexistantes Crawl et indexation Google, sitemaps 16 Août 2019
Les pages 404 avec googlebot Crawl et indexation Google, sitemaps 14 Juin 2019
Evergreen Googlebot, basé sur Chromium (Chrome open source) Référencement Google 9 Mai 2019
Empêcher Googlebot de crawler/indexer tout un dossier Débuter en référencement 19 Avril 2019
GoogleBot scan url inexistante Crawl et indexation Google, sitemaps 17 Avril 2019
feuilles de styles non obtenues par Googlebot Crawl et indexation Google, sitemaps 28 Septembre 2018
Temps de réponse serveur googlebot Développement d'un site Web ou d'une appli mobile 23 Mai 2018
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice