URLs introuvables dans les outils pour les webmasters Google

Discussion dans 'Problèmes de référencement spécifiques à vos sites' créé par 2011N2, 10 Novembre 2014.

  1. 2011N2

    2011N2 Nouveau WRInaute

    Inscrit:
    22 Octobre 2013
    Messages:
    16
    J'aime reçus:
    0
    Bonjour,

    J'ai récemment migré de ForumActif pour passer sur phpBB, grosse galère puisque ForumActif ne fournit aucun accès à la BDD et ne donne pas de backup, mais j'ai pu tout récupérer.

    Ce n'est pas là le problème, mais cette migration a forcément imposé des changements d'URL de tous les topics (impossible de les conserver malheureusement). Donc chute de trafic totale, logique, je m'y attendais. Il faut savoir que mon forum a plus de 148 000 messages et 7200 sujets.
    J'ai évidemment effectué des redirections dans le fichier .htaccess, mais seulement pour les sujets les plus consultés : 1000 redirections tout de même.

    Puis les choses se sont arrangées, mais ça fait un moment que je stagne à environ 1/3 de mon trafic d'avant. La cause est surement que Google continue de buter sur les anciennes URL, car il me trouve 128 000 URLs introuvables dans les outils pour les webmasters, et une centaine de plus chaque jour, ça ne cesse d'augmenter donc. Une capture d'écran ci besoin : http://www.cjoint.com/14nv/DKklLBQdori_erreurs_google.png

    Évidemment, je ne peux pas effectuer 128 000 redirections pour 2 raisons simples : cela me prendrait un temps de fou, et puis cela alourdirait considérablement le fichier .htaccess, qui l'est déjà pas mal avec 1000 redirections.

    Normalement, la seule chose à faire est d'attendre que Google comprenne. Toutefois, je poste ici pour recueillir d'autres avis :
    1/ Est-ce que vous pensez que Google va finir par comprendre ? Si vous avez déjà eu affaire à cela, savez-vous combien de temps cela risque de prendre ? Car ça fait plus d'un mois et ça continue d'augmenter.
    2/ Il n'y a pas tout simplement un moyen de lui demander d'arrêter de buter là-dessus ? J'ai cherché, mais rien trouvé...

    Si besoin l'URL de mon site est celle de mon profil.

    Merci par avance pour vos réponses :)

    Gabriel.
     
  2. spout

    spout WRInaute accro

    Inscrit:
    14 Mai 2003
    Messages:
    8 665
    J'aime reçus:
    2
    Si les ID des topics n'ont pas changés, tu peux faire ça en PHP.
     
  3. 2011N2

    2011N2 Nouveau WRInaute

    Inscrit:
    22 Octobre 2013
    Messages:
    16
    J'aime reçus:
    0
  4. spout

    spout WRInaute accro

    Inscrit:
    14 Mai 2003
    Messages:
    8 665
    J'aime reçus:
    2
    Le changement de répertoire du forum ne l'empêche pas du tout.
     
  5. 2011N2

    2011N2 Nouveau WRInaute

    Inscrit:
    22 Octobre 2013
    Messages:
    16
    J'aime reçus:
    0
    Re,

    On a tenté énormément de choses en php avec les URLs pour que cela ne donne pas de 404 même si ce sont les mêmes ID, mais malheureusement à chaque fois ça buggait.

    Mais à vrai dire, ce n'est pas un gros problème qu'elles soient différentes, car s'il reste de sites externes renvoient vers des 404, je le vois dans les stats et rajoute une redirection dans le .htaccess.

    Le seul truc est que je ne sais pas comment Google pourrait oublier les anciennes URLs... Surement avec le temps mais c'est étrange que ça progresse de jour en jour surtout.

    Gabriel.
     
  6. UsagiYojimbo

    UsagiYojimbo WRInaute accro

    Inscrit:
    23 Novembre 2005
    Messages:
    12 380
    J'aime reçus:
    0
    Si tu es parti d'un scrap / export de ta base de donnée initiale et si tu as les mêmes ID, ca n'a pas été possible de procéder avec une table de correspondance ? ce qui évite toute gestion via la .htaccess et se fait somme tout assez rapidement ?
     
  7. 2011N2

    2011N2 Nouveau WRInaute

    Inscrit:
    22 Octobre 2013
    Messages:
    16
    J'aime reçus:
    0
    Re,

    Non justement, ça a été extrêmement complexe : sur mon hébergeur initial, ForumActif je n'avais AUCUN accès à la BDD, à rien du tout en fait.

    On a été obligé de faire passer un script qui passait sur tous les sujets et membres pour les récupérer. Une BDD faite maison quoi... Pour ça que les URL c'était pas possible.

    Gabriel.
     
  8. UsagiYojimbo

    UsagiYojimbo WRInaute accro

    Inscrit:
    23 Novembre 2005
    Messages:
    12 380
    J'aime reçus:
    0
    Bein je comprends pas du coup pourquoi, étant donné qu'il avait crawler, ne pas avoir récupéré l'url également.

    Mais même sans cela, dans un topic PHPBB, voire dans un sous-forum, les id sont présents dans les div qui encadrent le contenu. Rien qu'avec l'id, en connaissant la nomenclature des url du CMS, c'est jouable de mettre au point un script qui détecte l'ancien schéma, isole l'id et redirige sur la nouvelle page équivalente.
     
  9. baud74

    baud74 WRInaute impliqué

    Inscrit:
    21 Juillet 2014
    Messages:
    623
    J'aime reçus:
    0
    des messages sans mise à jour depuis des années, google ne va pas les vérifier tous les jours, c'est donc normal que cela progresse au fur et à mesure qu'il vérifie ces urls.
     
  10. 2011N2

    2011N2 Nouveau WRInaute

    Inscrit:
    22 Octobre 2013
    Messages:
    16
    J'aime reçus:
    0
    Re,

    Probable qu'il existe une solution, mais tout ce qu'on a essayé de "classique" n'a pas fonctionné, le reste demandait un énorme boulot, et avec déjà toutes les galères qu'on a eu pour cette migration, pas trop eu le courage.

    Oui à mon avis ce n'est qu'une question de temps, c'était surtout pour savoir si c'était possible de signaler à Google que les URL introuvables répertoriées n'existent plus, pour gagner du temps.

    Gabriel.
     
  11. UsagiYojimbo

    UsagiYojimbo WRInaute accro

    Inscrit:
    23 Novembre 2005
    Messages:
    12 380
    J'aime reçus:
    0
    Et même sans attendre cela, tu peux en gérer rapidement un bon nombre, en te basant sur les statistiques de visite des pages.
     
  12. 2011N2

    2011N2 Nouveau WRInaute

    Inscrit:
    22 Octobre 2013
    Messages:
    16
    J'aime reçus:
    0
    Re,

    Oui c'est ce que je fais, je suis attentif aux 404, notamment à cause des liens présents sur d'autres sites, ou même en interne.

    Gabriel.