Extraction Screaming Frog / Xenu ou Webrankinfo impossible

Discussion dans 'Crawl et indexation Google, sitemaps' créé par jnceweb, 17 Décembre 2017.

  1. jnceweb
    jnceweb WRInaute discret
    Inscrit:
    30 Décembre 2013
    Messages:
    62
    J'aime reçus:
    0
    Bonjour,
    Je me permets de laisser un message sur le forum car je souhaiterais extraire toutes les META (TITLE / DESCRIPTION) de mon site et je n'y parviens pas avec Screaming Frog ou encore Xenu.

    Mon site est https://www.agencetapisrouge.com/ et je serai très content d'avoir votre aide :) Est-ce une erreur dans le header ? Déjà je trouve étrange quand vous allez sur une catégorie de mon site et que vous copiez / collez l'URL, c'est celle-ci n'est pas la même (% -)

    Merci d'avance,
    Jonathan
     
  2. Madrileño
    Madrileño Madribot
    Inscrit:
    7 Juillet 2004
    Messages:
    37 915
    J'aime reçus:
    75
    Bonjour,

    Vous pouvez vérifier les paramètres de vos outils et site Internet (cf. ci-dessous avec la première page).
    Xenu fonctionne bien, mais Screaming Frog de base indique 0 en size de la page d'accueil.
    Il semble que pour certains UA le site ne souhaite pas présenter les contenus des pages.
    Et un peu d'URL rewriting serait bien avec certaines de vos URL (qui n'en ont pas).
    Vérifier aussi le fonctionnement des URL pour corriger certaines erreurs actuelles.

    Temps de réponse : 15 minutes.
    Cordialement.
     
  3. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    22 897
    J'aime reçus:
    27
    J'ai testé (avec mon outil RM Tech) les 10 000 premières pages (URL) et c'est assez catastrophique : 90% des URL ont un problème qui fait qu'elles ne sont pas indexables. En gros, c'est ce que j'appelle "un paquet de masse noire"...
    Avant même de s'attaquer aux titres, je pense qu'il faudrait nettoyer le site du côté technique. Je n'ai pas trouvé quel CMS est utilisé (s'il y en a un).
     
  4. anemone-clown
    anemone-clown WRInaute passionné
    Inscrit:
    11 Novembre 2007
    Messages:
    1 719
    J'aime reçus:
    1
    J'ajouterai que les virgules dans les liens vont empêcher pas mal de copies de liens avec des systèmes anciens d' "autolink". Même si la virgule est théoriquement autorisée dans des url, pas mal de serveurs (nginx peut être paramétré pour cela par exemple) la filtre dans les urls pour éviter certaines attaques...

    C'est probablement le problème de ton (% ... ;-)
     
  5. spout
    spout WRInaute accro
    Inscrit:
    14 Mai 2003
    Messages:
    8 739
    J'aime reçus:
    15
    Penser à corriger la faille XSS sur la recherche.
     
  6. jnceweb
    jnceweb WRInaute discret
    Inscrit:
    30 Décembre 2013
    Messages:
    62
    J'aime reçus:
    0
    Qu'entends-tu par faille XSS ?

    Merci
     
  7. spout
    spout WRInaute accro
    Inscrit:
    14 Mai 2003
    Messages:
    8 739
    J'aime reçus:
    15
  8. jnceweb
    jnceweb WRInaute discret
    Inscrit:
    30 Décembre 2013
    Messages:
    62
    J'aime reçus:
    0
    D'ailleurs pour toutes ces pages produits sans réel contenu que me conseillez-vous de faire ? NOINDEX en attendant d'avoir du contenu de qualité afin de garder que mes pages importantes sur lesquelles je veux ranker ? Si oui comment reconnaître ces pages à "cacher" ?

    Merci
     
  9. Madrileño
    Madrileño Madribot
    Inscrit:
    7 Juillet 2004
    Messages:
    37 915
    J'aime reçus:
    75
    Bonjour,
    Améliorer les pages pour avoir un bon contenu et indexer celles-ci une fois à jour (en attendant noindex si celles-ci sont pénalisantes).
    Vous pouvez aussi corriger les bugs du site Internet.

    Temps de réponse : 5 minutes.
    Cordialement.