Indexation d'un site en construction

Discussion dans 'Crawl et indexation Google, sitemaps' créé par emrik-site, 1 Août 2019.

  1. emrik-site
    emrik-site Nouveau WRInaute
    Inscrit:
    1 Août 2019
    Messages:
    6
    J'aime reçus:
    0
    Bonjour à tous,

    Tout d'abord merci pour le contenu de ce site et les échanges qui m'ont aidé dans plusieurs cas.

    Je suis actuellement en train de construire un site sous wordpress pour ma future entreprise. Dès l'obtention de l'hébergement, j'ai verrouillé l'accès au site par un mot de passe (.htaccess + .htpasswd), principalement pour éviter que le site soit indexé par les moteurs de recherches. J'ai enlevé la protection par mot de passe pendant une dizaine de minutes afin de tester un plugin qui ne fonctionnait pas (WP Super Cache).

    Avec la fonction inurl:monsite.fr, je viens de voir que la page d'accueil de mon site est indexée sur google, ainsi que quelques autres pages (dont certaines totalement "random" avec du texte en anglais et latin). Avec la fonction cache:monsite.fr, je vois que l'heure de l'indexation correspond au créneau d'une dizaine de minutes où mon site était accessible sans mot de passe.

    Je me pose donc les questions suivantes:

    1) Comment google a-t-il eu connaissance de mon site, sachant qu'il n'y a en principe aucun lien externe pointant vers celui-ci? Cela peut-il être via une carte google maps que j'ai insérée dans mon site, par exemple?
    2) Y-a-t-il une raison expliquant que mon site ait été "crawlé" justement pendant l'intervalle de 10 minutes sans mot de passe? Ou c'est simplement que le robot est passé au mauvais endroit au mauvais moment... (pas de chance) ?
    3) En attendant que mon site soit terminé et publié, que me recommandez-vous pour faire désindexer ces pages?
    - attendre: les pages seront-elles désindexées naturellement, étant donné que leur accès est verrouillé?
    - demander la désindexation via la Search Console: mais cela sera-t-il préjudiciable pour l'indexation à l'avenir?
    - autre...?

    Je vous remercie!
     
  2. Li0n.
    Li0n. Nouveau WRInaute
    Inscrit:
    16 Juillet 2019
    Messages:
    10
    J'aime reçus:
    0
    Alors, je pense que d'autres te donneront leur avis mais voici le mien :

    1) As-tu coché la case qui demande de ne pas indexer ton site dans les réglages wordpress ? (réglages => lecture). Je ne sais pas exactement comment ça fonctionne mais c'est une piste.

    2) Voir 1)

    3) Ça va dépendre du temps qui sera mis avant que tu publies ton site ? Si cela va prendre encore un peu de temps, tu peux éventuellement faire une 302 de toutes les pages indexées vers une page qui dit que ton site est en construction ou tu peux aussi essayer de mettre toutes tes pages en 410.
     
  3. emrik-site
    emrik-site Nouveau WRInaute
    Inscrit:
    1 Août 2019
    Messages:
    6
    J'aime reçus:
    0
    Bonjour,

    Non, je n'ai pas coché l'option dans Wordpress car j'ai lu que ce n'était pas forcément efficace. J'ai préféré le choix plus radical de mettre un mot de passe via le .htaccess, ce qui en principe est infaillible. Mais je ne pensais pas qu'en l'enlevant 10 minutes je risquais d'être indexé!

    Le site sera prêt d'ici un mois au plus tôt. Je me demande comment réagit Google quand il tente de visiter à nouveau une page bloquée par .htaccess: sera-t-elle désindexée, ou alors il n'y aura aucun changement?

    Merci
     
  4. Furtif
    Furtif WRInaute passionné
    Inscrit:
    9 Août 2005
    Messages:
    2 440
    J'aime reçus:
    119
    Ca mange pas de pain, un robots.txt :

    User-agent: *
    Disallow: /
     
  5. cthierry
    cthierry WRInaute passionné
    Inscrit:
    15 Janvier 2005
    Messages:
    2 187
    J'aime reçus:
    37
  6. emrik-site
    emrik-site Nouveau WRInaute
    Inscrit:
    1 Août 2019
    Messages:
    6
    J'aime reçus:
    0
    Merci, mais maintenant que ma page a été indexée pendant le laps de temps sans mot de passe, va-t-elle être désindexée même avec le mot de passe actif?

    J'ai vérifié le timing, la page a été indexée 3 secondes avant que j'ai uploadé le .htaccess avec le mot de passe... vraiment pas de chance!
     
  7. freestyle83
    freestyle83 WRInaute occasionnel
    Inscrit:
    19 Novembre 2011
    Messages:
    314
    J'aime reçus:
    5
    Tu as regardé quand les archives du net si ton domaine n'existait pas auparavant ? Ce qui pourrait expliquer pourquoi les bots ont crawlés.

    Mais si tu ne voulais pas qu'il soit en ligne, pourquoi ne pas avoir fait la prod en local ?

    En attendant, là tu perds ta prime de fraîcheur.
    Et pour les pages ben je serais d'avis de conserver l'accueil et de mettre un genre de compte a rebours et en profiter pour attirer du monde sur ton futur projet (en passant pas les réseaux sociaux), avec pourquoi pas un petit formulaire pour rappeler à l'ouverture (ça dépend de ton site en fait).Quitte à perdre la fraîcheur autant en profiter pour en tirer quelque chose.
    Les autres pages, tu les passes en noindex, nofollow. ou en 302 vers la home, comme l'a suggéré une autre personne au dessus.
     
  8. KOogar
    KOogar WRInaute accro
    Inscrit:
    16 Novembre 2004
    Messages:
    4 298
    J'aime reçus:
    18
    Bien sur ca peu, donc soit avec google map, ou avec les fonts google... ou avec ton navigateur tout simplement... Tu as été activé :) :) :)

    Tu crois que le critère "prime fraicheur" est bourrin a ce point? Le site a été en ligne 10 minutes...
     
  9. freestyle83
    freestyle83 WRInaute occasionnel
    Inscrit:
    19 Novembre 2011
    Messages:
    314
    J'aime reçus:
    5
    Je crois que la prime de fraîcheur démarre au moment où le site est indexé pour la première fois. o_O

    C'est peut-être dix minutes, mais il a été indexé, donc elle est en cours...
     
  10. KOogar
    KOogar WRInaute accro
    Inscrit:
    16 Novembre 2004
    Messages:
    4 298
    J'aime reçus:
    18
    J'avais compris ton raisonnement. Tu dis bien "Je crois"... ca reste une supposition. Je sais j'suis ch..
     
Chargement...
Similar Threads - Indexation construction Forum Date
WordPress Indexation d'un site sur Google Débuter en référencement 4 Août 2019
Search Console Indexation de milliers de pages d'un site de dizaines de pages Crawl et indexation Google, sitemaps 26 Juillet 2019
Désindexation pdf via htaccess Crawl et indexation Google, sitemaps 9 Juillet 2019
wordpress, indexation, liens re écrits Débuter en référencement 4 Juillet 2019
Search Console Problème indexation page produit - prestashop 1.6 Débuter en référencement 25 Juin 2019
2 versions du code source en fonction du User Agent [Indexation / SEO] Crawl et indexation Google, sitemaps 25 Juin 2019
Lenteurs d'indexation Google Crawl et indexation Google, sitemaps 18 Juin 2019
Problème indexation partielle Crawl et indexation Google, sitemaps 3 Juin 2019
demande d'indexation google - Cette URL n'a pas été indexée par Google Référencement Google 12 Mai 2019
Problème d'indexation de pages Crawl et indexation Google, sitemaps 3 Mai 2019
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice