Robots.txt et ht access à propos des fichiers d'un repertoire

Discussion dans 'Débuter en référencement' créé par Doubrovski, 2 Mai 2011.

  1. Doubrovski
    Doubrovski WRInaute occasionnel
    Inscrit:
    9 Avril 2011
    Messages:
    435
    J'aime reçus:
    0
    Bonjour !
    Je me pose une question à propos de mon fichier robots.txt en parallèle au fichier ht access d'un répertoire.
    J'ai des images dans un répertoire qui peuvent être référencées, et d'autres qui ne doivent pas l'être (selon l'extension : les .jpg peuvent être référencées, mais pas les .png).
    Le fichier ht access du répertoire autorise bien l'affichage dans le navigateur des .jpg, mais pas les .png qui sont au contraire téléchargeables uniquement sous certaines conditions et ne peuvent pas s'afficher dans le navigateur. Donc ça fonctionne au niveau ht access mais que fait google quand il tombe sur une adresse d'image qui n'est pas autorisée par le ht access ? Il ne peut pas les référencer ?

    Ma question concerne donc le fichier robots.txt :
    -Dois-je bloquer mes répertoires d'images avec un /disallow, alors que j'aimerais quand même référencer mes jpg ?
    -Puis-je ne pas indiquer les répertoires d'images dans le robots.txt, sans être inquiété du possible référencement des .png ?

    La question est peut-être débile, mais je voulais m'assurer qu'un répertoire ou une extension de fichiers bloquée par .ht access ne pourront pas être référencés par google.
     
  2. Doubrovski
    Doubrovski WRInaute occasionnel
    Inscrit:
    9 Avril 2011
    Messages:
    435
    J'aime reçus:
    0
    En me relisant, je vois que ce n'est pas clair. Désolé.

    En bref j'aimerais savoir si dans un répertoire, un fichier .htaccess qui interdit l'accès aux .png d'un dossier + un index.html qui redirige, permet quand même à google d'indexer les images restante du répertoire (comme les .jpg).

    En supposant que le robot google parcoure également les répertoires.

    Voici le .htaccess des dossiers :
    Code:
    <Files *.png>
    Deny from all
    </Files>
    Bonne soirée.
     
  3. _Soul
    _Soul WRInaute impliqué
    Inscrit:
    26 Avril 2011
    Messages:
    626
    J'aime reçus:
    0
    Salut,

    Juste un
    Code:
    Allow from *ip google bot*
    ?
     
Chargement...
Similar Threads - Robots access propos Forum Date
Où puis-je configurer le fichier robots.txt et le htaccess ? Débuter en référencement 10 Avril 2018
La description de ce résultat n'est pas accessible à cause du fichier robots.txt Crawl et indexation Google, sitemaps 31 Juillet 2015
Site déréférencé et inaccessible aux robots après mise à jour Débuter en référencement 6 Octobre 2014
Exception htaccess robots.txt URL Rewriting et .htaccess 22 Mai 2014
Supprimer 200 pages inexistantes avec un robots.txt et redirection dans un htaccess Crawl et indexation Google, sitemaps 27 Juin 2011
Probleme sitemap / robots.txt inaccessible Problèmes de référencement spécifiques à vos sites 26 Août 2010
Restriction : htaccess ou robots URL Rewriting et .htaccess 15 Décembre 2008
Search Console Images bloquées ... malgré absence de robots.txt Crawl et indexation Google, sitemaps 31 Octobre 2019
Aide sur le format de mon fichier robots.txt Crawl et indexation Google, sitemaps 25 Octobre 2019
Problèmes d'indexation et robots.txt Crawl et indexation Google, sitemaps 14 Octobre 2019
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice