403 forbidden : mauvais pour Google ?

Discussion dans 'Netlinking, backlinks, liens et redirections' créé par Roms6, 16 Août 2006.

  1. Roms6
    Roms6 Nouveau WRInaute
    Inscrit:
    1 Janvier 2006
    Messages:
    17
    J'aime reçus:
    0
    Bonsoir à tous,

    Les visiteurs en provenance du site frequence-news (qui prend mes news grâce aux flux RSS de mon site) obtiennent désormais un 403 forbidden quand ils arrivent sur une page de mon site grâce au code suivant dans mon .htaccess :

    SetEnvIfNoCase Referer "frequence-news.net" bad_ref
    Deny from env=bad_ref

    Question : le GoogleBot quand il suivra sur les liens de frequence-news (qui sont du style *ttp://www.frequence-news.net/clic.php?idnews=81302) ne va t-il pas croire que les vraies pages (*ttp://www.gamenews-fr.com/news/jeux-video/battlefield-2-%3a-pas-de-patch-1.4-pour-aujourd%27hui-20060815334.html par exemple) sont totalement indisponibles quand il remarquera que les pages sont en 403 forbidden ?

    Plus simplement, est-ce-que ça pourrait causer des problèmes d'indexation ou non ?
     
  2. moktoipas
    moktoipas WRInaute passionné
    Inscrit:
    29 Juin 2004
    Messages:
    1 495
    J'aime reçus:
    0
    je pense pas que google donne les referer donc il ne devrai pas avoir de pb..
     
  3. Roms6
    Roms6 Nouveau WRInaute
    Inscrit:
    1 Janvier 2006
    Messages:
    17
    J'aime reçus:
    0
    Et bien si tu veux, les url de frequence-news sont indexées sur Google et Google les prend finalement pour les vraies url (parce que ce sont des redirections 302) c'est pour ca que j'ai fait ce blocage.

    J'espère donc que quand google verra ces 403 forbidden, il continuera quand même à indexer mes urls correctement. :?
     
  4. moktoipas
    moktoipas WRInaute passionné
    Inscrit:
    29 Juin 2004
    Messages:
    1 495
    J'aime reçus:
    0
    google ne verra pas les 403.
     
  5. moktoipas
    moktoipas WRInaute passionné
    Inscrit:
    29 Juin 2004
    Messages:
    1 495
    J'aime reçus:
    0
    pour lui rien ne changera pas rapport à avant.
     
  6. Roms6
    Roms6 Nouveau WRInaute
    Inscrit:
    1 Janvier 2006
    Messages:
    17
    J'aime reçus:
    0
    Aie... Dans ce cas là, quelle est la solution pour éviter que les urls de frequence-news se substituent aux miennes dans l'index de Google ?
     
  7. moktoipas
    moktoipas WRInaute passionné
    Inscrit:
    29 Juin 2004
    Messages:
    1 495
    J'aime reçus:
    0
    j'en sais rien

    probablement demander au(x) webmaster de ce site de retirer cette redirection...


    tu peux me monter un exemple de requette ou ca se substitue ?
     
  8. Roms6
    Roms6 Nouveau WRInaute
    Inscrit:
    1 Janvier 2006
    Messages:
    17
    J'aime reçus:
    0
  9. moktoipas
    moktoipas WRInaute passionné
    Inscrit:
    29 Juin 2004
    Messages:
    1 495
    J'aime reçus:
    0
    Et en quoi c'est genant ?
     
  10. Roms6
    Roms6 Nouveau WRInaute
    Inscrit:
    1 Janvier 2006
    Messages:
    17
    J'aime reçus:
    0
    C'est très chiant de ne pas pouvoir observer quelles pages sont référencées et je suis quasi-certain que ca doit rabaisser la position des requêtes (les jeux vidéo et l'informatique, c'est pas vraiment le thème principal du site...). :?
     
  11. dmathieu
    dmathieu WRInaute accro
    Inscrit:
    9 Janvier 2004
    Messages:
    5 596
    J'aime reçus:
    0
    Pourquoi proposer un flux rss si c'est pour l'interdire à toute personne qui voudrait l'utiliser ???
    Dans le contenu du flux, tu n'es pas obligé de tout mettre. Ainsi, la personne, avide de savoir ce que contient la suite de l'article vient sur ton site.
    Et comme ton article est long, mais que celui du site syndiqué fait une centaine de caractères tout au plus, pas de problèmes de duplicate content.

    Sinon, tu interdit le chargement du flux depuis ce site (toujours via le referrer, mais sur le flux)
    Ainsi, plus de flux, plus de contenu "volé" (entre guillemets hein puisque tu le propose quand même)
    Mais plus de liens gratuits à chaque actualité que tu poste non plus.

    p.s. : sur frequence-news actuellement, il y a une redirection vers gamenews-fr (301 probablement, j'ai pas vérifié)
    Donc, aucun problème.
     
  12. Roms6
    Roms6 Nouveau WRInaute
    Inscrit:
    1 Janvier 2006
    Messages:
    17
    J'aime reçus:
    0
    Je crois que tu n'as pas tout compris :p .

    Je propose mes flux RSS, c'est pour que tout le monde y ait accès, il n'y a pas de problèmes à ca (et à ce que frequence-news l'ajoute à son portail) et le contenu du flux ne contient pas tout. Seulement, la redirection effectuée par ce site est de type 302 donc je ne considère pas vraiment ça comme des liens gratuits... :roll:

    Bref, ce n'est pas grave, je vais essayer de faire autrement (c'est pas la fin du monde hein). :wink:
     
  13. dmathieu
    dmathieu WRInaute accro
    Inscrit:
    9 Janvier 2004
    Messages:
    5 596
    J'aime reçus:
    0
    Eh bien, il existe toujours la solution d'interdire l'accès à ton flux au referer de ce site web, ils ne mettront plus en place les nouvelles actualités, et plus de redirections 302.
     
  14. Roms6
    Roms6 Nouveau WRInaute
    Inscrit:
    1 Janvier 2006
    Messages:
    17
    J'aime reçus:
    0
    Je veux bien la solution parce que je ne la connais malheureusement pas. :oops:
     
  15. dmathieu
    dmathieu WRInaute accro
    Inscrit:
    9 Janvier 2004
    Messages:
    5 596
    J'aime reçus:
    0
    Eh bien, lorsque le site web charge ton flux rss, il est bien obligé de l'ouvrir.
    Et la, c'est la que ca se complique.
    Je viens de faire un tour sur le site, il doit utiliser un robot d'indexation (charger les flux à la volée prendrait trop de temps au chargement)

    Donc, il faut que tu trouve un élément distinguant ce robot. Ce peut être son useragent, son ip, son referer.

    Pour cela, le mieux est de regarder les logs de visite de ton flux rss. De tenter de détecter lequel est frequence-news, voir ce qui ne change jamais chez eux (à mon avis, l'ip ne change pas, et ils ne doivent pas avoir la possibilité de la changer)
    Et avec un .htaccess, ou en php, tu interdit l'acces au flux rss à ce robot.
     
  16. Roms6
    Roms6 Nouveau WRInaute
    Inscrit:
    1 Janvier 2006
    Messages:
    17
    J'aime reçus:
    0
    Arf... Problème : je n'ai pas le log de visite détaillé de mon flux RSS :?

    Personne n'aurait dans les stats de son site web l'ip de leur bot par hasard (Frequence News - News Agent) :mrgreen: ?
     
  17. rolriam
    rolriam WRInaute occasionnel
    Inscrit:
    15 Juin 2005
    Messages:
    289
    J'aime reçus:
    0
    Tu devrais essayer de t'entendre avec eux (via email) et leur demander de retirer tes news...

    L'ip de leur serveur web est : 195.140.140.138
     
  18. Roms6
    Roms6 Nouveau WRInaute
    Inscrit:
    1 Janvier 2006
    Messages:
    17
    J'aime reçus:
    0
    Si tu veux, à partir du moment où tu as demandé trois fois par email qu'ils retirent tes news et qu'ils ne répondent pas, je crois surtout que j'ai affaire à des égoïstes.

    Sinon, tu es sûr que l'ip de leur serveur est la même que celle de leur bot ?
     
  19. rolriam
    rolriam WRInaute occasionnel
    Inscrit:
    15 Juin 2005
    Messages:
    289
    J'aime reçus:
    0
    Non, regarde dans tes logs... sinon bloque cette ip et regarde ce que ça fait :D
     
  20. Roms6
    Roms6 Nouveau WRInaute
    Inscrit:
    1 Janvier 2006
    Messages:
    17
    J'aime reçus:
    0
    Finalement, j'ai réussi à les bloquer en ajoutant les deux lignes suivantes dans mon .htaccess :

    SetEnvIfNoCase User-Agent "Frequence News" bad_bot
    Deny from env=bad_bot

    :wink:
     
  21. rolriam
    rolriam WRInaute occasionnel
    Inscrit:
    15 Juin 2005
    Messages:
    289
    J'aime reçus:
    0
    Ok nickel alors ;)
     
Chargement...
Similar Threads - 403 forbidden mauvais Forum Date
Erreur HTTP_403_Forbidden sur Majestic SEO Développement d'un site Web ou d'une appli mobile 13 Mai 2015
Erreur 403 Forbidden mais pourquoi ? Développement d'un site Web ou d'une appli mobile 8 Mars 2013
403 forbidden Développement d'un site Web ou d'une appli mobile 23 Mai 2012
Php urlencode et Apache RewriteRule = 403 Forbidden URL Rewriting et .htaccess 23 Avril 2012
Pourquoi entête HTTP 403 FORBIDDEN ? Problèmes de référencement spécifiques à vos sites 12 Avril 2012
Erreur : 403 forbidden Débuter en référencement 6 Septembre 2010
Problème 403 Forbidden, help. Problèmes de référencement spécifiques à vos sites 18 Avril 2009
Erreur 403 Forbidden Administration d'un site Web 13 Février 2009
Erreur 403 (Forbidden) avec outils sur pages internes -REGLE Netlinking, backlinks, liens et redirections 31 Octobre 2006
Erreur 403 Forbidden [hebergement chez ovh] Administration d'un site Web 29 Octobre 2006
Pb : erreur 403 Forbidden (chez OVH) ---URGENT--- Administration d'un site Web 3 Février 2005
403 Forbidden - You don't have permission to access. Problèmes de référencement spécifiques à vos sites 11 Janvier 2005
GWT - erreur 403 sur tout le site Crawl et indexation Google, sitemaps 13 Juin 2022
Lecture entete HTTP avec CURL et 403 Développement d'un site Web ou d'une appli mobile 31 Octobre 2019
Sans user agent header 403 sur la home page Référencement Google 29 Mai 2018
Etrange probléme 403 http header sur la home page Développement d'un site Web ou d'une appli mobile 27 Mai 2018
Erreur 403 et Search Console Débuter en référencement 29 Janvier 2017
Google bot et erreur 404 / 403 Crawl et indexation Google, sitemaps 17 Juin 2016
Erreur 403 mais pas partout Netlinking, backlinks, liens et redirections 1 Décembre 2014
Dossier en 403 Débuter en référencement 12 Novembre 2014