Pourquoi Google référence un fichier php inaccessible depuis une url ?

Nouveau WRInaute
Bonjour,

J'aimerais comprendre l'intérêt de Google à référencer un fichier php qui est inaccessible depuis une url.

Le site étant en MVC, toute les pages sont accessibles uniquement depuis l'index.php en principe, par une url dynamique de type: "monsite.com/index.php?a=1&b=2&c=3".

A ma grande surprise, en faisant une recherche de toute les pages de mon site sur Google, j'y ai découvert une url menant tout droit à un fichier de traitement php qui sert à traiter les données issus de mes formulaires via JSON, fichier inaccessible depuis une url donc. Ce fichier inaccessible depuis l'url dynamique présentée au-dessus, a été accédé par google par une url de type: "monsite.com/modules/membres/traitement.php".

Je ne comprends pas comment Google a pu tomber dessus, et quelle utilité a-t-il de le référencer ?
 
WRInaute accro
Tchernobyl a dit:
Je ne comprends pas comment Google a pu tomber dessus
Il a pu tomber dessus si tu as appelé ce fichier alors que tu utilises Chrome, que tu étais connecté à ton compte Google (youtube, gmail, ...), etc...

Tchernobyl a dit:
et quelle utilité a-t-il de le référencer ?
Référencer un maximum de choses.
 
Nouveau WRInaute
Cet url est accessible dans un code en AJAX, Google est capable d'aller fouiner dedans ?!

Dans ce cas, pour résumer, comment faire pour forcer un internautes ET un robot google à pouvoir accéder uniquement à une url de type "monsite.com/index.php?a=1&b=2&c=3" et jamais à un fichier via une url de type "monsite.com/modules/membres/traitement.php" ?

Ayant très peu de compétences en .htaccess et n'ayant jamais utilisé de robots.txt, toute aide détaillée est la bienvenue :wink:
 
Nouveau WRInaute
spout a dit:
En détectant que le request est bien fait en AJAX: http://snipplr.com/view/16624/
Hello, j'ai du mal à voir en quoi ça répond à ma question ;) :
Tchernobyl a dit:
Comment faire pour forcer un internautes ET un robot google à pouvoir accéder uniquement à une url de type "monsite.com/index.php?a=1&b=2&c=3" et jamais à un fichier via une url de type "monsite.com/modules/membres/traitement.php" ?
 
WRInaute accro
La solution de Spout te permet de vérifier si une url censée être appelée uniquement en Ajax est bien appelée de cette façon. Ce qui te permettrait d'emblée de bloquer le crawl direct de cette url.
 
Nouveau WRInaute
Au risque de passer pour un grand débutant... ça s'utilise comment ? :?

PS: Sinon je pense à une solution plus radicale : étant donné qu'un site MVC est entièrement accessible depuis son index uniquement, est-ce risqué pour le référencement d'interdire l’indexation de tout les URL "monsite.com/modules/membres/traitement.php" ?!
 
Nouveau WRInaute
UsagiYojimbo a dit:
Ca s'utilise comme dans l'exemple donné par spout plus haut, dans son lien.

Tu t'imagines bien que j'ai au moins pris la peine de lire le lien avant de poser ma question :wink:
Comme je ny 'ai vu d'explications, je dois remplacer HTTP_X_REQUESTED_WITH par "monsite.com/modules/membres/traitement.php" ?
 
WRInaute accro
:roll:

Dans ton script traitement.php qui est censé être appellé qu'en AJAX:

traitement.php:
PHP:
<span class="syntaxdefault"><br /></span><span class="syntaxkeyword"><?</span><span class="syntaxdefault">php&nbsp;<br /></span><span class="syntaxkeyword">if&nbsp;(!</span><span class="syntaxdefault">isAjax</span><span class="syntaxkeyword">())&nbsp;{<br />&nbsp;&nbsp;&nbsp;&nbsp;</span><span class="syntaxdefault">header</span><span class="syntaxkeyword">(</span><span class="syntaxstring">"Status:&nbsp;404&nbsp;Not&nbsp;Found"</span><span class="syntaxkeyword">);</span><span class="syntaxcomment">//&nbsp;Une&nbsp;404<br />&nbsp;&nbsp;&nbsp;&nbsp;//header("Location:&nbsp;/",&nbsp;true,&nbsp;301);//&nbsp;Ou&nbsp;une&nbsp;redirection&nbsp;301<br />&nbsp;&nbsp;&nbsp;&nbsp;</span><span class="syntaxkeyword">exit();<br />}&nbsp;else&nbsp;{<br />&nbsp;&nbsp;&nbsp;&nbsp;</span><span class="syntaxcomment">//&nbsp;suite&nbsp;de&nbsp;ton&nbsp;script<br /></span><span class="syntaxkeyword">}<br />&nbsp;</span><span class="syntaxdefault"></span>
 
Nouveau WRInaute
Salut spout, merci pour l'explication c'est plus clair.

Je viens de faire un tour des conseils sur les redirections 301, il en existe 3 types :
la redirection par balise Meta Refresh
la redirection par javascript
la redirection via directives serveur (.htaccess, ou php)

Les 2 premières sont largement déconseillées en terme de référencement, et l'auteur explique pour l'option htaccess : "la page vers laquelle pointe la redirection va être crawlée, et va être indexée en lieu et place de la page supprimée."

Par contre il n'explique pas ce que devient l'ancienne page après une redirection Javascript, aurais-tu une idée ? (Je risque de me rabattre vers la redirection 301 en Javascript car je ne m'y connais pas en htaccess).
 
Discussions similaires
Haut