google indexe des urls de mon site qui n'existent pas

Nouveau WRInaute
Bonjour,
c'est la première fois que je suis face à ce problème. J'ai créé un site et Google me l'indexe bizarrement:
d'abord il met des / à la fin de certaines URL... et surtout il me fait un mélange de tous mes fichiers!
Par exemple, à la racine de mon site j'ai un index.php, un Presentation.php, un Strategie.php... Et Google m'a indexé: www.monsite.fr/index.php/Presentation.php
ou www.monsite.fr/index.php/Strategie.php
ou www.monsite.fr/Strategie.php/index.php
et même www.monsite.fr/Strategie.php/Strategie.php !

Bref, aucune des adresses indexées par Google n'est correcte!

J'ai envoyé un sitemap à google, mais aucun changement...

Quelqu'un voit ce que j'aurais pu fabriquer pour arriver à un tel résultat?
Par avance merci!
 
Nouveau WRInaute
s'il y avait eu moins d'erreurs je me serais peut-être posée la question, mais là ce n'est clairement pas dû à des liens que j'aurais mal fait (pourtant je suis du genre à me remettre en question; d'ailleurs je ne doute pas que ça vienne d'une mauvaise manip de ma part, mais je ne vois pas laquelle)...
 
Nouveau WRInaute
Rod la Kox tu soulignes exactement mon problème... mais à quoi bon refaire le site en entier si je ne sais pas d'où vient le problème???!
 
WRInaute passionné
tu peux mettre en place des redirections pour ces pages qui ne sont pas censés exister.
 
Nouveau WRInaute
je ne suis pas sûre de m'être bien faite comprendre: Google n'a indexé que des URL qui n'existent pas dans la structure de mon site ni dans les liens qui y figurent...

Prenons l'exemple d'un lien indexé sur Google : http://www.trinity-evolution.fr/Strategie.php/Strategie.php

J'ai bien un fichier Strategie.php à la racine de mon site... Mais d'où sort le deuxième? Le pire c'est que ça n'ouvre pas une page d'erreur!!! ça essaie bien d'ouvrir une page (mais comme mes images et css sont en liens relatifs, ça fait une page très bancale, sous IE et blanche sous Firefox!)
Et que si je "pousse" encore plus loin, en ajoutant n'importe quoi derrière http://www.trinity-evolution.fr/Strategie.php/ (http://www.trinity-evolution.fr/Strategie.php/fgh.php ou http://www.trinity-evolution.fr/Strategie.php/xyz par exemple) ma page s'ouvre, même si elle est très bancale (remarque valable sous IE; Firefox affiche une page blanche)!

Vous avez une explication? une piste? je suis perdue là! Est-ce que ça pourrait venir du fait que j'utilise le php?
 
WRInaute accro
Lab2 a dit:
Rod la Kox tu soulignes exactement mon problème... mais à quoi bon refaire le site en entier si je ne sais pas d'où vient le problème???!
J'ai pas dis de refaire le site, mais de le revoir en entier, nuance.
Lab2 a dit:
je ne suis pas sûre de m'être bien faite comprendre: Google n'a indexé que des URL qui n'existent pas dans la structure de mon site ni dans les liens qui y figurent...
Sauf qu'elle existe puisque l'on peut y accéder : -http://www.trinity-evolution.fr/Performances.php/Animations/Strategie.php

Revois l'intégralité de tes page et vérifie le codage de tes liens.
Ensuite, regarde du coté de ton htaccess pour interdire tout ce qui n'a pas lieu d'être en les renvoyant sur une 404.


Si GG indexe des url, c'est qu'il les trouve quelque part. Chez toi ou chez un autre. ;-)
 
Nouveau WRInaute
Rod la Kox a dit:
Sauf qu'elle existe puisque l'on peut y accéder : -http://www.trinity-evolution.fr/Performances.php/Animations/Strategie.php
La page a laquelle il essaie d'accéder ne peut pas exister à cet endroit: je n'ai pas de répertoire Animations dans ma page Performances.php (logique!), ni de page Strategie.php dans mon répertoire Animations (qui existe bel et bien mais qui est situé à la racine de mon site). Donc je suppose que comme c'est une page .php il prend toutes les infos derrière comme des variables (?) D'ailleurs c'est bien ma page Performances.php qu'il ouvre (sauf qu'il ne trouve pas ni images ni css)...

Rod la Kox a dit:
Si GG indexe des url, c'est qu'il les trouve quelque part. Chez toi ou chez un autre. ;-)
C'est bien ce point là que je ne comprends pas.... J'ai lancé des recherches sur tout mon site, aucune Url ne présente cette structure...
Le site est tout récent, inscrit sur aucun annuaire... je ne vois pas d'où cela peut venir...
Alors je suis bien consciente qu'il a du choper ça quelque part mais où?!

Quant à revoir en entier mon site, moi je veux bien mais je ne vois pas dans quel sens puisque je ne vois ni problème de structure, ni erreur de liens...

merci pour votre aide...
 
WRInaute impliqué
As-tu essayé de voir sur Google Webmaster Tools où Google avait trouvé les liens "bizars" ?


Est-ce que tu n'aurais pas fait qq "erreurs" à certains endroits de type liens relatifs <a href="fichier.htm"> (au lieu de liens absolus <a href="/répertoire/fichier.htm">) dans un include qui génère de mauvaises url sur certaines pages ?
 
Nouveau WRInaute
Je ne connais pas l'outil Xenu Link Sleuth, je vais tester ça.
Sur Google Webmaster Tools, je ne vois pas où Google a trouvé les liens bizarres...

Merci pour votre aide.
 
WRInaute accro
Google ne crée jamais d'URL fantaisistes; il ne fait que suivre des liens qu'il aura trouvé sur ton site ou sur un autre site. Si l'entête renvoyé par l'URL fantaisiste est 200 (Ok), il l'indexe. mais il ne crée jamais d'URL tout seul.
 
WRInaute accro
Pffff...
J'ai commencé à mater le source des pages...
T'as fait une formation en webmastering, parceque là, il y a du boulot...
Une css externe, mais du css dans le html.
des liens un coup "dossier/exemple.html", un coup "/dossier/exemple.html"
Des script en veux tu en voilà...

Bref, aucune rigueur.
 
Nouveau WRInaute
J'imagine bien que Google a trouvé ces URLs, ce que je ne comprends pas c'est où....

Rod la Kox, ma css externe sert à toutes mes pages, et le css dans le head de mon html à la page spécifique dans lequel il est implanté... je n'y vois personnellement pas un problème, mais je ne prétends pas non plus tout faire parfaitement, loin de là!
je vais vérifier une nouvelle fois mes liens...
quant aux scripts... ils me sont bien utiles.

Je ne pense pas avoir fait un site parfait (il est d'ailleurs encore en cours de construction) mais je n'arrive pas à voir d'où vient mon problème...
Cet après-midi je teste l'outil Xenu Link Sleuth... en espérant que ça m'aide.

Merci encore pour votre aide.
 
Nouveau WRInaute
ça y est j'ai compris l'origine du problème...
Je l'explique au cas où ça serve à quelqu'un d'autre un jour.

J'avais fait une erreur de syntaxe lors de l'envoi de mon premier sitemap.xml (1mois environ), je l'avais corrigé rapidement, mais ça avait été pris en compte : à la fin de chacune de mes urls, il y avait un slash...
Comme mes pages sont en php, ça ne renvoyait pas une erreur, et ouvrait ma page .php mais quand Google continuait sont exploration et ouvrait donc une nouvelle page, la nouvelle adresse s'ajoutait derrière le slash en trop... c'est comme ça que toutes les adresses ont été indexées par Google... Euh, je ne suis pas sûre d'avoir été claire...

J'ai compris d'où venait le problème... Parallèlement, il y a eu une nouvelle exploration de Google qui du coût a indexé les pages "vraies"... J'espère que les mauvaises disparaitront assez vite...

Merci pour votre aide.
 
WRInaute accro
Si ces "fausses" pages continuent à renvoyer un état 200, elles ne disparaîtront pas de l'index de Google.
Pour ce faire, il te faudra soit mettre en place des redirections 301 de ces "fausses" URL vers de vraies URL (solution préférable) , soit faire en sorte qu'elles renvoient un etat 404 Not Found.
 
Discussions similaires
Haut