lien entre un moteur de recherche et un site dynamique

Nouveau WRInaute
Bonjour,

J'ai eu du mal a trouver quelque chose de succinct et de réaliste pour le sujet mais ma question sera plus claire, enfin j'espere .:D

Donc, je réalise un site en php concernant un "annuaire professionnel". C'est a dire un site qui peut regrouper des centaines de professions différentes.

J'ai lu et relu beaucoup d'article sur le référencement et sur l'URL Rewriting
Je pense avoir bien compris le principe mais je me pose la question suivante:

- comment s'établit le lien entre le mot saisie dans un moteur de recherche comme Google (ou autre) et un script index.php qui lui, lance la recherche dans une bd et génère un fichier html ?
un exemple pour être plus clair:
un internaute saisie le mot "peintre" dans Google, comment mon index.php sait il qu'il doit rechercher dans la bd le mot peintre?

Est ce tout simplement á cause du fichier .htaccess ?
si oui faut il simplement réceptionner cette variable (et comment?)
et l'integré dans des lignes du style:
RewriteRule ^index-([0-9a-zA-Z-]+).html
index.php?recherche=$1[L]


ou faut il créer une RewriteRule pour chaque profession ce qui veut dire que le fichier .htaccess va évoluer sachant que l'on peut aussi rechercher sur le nom du peintre, sur des mots comme peinture, pinceau etc... 8O

Voilá, merci d'avance pour vos réponses.

A bientôt
 
Nouveau WRInaute
webmasterlamogere a dit:
google ne propose que des pages qu'il a indexé en parcourant le web.
il n'interroge pas tous les sites a chaque requête!

Merci pour ta réponse.
Alors si je comprend bien il ne faut pas référencer index.php, mais une page toto.html qui vas être constitué de toutes les données de la base et régénéré á chaque modif de la base ?
 
WRInaute passionné
chaque page du site doit avoir :
un contenu au maximum différent des autres pages (pour éviter le contenu dupliqué),
une url contenant les mots clés de la page (pour google et le visiteur),
disposer de liens sur les autres pages (pour que google l'index).
 
WRInaute accro
Tu confonds plusieurs choses....

En gros tu vas avoir un fichier "index.php" pour ton accueil, un truc genre "categorie.php" et un truc genre "fiche.php" qui sont tes différents gabarits pour la page par categorie et la page d'affichage d'une entrée.

Dans ta page categorie, tu vas avoir dans ton code une requête qui interroge ta base, selon le critère de la categorie. Imaginons que ton paramètre soit $cat

Au lieu de faire en dur une page pour chaque categorie, tu fais une page unique, et tu mets dans l'url le paramètre, genre categorie.php?cat=boucher et tu reprends ce parametre dans ta requete.

Ensuite tu vas décider de ré-écrire les urls et que par exemple ta page categorie.php?cat=boucher devienne categorie-boucher.php

Ton site va donc être remplis de liens internes vers les différentes catégories.

categorie-boucher.php, categorie-coiffeur.php, etc...
et c'est en crawlant ces urls présentes dans ton site que Google va décider ou pas d'indexer les pages.
 
Nouveau WRInaute
Je vous remercie de vos réponses.

En vous lisant et par rapport á ce que j'ai compris, j'ai pensé á une solution mais je ne sais pas si elle va fonctionner, je vous la décris:

je pense donc créer au départ un fichier html qui contiendra des liens avec toutes les catégories possibles sous forme d'url simplifiés avec en parallèle l'URL rewriting, suivant l'exemple de Marie Aude.
C'est ce fichier qui sera référencé.
Ne connaissant pas á l'avance toutes les catégories possibles et comme il y a d'autres critères de recherche comme le nom des sociétés par exemple, ce fichier évoluera automatiquement en fonction des inscriptions.
Bien sur, il faudra attendre que le robot repasse par la page pour tenir compte des ajouts.

Le problème c'est qu'il risque de contenir des centaines de lien.
Est ce que cela est dérangeant par les moteurs de recherche ?

Voilà, si vous pouviez me dire ce que vous en pensez ça serait sympa.

Je vais tâcher de trouver des simulateurs de robots pour voir si cela peut fonctionner.
 
WRInaute accro
Mauvaise méthode :)

Regarde comment fonctionnent les sites : ils ont une page d'accueil avec un lien vers les chapitres principaux, et dans chaque chapitre principal, un lien vers les sous chapitres.

Tu dois réaliser la même structure.

Au "pire" fais un tri par ordre alpahbétique par les 26 lettres de l'alphabet

Tu vas alimente ce fichier (php) avec des requêtes issues de ta base, qui vont donc chercher les catégories dans ta base. Quand tu créées une nouvelle catégorie, elle s'ajoute toute seule, sans que tu n'aies rien à faire.

Ensuite tu vas référencer ta page d'accueil, celle qui est le point d'entrée dans ton site, et éventuellement quelques catégories, et Google va peut à peu indexer les pages qu'ils juge pertinentes en fonction de leur contenu.
 
Nouveau WRInaute
Marie-Aude a dit:
Mauvaise méthode :)

Regarde comment fonctionnent les sites : ils ont une page d'accueil avec un lien vers les chapitres principaux, et dans chaque chapitre principal, un lien vers les sous chapitres....

Merci pour ta réponse.

Le site ne fonctionne sous ce schéma, en deux mots (enfin presque) je vais t'en expliquer le fonctionnement.

Il y a un seul fichier d'entrée index.php. Quand tu arrives sur cette page, on t'invite á saisir un terme de recherche. Ca peut être, peintre, papier peint, pinceau, peinture, le nom d'une société etc. Bien sur d'autres critères peuvent être indiqués, la ville, le département etc.
Ensuite le script recherche dans plusieurs zone de chaque enregistrement l'existence de ce critère.C. a. d. , si le critere est pinceau et que dans une zone se trouve le terme de pinceau alors l'enregistrement est sélectionné.
Pour finir c'est index.php qui affiche tout ce qu'il a trouvé sous forme d'une liste de cartes de visite. Si l'internaute est intéressé par le contenu d'une carte de visite il peut consulter la fiche qui est elle généré. automatiquement.

Si tu veux, index.php ne génére, au départ, aucune url á part celles des autres pages du site comme par exemple "Nous contacter" ou "histoire de la société".

Ce n'est qu'après le lancement de la recherche que le fichier généré par index.php va contenir les liens vers les fiches.

Le probleme est donc d'indiquer aux robots ces liens qui en fait n'existerons qu'une fois généré par index.php.

Je m'excuse pour le roman mais j'ai essayé d'être assez clair.
 
WRInaute accro
Je n'ai pas l'impression que tu soies de mauvaise foi ni que tu cherches à faire quelque chose de borderline, mais je me dois de te prévenir que ce que tu t'apprêtes à faire, c'est de l'indexation de résultats de recherche... et le jour où tu te fais avoir, c'est blacklist sans avertissement.

En gros, s'il n'y a aucune validation manuelle, aucune modération, n'importe qui peut lier vers une page du genre blabla.com/photos-de-cul.html (qui correspond à index.php?recherche=photo+de+cul). Je te laisse imaginer le démontage en perspective.

Google teste les URLs: il lui arrive de tester des urls "bidon" pour voir comment ton site réagit... Il peut donc envoyer un "blabla.com/xfdsqfzefcbrgfd.html", et si ça lui affiche une page du genre:

xfdsqfzefcbrgfd: tous les professionnels
Retrouvez tous les professionnels en xfdsqfzefcbrgfd... etc...

...eh bien... tu es grillé.

--> je te suggère de creuser un peu plus les possibilités de gestion de ton contenu, pour éviter que tes efforts ne mênent qu'à un échec. J'ai vécu ça, et je t'avoue que si j'avais su, j'aurais gagné un an.

++
 
WRInaute discret
quoi??

L'indexation de résultat de recherche est interdite??

Et dire que je réfléchissais à ça pour mon site car un consultant en référencement m'a dit qu'il le pratiquait....
 
WRInaute accro
Ca fait un bon moment. Ton consultant en référencement a grosso modo un an de retard.
Et comme dit Hawk Eye, c'est - une fois repéré - du blacklistage assuré.
 
Nouveau WRInaute
Marie-Aude a dit:
Ca fait un bon moment. Ton consultant en référencement a grosso modo un an de retard.
Et comme dit Hawk Eye, c'est - une fois repéré - du blacklistage assuré.

Mon intention n'est pas "d'arnaquer" google ou les autres moteurs de recherche. Je ne sais pas ce qui se fait ou non, c'est d'ailleurs pour ca que je poste sur ce forum.

Mais comment font alors, les sites qui vendent des centaines d'articles ?
Quand par exemple tu cherches une carte vidéo sur le net ou une imprimante google affiche les résultats autant pour les cartouches d'encre que pour l'imprimante elle même.
Ils leur faut bien á un moment mettre les liens quelque part ou alors google cherche directement dans la base de donné...

Je comprend plus...Comment faire alors ?
 
WRInaute accro
Comment font ils ?

1- stratégie de liens internes comme je te l'ai expliqué, tu peux faire tout ça avec 2 ou 3 gabarits, ou même un seul (ton fichier index php)
2- un sitemap
 
WRInaute accro
mic_bredo a dit:
Mon intention n'est pas "d'arnaquer" google ou les autres moteurs de recherche. Je ne sais pas ce qui se fait ou non, c'est d'ailleurs pour ca que je poste sur ce forum.

Je n'en doute pas, c'est pour ça que j'ai fait cette précision ;)

mic_bredo a dit:
Mais comment font alors, les sites qui vendent des centaines d'articles ?
Quand par exemple tu cherches une carte vidéo sur le net ou une imprimante google affiche les résultats autant pour les cartouches d'encre que pour l'imprimante elle même.
Ils leur faut bien á un moment mettre les liens quelque part ou alors google cherche directement dans la base de donné...

L'important, c'est que tu aies le contrôle de ton contenu.

Pour faire bref: tu dois par exemple avoir une liste des "professions", c'est cette liste qui génèrera les liens vers les pages qui listent les professionnels correspondant à chaque profession.

Si tu coiffes cela d'une méthode de "contrôle", qui fait par exemple que lorsqu'aucun contenu n'est disponible, ton site renvoie une erreur 404, alors tu ne prends plus de risque.

Note que malgré tout, certains sites passent au travers des mailles du filet. Certains gros vendeurs de matos high-tech ont des pages "pur spam" qui sont tellement détectables qu'on se demanderait bien si la seule raison pour laquelle Google ne dégage pas le site de son index sans autre forme de procès n'est pas une raison purement "sociale": éviter de mettre 500 personnes au chômage ;)
 
WRInaute discret
Quelle différence y a t-il entre faire un lien vers les professions donc en outre une requête et un lien vers une recherche effectuée par le moteur de recherche??
 
Nouveau WRInaute
HawkEye a dit:
L'important, c'est que tu aies le contrôle de ton contenu.

Pour faire bref: tu dois par exemple avoir une liste des "professions", c'est cette liste qui génèrera les liens vers les pages qui listent les professionnels correspondant à chaque profession.

Si je comprend bien, techniquement cette liste peut se faire á l'intérieur d'un select, chaque option ayant pour valeur un lien simplifié comme l'a décrit Marie Aude.
Question :

-Pouvez me confirmer qu'un moteur de recherche, scanne bien le fichier généré par le script php et non pas le script lui même (je me demande d'ailleurs comment pourrait- il faire).

-toujours au niveau du scan, un moteur va donc scanner tous les liens en cascade même si cela représente des centaines de pages ?

-Souvent on ne peut pas afficher sur une seule page tous les résultats, la page en cours contient donc des liens vers les pages suivantes etc. Si le moteur de recherche suit tous ces liens fait- il la différence entre les liens en amont et en aval ?

HawkEye a dit:
Si tu coiffes cela d'une méthode de "contrôle", qui fait par exemple que lorsqu'aucun contenu n'est disponible, ton site renvoie une erreur 404, alors tu ne prends plus de risque.

Lá je ne comprends pas ce que tu veux dire, je pensais qu'une page avec un message informant l'utilisateur avec "Il n'y a pas /plus de professionnel á la catégorie demandée !" :D ,
est ce qu'une page 404 est mieux pour Google ? pour un utilisateur par contre c'est assez déroutant.


pouloupoupo a dit:
Quelle différence y a t-il entre faire un lien vers les professions donc en outre une requête et un lien vers une recherche effectuée par le moteur de recherche??

je me suis posé la même question je ne comprend pas la différence.
Je pense que comme .htaccess gère les liens et d'après ce que dit HawkEye

HawkEye a dit:
Google teste les URLs: il lui arrive de tester des urls "bidon" pour voir comment ton site réagit... Il peut donc envoyer un "blabla.com/xfdsqfzefcbrgfd.html", et si ça lui affiche une page du genre:

Citation:
xfdsqfzefcbrgfd: tous les professionnels
Retrouvez tous les professionnels en xfdsqfzefcbrgfd... etc...

Dans les deux cas google peut faire un test... par contre on peut et on doit toujours tester si la catégorie "xfdsqfzefcbrgfd" existe bien avant d'afficher quoi que se soit :wink:

Voilá, voilá et merci encore pour votre patience (comme dit l'autre "je comprend vite mais faut m'expliquer longtemps") :D
 
Discussions similaires
Haut