| |
|
Voir le sujet précédent :: Voir le sujet suivant
|
| Auteur |
Message |
| |
|
papa WRInaute discret

Inscrit le: 21 Sep 2004 Messages: 53
|
Posté le : Mer Jan 23, 2008 11:14 Sujet du message: code de recriture avec des classes spécifique |
|
|
Bon j'y arrive vraiment pas et je rencontre deux PB concret :
Pour aller de (la partie en italique existe mais peut/doit être ignorée)
toutes-les-locations,REGION,Bourgogne,tralala,commentaire%20avec des espaces,VariableFacutative1,1,VariableFacutative2,2.html
à
toutes-les-locations.php?REGION=Bourgogne[&tralala=commentaires%20avec des espaces]&VariableFacutative1=1&VariableFacutative2=2
j'utilise
| Code: |
RewriteRule ^toutes-les-locations(,.+),([^,]+),([^,&]*)([^,]*)\.html toutes-les-locations$1&$2=$3$4\.html [N]
RewriteRule ^toutes-les-locations,([^,]+),([^,]*)(.*)\.html toutes-les-locations.php?$1=$2$3 [L] |
Qui fonctionne mais je n'arrive pas à simplifier mes classes
et pour réecrire
location-gite-Clevacances,IMMOID,692,a,SOUGERES-en-PUISAYE-dans%20l-Yonne-Bourgogne.html
en
location-gite-Clevacances.php?IMMOID=692
Mon essai est lamentable et fait une erreur 500 et je n'y comprends rien
A l'aide SVP!!!!
PS : je reposte dans un nouveau fil car c'et un sujet différent quoique connex à mon PB de plantage qui a été résolu vos conseils éclairés |
|
| |
|
 |
KOogar WRInaute accro

Inscrit le: 16 Nov 2004 Messages: 2987 Localisation: Bangalore +4h30
|
Posté le : Mer Jan 23, 2008 13:27 Sujet du message: code de recriture avec des classes spécifique |
|
|
c'est une bonne nouvelle que tu es résolu ton plantage serveur
-http://www.site.ext/toutes-les-locations,REGION,Bourgogne,tralala,commentaire%20avec des espaces,VariableFacutative1,1,VariableFacutative2,2.html
Ce genre d'url peut-etre prise pour une tentative de spam dans les moteurs. si l'idée est de donner du poid a la page, l'effet inverse peut se produire. Par exemple, ton flag tu pourrais le nommer "locations" tout simplement... Ne pas faire passer les commentaires car ca ne sert a rien et gonfler une url, comme je l'ai déjà souligné, peut avoir des effets pervers..
Les symboles pour réduire tes classes :
http://www.expreg.com/symbole.php
donc "Bourgogne" pourra etre remplacé par la classe [a-zA-Z], VariableFacutative1 par le classe [0-9] et ainsi de suite.. |
|
| |
|
 |
papa WRInaute discret

Inscrit le: 21 Sep 2004 Messages: 53
|
Posté le : Ven Fév 01, 2008 10:19 Sujet du message: code de recriture avec des classes spécifique |
|
|
Merci,
Alors que je croyais mon pb résolu, un semaine plus tard mon serveur replante encore
je crois que ça vient de l'indexation qui adore les .html contrairement au .php et qui me bouffe tout mon temps processeur quand ils s'y mettent à trois en même temps (Google, voila et slurp)
Je vais donc encore resseré encore mes classes
Mais :
Question 1
Tu ne m'as pas préciser si le code ci dessous doit être placer en debut ou en fin de htaccess
| Code: |
### EMPECHE LE CODE DE BOUCLER
RewriteCond %{ENV:REDIRECT_STATUS} 200
RewriteRule ^.*$ - [L] |
Question 2
J'ai trouver ce code pour eviter les crawlers parasites : un avis sur son efficacité ? je l'ai mis dans le htacces de la racine
| Code: |
# ATTENTION LISTE DES USER_AGENT NON VERIFIEE
# Voir http://www.toulouse-renaissance.net/c_outils.htm
# Version compacte
#
RewriteCond %{HTTP_USER_AGENT} ADSARobot|Anarchie|ASPSeek|Atomz|BackWeb|Bandit|BatchFTP|BlackWidow|Boston\ Project|BravoBrian\ SpiderEngine\ MarcoPolo|capture|ChinaClaw|CICC|Crescent\ Internet\ ToolPak|Custo|cyberalert|Digger|Digimarc|DIIbot|DISCoFinder|Download\ Demon|Download\ Wonder|Downloader|Drip|DSurf15a|EasyDL|efp@gmx\.net|Email\ Extractor|EirGrabber|EmailSiphon|Express\ WebPictures|EyeNetIE|FavOrg|FileHound|FlashGet\ WebWasher|FlickBot|GalaxyBot|GetRight|GetSmart|GetWeb!|gigabaz|GornKer|GrabNet|Grafula|Green\ Research|hloader|HMView|HomePageSearch|httpdown|http\ generic|IBM_Planetwide|Image\ Stripper|Image\ Sucker|imagefetch|InterGET|Internet\ Ninja|InternetLinkAgent|InternetSeer\.com|Iria|Irvine|JBH*Agent|JetCar|JOC|JOC\ Web\ Spider|JustView|Lachesis|LeechFTP|LexiBot|lftp|libwww|Link*Sleuth|LINKS\ ARoMATIZED|LinkWalker|lwp-trivial|Magnet|Mac\ Finder|Mag-Net|Mass\ Downloader|MIDown\ tool|Missigua\ Locator|MMMtoCrawl\/UrlDispatcherLLL|^Mozilla$|MSProxy [OR]
RewriteCond %{HTTP_USER_AGENT} Navroad|NearSite|Net\ Vampire|NetAnts|NetMechanic|NetSpider|NetZIP|NetZip\ Downloader|NetZippy|NPBot|Octopus|Openfind|PageGrabber|Papa\ Foto|PersonaPilot|pcBrowser|PingALink|Pockey|Proxy|psbot|Pump|QRVA|RealDownload|Reaper|Recorder|ReGet|RPT-HTTPClient|SearchExpress|Second\ Street\ Research|Seeker|SiteSnagger|SlySearch|SmartDownload|SpaceBison|SqWorm|Stripper|Sucker|SuperBot|SuperHTTP|Surfbot|Szukacz|tAkeOut|TV33_Mercator|URL_Spider_Pro|Vacuum|VoidEYE|Web\ Downloader|Web\ Image\ Collector|Web\ Sucker|WebAuto|Webclipping|Webdup|WebFetch|WebGo\ IS|WebHook|Webinator|WebLeacher|WebMirror|WebReaper|WebSauger|Website\ eXtractor|Website\ Quester|Webster|WebStripper|WebWhacker|WebZIP|Wget|Widow|Wweb|WWWOFFLE|Xaldon\ WebSpider|x-Tractor|Yandex [OR]
RewriteCond %{HTTP_USER_AGENT} ah-ha|aktuelles|amzn_assoc|ASSORT|ATHENS|attach|attache|autoemailspider|bdfetch|big.brother|bmclient|Bullseye|bumblebee|clipping|Crescent|Deweb|diagem|disco|DTS.Agent|ecollector|fastlwspider|Favorites\ Sweeper|Fetch|FEZhead|fluffy|Generic|Getleft|GetWebPage|Girafabot|go-ahead-got-it|Grabber|Harvest|hhjhj@yahoo|IncyWincy|informant|Ingelin|KWebGet|larbin|likse|LWP|MCspider|Mirror|Mister\ PiX|multithreaddb|nationaldirectory|NetCarta|netprospector|NetResearchServer|NEWT|nicerspro|OpaL|OpenTextSiteCrawler|OrangeBot|PackRat|pavuk|PSurf|puf|PushSite|replacer|RepoMonkey|Robozilla|Rover|Rsync|searchhippo|searchterms\.it|Shai|sitecheck|snagger|Spegla|SpiderBot|SurfWalker|tarspider|Templeton|TrueRobot|UIowaCrawler|UtilMind|vagabondo|vayala|visibilitygap|vspider [NC,OR]
RewriteCond %{HTTP_USER_AGENT} w3mir|web\.by\.mail|Web\ Data\ Extractor|webcollector|webcraft@bea|webdevil|webdownloader|WEBMASTERS|WebMiner|webmole|WebSnake|websucker|webvac|webwalk|webweasel|whizbang|WhosTalking|WISEbot|WUMPUS|XGET [NC,OR]
#
# FIN DE LA LISTE COMPACTE DES USER_AGENT NON VERIFIEE |
Merci[/code] |
|
| |
|
 |
KOogar WRInaute accro

Inscrit le: 16 Nov 2004 Messages: 2987 Localisation: Bangalore +4h30
|
Posté le : Ven Fév 01, 2008 12:11 Sujet du message: code de recriture avec des classes spécifique |
|
|
1° je pense que c'est mieux a la fin. Pas sur.
2° bah les crawlers c'est jamais tres mechants. ce qui peut te mettre ton serveur down ca serait les pompeurs de sites (teleport pro and co). Je te conseil de mettre un script anti aspirateur si tu ne l'a pas deja fait.
Avant de mettre la liste dans ton .htaccess, jete un oeil sur tes stats pour voir qu'elle sont les spiders qui pompent ta BP et peut-etre ne selectionner que ceux la pour ta liste. |
|
| |
|
 |
| |
|
|
|
|
Autres sujets de discussion :
|
|