Formation par Olivier Duffez

Formation au référencement par Olivier Duffez, créateur de WebRankInfo !
Une formule efficace alliant théorie et pratique, avec une haute disponibilité des intervenants
Cette formule a déjà convaincu plusieurs centaines d'entreprises, pourquoi pas vous ?
Réservez vite votre place en ligne (convention possible pour imputer sur le budget formation)

Formation référencement Marseille

code de recriture avec des classes spécifique

Poster un nouveau sujet Imprimer cette discussion    Forum -> URL Rewriting et .htaccess   Les dernières discussions de ce forum sont disponibles au format RSS
Voir le sujet précédent :: Voir le sujet suivant  
Auteur Message
 
papa
WRInaute discret
WRInaute discret

Inscrit le: 21 Sep 2004
Messages: 53

URL permanente de ce messagePosté le : Mer Jan 23, 2008 11:14    Sujet du message: code de recriture avec des classes spécifique

Bon j'y arrive vraiment pas et je rencontre deux PB concret :

Pour aller de (la partie en italique existe mais peut/doit être ignorée)

toutes-les-locations,REGION,Bourgogne,tralala,commentaire%20avec des espaces,VariableFacutative1,1,VariableFacutative2,2.html


à

toutes-les-locations.php?REGION=Bourgogne[&tralala=commentaires%20avec des espaces]&VariableFacutative1=1&VariableFacutative2=2

j'utilise

Code:
RewriteRule ^toutes-les-locations(,.+),([^,]+),([^,&]*)([^,]*)\.html toutes-les-locations$1&$2=$3$4\.html [N]
RewriteRule ^toutes-les-locations,([^,]+),([^,]*)(.*)\.html toutes-les-locations.php?$1=$2$3 [L]


Qui fonctionne mais je n'arrive pas à simplifier mes classes

et pour réecrire

location-gite-Clevacances,IMMOID,692,a,SOUGERES-en-PUISAYE-dans%20l-Yonne-Bourgogne.html
en
location-gite-Clevacances.php?IMMOID=692

Mon essai est lamentable et fait une erreur 500 et je n'y comprends rien

A l'aide SVP!!!!

PS : je reposte dans un nouveau fil car c'et un sujet différent quoique connex à mon PB de plantage qui a été résolu vos conseils éclairés
 
papa
KOogar
WRInaute accro
WRInaute accro

Inscrit le: 16 Nov 2004
Messages: 2987
Localisation: Bangalore +4h30

URL permanente de ce messagePosté le : Mer Jan 23, 2008 13:27    Sujet du message: code de recriture avec des classes spécifique

c'est une bonne nouvelle que tu es résolu ton plantage serveur Smile

-http://www.site.ext/toutes-les-locations,REGION,Bourgogne,tralala,commentaire%20avec des espaces,VariableFacutative1,1,VariableFacutative2,2.html

Ce genre d'url peut-etre prise pour une tentative de spam dans les moteurs. si l'idée est de donner du poid a la page, l'effet inverse peut se produire. Par exemple, ton flag tu pourrais le nommer "locations" tout simplement... Ne pas faire passer les commentaires car ca ne sert a rien et gonfler une url, comme je l'ai déjà souligné, peut avoir des effets pervers..

Les symboles pour réduire tes classes :
http://www.expreg.com/symbole.php

donc "Bourgogne" pourra etre remplacé par la classe [a-zA-Z], VariableFacutative1 par le classe [0-9] et ainsi de suite..
 
KOogar Visiter le site web du posteur
papa
WRInaute discret
WRInaute discret

Inscrit le: 21 Sep 2004
Messages: 53

URL permanente de ce messagePosté le : Ven Fév 01, 2008 10:19    Sujet du message: code de recriture avec des classes spécifique

Merci,

Alors que je croyais mon pb résolu, un semaine plus tard mon serveur replante encore
je crois que ça vient de l'indexation qui adore les .html contrairement au .php et qui me bouffe tout mon temps processeur quand ils s'y mettent à trois en même temps (Google, voila et slurp)

Je vais donc encore resseré encore mes classes
Mais :
Question 1

Tu ne m'as pas préciser si le code ci dessous doit être placer en debut ou en fin de htaccess
Code:

### EMPECHE LE CODE DE BOUCLER
RewriteCond %{ENV:REDIRECT_STATUS} 200
RewriteRule ^.*$ - [L]





Question 2

J'ai trouver ce code pour eviter les crawlers parasites : un avis sur son efficacité ? je l'ai mis dans le htacces de la racine

Code:
# ATTENTION LISTE DES USER_AGENT NON VERIFIEE
# Voir http://www.toulouse-renaissance.net/c_outils.htm
# Version compacte
#
RewriteCond %{HTTP_USER_AGENT} ADSARobot|Anarchie|ASPSeek|Atomz|BackWeb|Bandit|BatchFTP|BlackWidow|Boston\ Project|BravoBrian\ SpiderEngine\ MarcoPolo|capture|ChinaClaw|CICC|Crescent\ Internet\ ToolPak|Custo|cyberalert|Digger|Digimarc|DIIbot|DISCoFinder|Download\ Demon|Download\ Wonder|Downloader|Drip|DSurf15a|EasyDL|efp@gmx\.net|Email\ Extractor|EirGrabber|EmailSiphon|Express\ WebPictures|EyeNetIE|FavOrg|FileHound|FlashGet\ WebWasher|FlickBot|GalaxyBot|GetRight|GetSmart|GetWeb!|gigabaz|GornKer|GrabNet|Grafula|Green\ Research|hloader|HMView|HomePageSearch|httpdown|http\ generic|IBM_Planetwide|Image\ Stripper|Image\ Sucker|imagefetch|InterGET|Internet\ Ninja|InternetLinkAgent|InternetSeer\.com|Iria|Irvine|JBH*Agent|JetCar|JOC|JOC\ Web\ Spider|JustView|Lachesis|LeechFTP|LexiBot|lftp|libwww|Link*Sleuth|LINKS\ ARoMATIZED|LinkWalker|lwp-trivial|Magnet|Mac\ Finder|Mag-Net|Mass\ Downloader|MIDown\ tool|Missigua\ Locator|MMMtoCrawl\/UrlDispatcherLLL|^Mozilla$|MSProxy [OR]
RewriteCond %{HTTP_USER_AGENT} Navroad|NearSite|Net\ Vampire|NetAnts|NetMechanic|NetSpider|NetZIP|NetZip\ Downloader|NetZippy|NPBot|Octopus|Openfind|PageGrabber|Papa\ Foto|PersonaPilot|pcBrowser|PingALink|Pockey|Proxy|psbot|Pump|QRVA|RealDownload|Reaper|Recorder|ReGet|RPT-HTTPClient|SearchExpress|Second\ Street\ Research|Seeker|SiteSnagger|SlySearch|SmartDownload|SpaceBison|SqWorm|Stripper|Sucker|SuperBot|SuperHTTP|Surfbot|Szukacz|tAkeOut|TV33_Mercator|URL_Spider_Pro|Vacuum|VoidEYE|Web\ Downloader|Web\ Image\ Collector|Web\ Sucker|WebAuto|Webclipping|Webdup|WebFetch|WebGo\ IS|WebHook|Webinator|WebLeacher|WebMirror|WebReaper|WebSauger|Website\ eXtractor|Website\ Quester|Webster|WebStripper|WebWhacker|WebZIP|Wget|Widow|Wweb|WWWOFFLE|Xaldon\ WebSpider|x-Tractor|Yandex [OR]
RewriteCond %{HTTP_USER_AGENT} ah-ha|aktuelles|amzn_assoc|ASSORT|ATHENS|attach|attache|autoemailspider|bdfetch|big.brother|bmclient|Bullseye|bumblebee|clipping|Crescent|Deweb|diagem|disco|DTS.Agent|ecollector|fastlwspider|Favorites\ Sweeper|Fetch|FEZhead|fluffy|Generic|Getleft|GetWebPage|Girafabot|go-ahead-got-it|Grabber|Harvest|hhjhj@yahoo|IncyWincy|informant|Ingelin|KWebGet|larbin|likse|LWP|MCspider|Mirror|Mister\ PiX|multithreaddb|nationaldirectory|NetCarta|netprospector|NetResearchServer|NEWT|nicerspro|OpaL|OpenTextSiteCrawler|OrangeBot|PackRat|pavuk|PSurf|puf|PushSite|replacer|RepoMonkey|Robozilla|Rover|Rsync|searchhippo|searchterms\.it|Shai|sitecheck|snagger|Spegla|SpiderBot|SurfWalker|tarspider|Templeton|TrueRobot|UIowaCrawler|UtilMind|vagabondo|vayala|visibilitygap|vspider [NC,OR]
RewriteCond %{HTTP_USER_AGENT} w3mir|web\.by\.mail|Web\ Data\ Extractor|webcollector|webcraft@bea|webdevil|webdownloader|WEBMASTERS|WebMiner|webmole|WebSnake|websucker|webvac|webwalk|webweasel|whizbang|WhosTalking|WISEbot|WUMPUS|XGET [NC,OR]
#
# FIN DE LA LISTE COMPACTE DES USER_AGENT NON VERIFIEE


Merci[/code]
 
papa
KOogar
WRInaute accro
WRInaute accro

Inscrit le: 16 Nov 2004
Messages: 2987
Localisation: Bangalore +4h30

URL permanente de ce messagePosté le : Ven Fév 01, 2008 12:11    Sujet du message: code de recriture avec des classes spécifique

1° je pense que c'est mieux a la fin. Pas sur.

2° bah les crawlers c'est jamais tres mechants. ce qui peut te mettre ton serveur down ca serait les pompeurs de sites (teleport pro and co). Je te conseil de mettre un script anti aspirateur si tu ne l'a pas deja fait.

Avant de mettre la liste dans ton .htaccess, jete un oeil sur tes stats pour voir qu'elle sont les spiders qui pompent ta BP et peut-etre ne selectionner que ceux la pour ta liste.
 
KOogar Visiter le site web du posteur
 
Montrer les messages depuis:   
Revenir en haut    Forum -> URL Rewriting et .htaccess Toutes les heures sont au format GMT + 1 Heure
Page 1 sur 1 - 
Connexion
Nom d'utilisateur:    Mot de passe:      Se connecter automatiquement à chaque visite    

CLIQUEZ ICI pour vous inscrire à WebRankInfo (forum, annuaire, outils...)

Connexion

© 2001-2005 phpBB Group, support français
Personnalisation : WebRankInfo ™


 ODP  Firefox  Alsacreations  annuaire webmaster Yagoort