[dédié] serveur surchargé

WRInaute occasionnel
Bonjour à tous,
Je viens solliciter vos conseils et remarques car j'ai un dédié qui part en vrille complet et n'étant pas super super au point en infogérance j'ai dû mal à savoir dans quelle direction aller pour remédier un problème.

Depuis hier soir le serveur travaille trop par rapport à d'habitude et ça provoque des lenteurs, temps d'inaccessibilité et je dois trop souvent faire un hard reboot.

voici le mrtg
http://ns31885.ovh.net/mrtg/

J'ai remarqué une hausse (relative) des connexions simultanées mais ça vient pas d'un désandboxage, si vous pouviez m'aider ce serait super sympa :!:
 
WRInaute occasionnel
Ah ça vraiment quel débile je suis j'ai oublié d'allouer suffisamment d'espace disque au site principal. Lol merci achtungbaby je reviens pour confirmation
 
WRInaute occasionnel
J'ai modifié le quotas du site en question, le serveur respire mieux là non? en tout cas je n'ai plus les ralentissements.

le repertoire /home dans l'onglet "quotas des disques" m'indique:
Espace disque (35 GB total / 30 GB free / 586 MB granted)

ça semble pas correspondre avec le graphe mrtg mais bon...
Pour info les logs sont bien dans /home...
 
WRInaute discret
Cartapus a dit:
le repertoire /home dans l'onglet "quotas des disques" m'indique:
Espace disque (35 GB total / 30 GB free / 586 MB granted)

ça semble pas correspondre avec le graphe mrtg mais bon...
Pour info les logs sont bien dans /home...

c'est pourtant indiqué clairement:

espace disponible sur / et /home de ns31885.ovh.net en %

par contre tu as en effet un loup qq part, si tu regardes la charge (Load Average) d'un peu plus près, depuis mardi ça grimpe en fleche ... et toi seul sait ce qui a changé sur ton site depuis mardi

http://ns31885.ovh.net/mrtg/ns31885.ovh.net_charge.html

idem au niveau de la charge CPU ... c'est effarant !
http://ns31885.ovh.net/mrtg/ns31885.ovh.net_cpu.html
 
WRInaute occasionnel
Y a peut être pas de lien entre les deux, mais voici ce qu'écrit un technicien d'ovh après un reboot en hard il y a 10 jours:
Reboot HARD Kernel panic très étrange.
Le pid nommé est énorme (à 6 ou 7 chiffres) et le processus a un nom composé de caracteres ascii.
Reboot hard.
La machine ping

si ça peut inspirer quelqu'un...
 
WRInaute discret
Ca a également l'air de swaper bien comme il faut : tu as bcp d'écritures disque. Tu pourrais nous fournir les résultats d'un Top ?

Sinon, tu devrais peut-être ajuster les valeurs de MinSpareServers et MaxSpareServers dans ton fichier config apache. Respectivement 5 & 10 me semblent largement suffisants à la vue de tes graphs. (n'oublie pas de redémarrer Apache une fois les valeurs changées)
 
WRInaute occasionnel
un free -m donne:
total used free shared buffers cached
Mem: 1000 955 44 0 84 613
-/+ buffers/cache: 258 742
Swap: 509 0 509
les valeurs du swap ont été les mêmes (509 0 509) depuis que j'effectue ce test depuis quelques jours.

Qu'entends tu par Top? comment obtient-on des résultats d'un Top?
J'ai beaucoup d'écritures disque sans doute dû au fait que les visiteurs peuvent éditer des fichiers css et ini

Sinon j'ai changé les valeurs de Min et Maxspareserveur et redémarré les services, pour info elles étaient à 10 & 20.
 
WRInaute discret
par contre tu as en effet un loup qq part, si tu regardes la charge (Load Average) d'un peu plus près, depuis mardi ça grimpe en fleche ... et toi seul sait ce qui a changé sur ton site depuis mardi

je repete, qu'est-ce que tu as changé sur ton site depuis Mardi ?

un "top" est une commande linux, se lancant comme il se doit a l'aide d'une console ... ssh par exemple

si il y a une chose a savoir et à savoir faire sur un dédié, c'est se connecter précisément en SSH et connaitre la commande "top"

je pense qu'il est urgent que tu te documentes 8O
 
WRInaute discret
Lamb a dit:
Sinon, tu devrais peut-être ajuster les valeurs de MinSpareServers et MaxSpareServers dans ton fichier config apache. Respectivement 5 & 10 me semblent largement suffisants à la vue de tes graphs. (n'oublie pas de redémarrer Apache une fois les valeurs changées)

je ne suis pas certain que se soit la bonne méthode a employer, quand un serveur charge et que l'on ne sait pas d'ou vient le probleme, avant de commencer a modifier des valeurs dans les différents fichiers, il est vital de comprendre ce qui se passe, au mieux tu vas masquer le probleme, au pire au lieu d'avoir 1 probleme, tu en auras 2.
 
WRInaute occasionnel
S'il s'agit de taper "top" en ssh, je sais le faire mais ça donne un message d'erreur, y a t il un argument après "top" à saisir?

Pour info j'ai ramené la valeur de la mémoire utilisable par eaccelerator de 128 à 96.

Je n'ai rien modifié de spécial sur le site qui pourrait provoquer ce genre de chose mais peut être n'ai je pas assez réfléchit à la question.

Avant ce problème de montée en charge, j'ai eu plusieurs fois une erreur de type erno au cours de laquelle une des tables de la base ne répondait plus, il a fallu que je la répare. Durant la montée en charge et le problème que vous constatez, il n'y avait pas le problème de lenteur sur le forum du site dont la base est différente de la base précédente.
 
WRInaute discret
Pour le top, il faut que tu l'executes en étant root. (tu tapes "su" puis ton mot de passe root)

Pour eaccelerator, 128 Mo de RAM c'est vraiment beaucoup ! Tu as combien de RAM au total ? Pour ma part, et avec 1Go de RAM embarquée, j'ai placé la taille du bloc à 64Mo, et c'est beaucoup !
Toujours sur eAccelerator, j'éspère que tu as bien vérifié que tu peux manipuler des segments mémoire de 128Mo (ou 96, ça reste énorme). Sous debian, et par defaut, il me semble que c'est 32Mo le maximum.
Regarde par ailleurs si tu utilises bien tout ton cache mémoire eAccelerator (tu regardes ton phpinfo, il est marqué quel pourcentage du cache est utilisé)

Pour en revenir au MinSpare et MaxSpare server, ça ne peut qu'améliorer les choses : il y a beaucoup trop de slots apache idle et ça bouffe de la RAM pour rien.

Sinon, pour tes problèmes de place, vérifie tout de même que tout est en ordre en tapant "df" toujours sous SSH et en root. Et tant que j'y pense : est ce que un ou plusieurs fichiers (notamment les logs apache, par exemple :p) dépasseraient 2Go ?

Tape "find / -size +2000000k" et donne nous les résultats (si il y en a). Et surtout, n'oublie pas les résultats du top, ça fera certainement avancer les choses ;)
 
WRInaute accro
achtungbaby a dit:
ça marche à l'env
ers ces graphes ?

Oui ça marche à l'envers ;-)

La partie verte est se qu'il reste, d'ailleur si tu regardes la courbes sur plusieurs jours, semaines ou mois tu vois que ca chute dans le sens inverse que tu aurai pu penser ;-)
 
WRInaute discret
S'il s'agit de taper "top" en ssh, je sais le faire mais ça donne un message d'erreur
lequel :roll:

y a t il un argument après "top" à saisir?
non

Avant ce problème de montée en charge, j'ai eu plusieurs fois une erreur de type erno au cours de laquelle une des tables de la base ne répondait plus, il a fallu que je la répare. Durant la montée en charge et le problème que vous constatez, il n'y avait pas le problème de lenteur sur le forum du site dont la base est différente de la base précédente.

si tu logges MySQL regarde du coté de error_log (voir slow-query.log)... et a défaut d'avoir identifié l'origine du probleme (un top serait vraiment pas mal) je crois plus un probleme MySQL, mais tu peux aussi regarder du coté des logs Apache ...
 
WRInaute occasionnel
@ Lamb
Je suis loggé en root via le webmin donc en root, je tapes top en commande shell et ça donne:
Code:
top: tcgetattr() failed: Inappropriate ioctl for device

eaccelerator: j'ai 1Go de ram (linux redhat 7.2), même à 128 je sature la capacité de mise en cache des scripts (>5000). Si je suis à 64 je sature bien sûr mais j'ai cru constater après, une montée en charge progressive du serveur puis un plantage. Coincidence?

df: ça indique 10% /home donc pas de problème de place, le quotas du site est changé (c'est un problème réglé maintenant)
 
WRInaute accro
Cartapus a dit:
@ Lamb
Je suis loggé en root via le webmin donc en root, je tapes top en commande shell et ça donne:
Code:
top: tcgetattr() failed: Inappropriate ioctl for device

eaccelerator: j'ai 1Go de ram (linux redhat 7.2), même à 128 je sature la capacité de mise en cache des scripts (>5000). Si je suis à 64 je sature bien sûr mais j'ai cru constater après, une montée en charge progressive du serveur puis un plantage. Coincidence?

df: ça indique 10% /home donc pas de problème de place, le quotas du site est changé (c'est un problème réglé maintenant)

J'ai 2Go de ram et je sature aussi à 100Mo de eaccelerator! J'ai mit à 50 !
 
WRInaute occasionnel
JeunZ a dit:
Cartapus a dit:
@ Lamb
Je suis loggé en root via le webmin donc en root, je tapes top en commande shell et ça donne:
Code:
top: tcgetattr() failed: Inappropriate ioctl for device

eaccelerator: j'ai 1Go de ram (linux redhat 7.2), même à 128 je sature la capacité de mise en cache des scripts (>5000). Si je suis à 64 je sature bien sûr mais j'ai cru constater après, une montée en charge progressive du serveur puis un plantage. Coincidence?

df: ça indique 10% /home donc pas de problème de place, le quotas du site est changé (c'est un problème réglé maintenant)

J'ai 2Go de ram et je sature aussi à 100Mo de eaccelerator! J'ai mit à 50 !

bon je ramène à 32 alors puis je vois
 
WRInaute occasionnel
cecileB2K a dit:
oubli webmin
pour faire du SSH, utilise un CLIENT SSH, et pas un "panel d'admin"

Putty --> http://www.chiark.greenend.org.uk/~sgta ... nload.html

tu vas me prendre pour une bille mais il y a échec lors d'une connexion:
login as : root
password etc ********
access denied

c'est pourtant bien le mot de passe root et le bon port d'écoute du ssh.

lorsque je tente une connexion avec un utilisateur autre que root, ça se connecte mais la fenêtre se ferme tout de suite :mrgreen: une idée du blème?
 
WRInaute accro
ton hébergeur a du te fournir un login et un pass root, c'est celui la qu'il faut utiliser.

Ensuite, n'oublie pas de préciser le port 22.
 
WRInaute discret
les passwords étant cryptés ... je penche pour la deuxieme solution
bizarre quand même ta façon de procéder, ton hébergeur t'envoie les identifiants et password pour administrer ta machine et tu le perds.
tu fais comment pour gérer/administrer ta machine ??
 
WRInaute occasionnel
Attends j'ai quand même pas une tête à perdre ce genre de chose :mrgreen: c'est bizarre cette histoire, jusque là j'administre le serveur via le webmin et me connecte avec l'utilisateur root, pas bon?
 
WRInaute occasionnel
Je vous donne les résultats de find / -size +2000000k et top dès que je peux utiliser putty, merci à tous pour votre temps.
 
WRInaute discret
vérifie si tu n'as pas une indiqué de restriction particulière pour la connection SSH et/ou sur le compte root, c'est quand même pas tout a fait normal de ne pas arriver a se logger en SSH via root ;)
 
WRInaute discret
Il est possible que sshd (le daemon SSH qui écoute côté serveur) bloque toute tentative de connexion avec l'utilisateur root.

On ne t'as pas fournis un autre login/pass à l'ouverture de ton serveur ? Du genre admin, par exemple ?

Si oui, tu te connectes avec et puis ensuite tu tapes "su" pour t'authentifier en root.
 
WRInaute occasionnel
les mecs je viens de sortir de l'âge de pierre en matière d'administration serveur 8O :lol:
l'hébergeur m'a renvoyé le mail d'origine avec le bon mot de passe et je peux dorénavant me connecter en root avec putty :roll:

Pour info le serveur est plus serein (et moi avec) depuis hier soir après avoir ramené le cache d'eaccelerator à 32, changé les valeurs de min/max spare... et rétabli les bons quotas.

voici un find / -size +2000000k:
find: {...}/www/cache/bbfda24ec952f698a11a32afcbb0b9eb: Aucun fichier ou répertoire de ce type
find: /proc/27074/fd/4: Aucun fichier ou répertoire de ce type
find: /proc/19649/fd: Aucun fichier ou répertoire de ce type

voici un top:
1:57pm up 18:12, 1 user, load average: 0,52, 0,62, 0,69
79 processes: 78 sleeping, 1 running, 0 zombie, 0 stopped
CPU states: 0,0% user, 0,9% system, 0,0% nice, 99,0% idle
Mem: 1024428K av, 945624K used, 78804K free, 0K shrd, 214292K buff
Swap: 522104K av, 9768K used, 512336K free 341056K cached
ça swap beaucoup non?
 
WRInaute occasionnel
En effet :wink: tout semble être revenu en ordre maintenant, l'hébergeur ayant fait un audit hardware, me voilà rassuré avec en prime l'esprit ouvert sur de nouveaux horizons, merci à tous pour votre aide!
 
WRInaute discret
de rien, si il y a un truc qui est chiant pour un webmaster, c'est bien l'admin d'un serveur web, ça s'invente pas.

j'en ai également bcp bavé au début ... encore un peu d'ailleurs par moment ...

hope que ça help ;)
 
WRInaute discret
Ca va pour le Swap, c'est correct. A mon avis, avec un peu de "tuning" sur le fichier de config MySQL (my.cnf par défaut) tu peux arriver à améliorer encore tout ça de façon significative. ;)
 
WRInaute discret
Lamb a dit:
Ca va pour le Swap, c'est correct. A mon avis, avec un peu de "tuning" sur le fichier de config MySQL (my.cnf par défaut) tu peux arriver à améliorer encore tout ça de façon significative. ;)

bof a quoi bon ?

si son serveur marche bien, quel interet d'aller mettre les mains dans my.cnf ... a part pour se retrouver avec un autre probleme ?

D'autant que les bons réglages de my.cnf sont extremement difficile a trouvé da part la singularité de chaque site: nbre tables, taille, RAM serveur, compléxité ou non des requettes MySQL ... la liste est interminable.

MySQL propose depuis sa version 4.0 des fichiers de conf déjà bien optimisé et a utiliser selon la quantité de RAM dispo dans ta boite:

my-small.cnf (< 512 Mo )
my-medium.cnf ( entre 512 Mo et 1 Go )
my-large.cnf ( > 1 Go )

ne perds pas ton temps, si ton site fonctionne, a mon avis le mieux est de s'occuper du site justement plutot que de perdre son temps a essayer d'optimiser (en vain) un fichier de conf ... il y a un temps pour tout.
 
Discussions similaires
Haut