Google
 
Serversman@VPS
たぶねこ @ 2011年5月30日 11:16 PM

ServersMan
先日のServermans@VPSの問題発生後今度は「VPSサーバ管理ツール」のログインが不安定になりました。更には深夜時間帯に「MyDTI」の「契約中サービス」タグ中のプランの「確認・変更」がシステムエラーになりVPSの再起動もできない状態になってしまった。
(・・・以前、全ての設定をSSHでやっていたら、管理ツールにログインするたびに自動的になんかしら設定が変えられてしまい、しまいにはOS自体が起動しなくなると言う事態に陥ってしまい、泣く泣く初期化したため、設定は全て「VPSサーバ管理ツール」出行っています。状態のチェックや設定状況の確認なんかはその限りではないですけどね。)
サポートに泣き付くも、翌日昼には、「MyDTI]は元通りになっていたので再起動はできるようになりました。しかし不安定な状態は尚も続いているので、サーバー状況を確認する方法をとりあえず確立しないとな~・・・という感じです。

状況を整理すると、

  • サポートの適用範囲はVPSが動くまで・・・ということで、安定は自己責任。
  • VPSの管理は「VPSサーバ管理ツール」にて行うが、時々起動しない。
  • SSHやBlueOnyxと併用可能なWebminなどにより状況の確認は比較的容易
  • 現在サーバーはデフォルト状態+WEB+FTP+SSHでその殆どは未使用
  • にもかかわらず「user_beancounters」では「tcprcvbuf」と「othersockbuf」に「failcnt」が発生
  • サポートからはサーバーの割り当てを見直しなさいと告げられる。
  • まだ基本的な設定をしただけでこれからメールサーバーやデータベースなどを追加していこうとした矢先の問題なので、まともにサーバー自体動作してないんじゃないか?と疑ってしまうところですが、・・・結局自分で調べて何が原因か突き止めなさいということなんだけどね(~~)
    仕様に関しては殆ど公開しない方向のようで、つかみどころがない。
    唯一引き出せた調査の仕方が、「user_beancounters」により「failcnt」が出た場合は設定を見直す必要があるということ。
    本来「何処に問題があるのか」を知りたいのにその方法は「サーバー管理してるぐらいだから判るでしょ?」と言うもの。設定もしていないのに最初っから内部でウニョウニョ動いているモノ達の存在や問題解決策までの責任を押し付けられてしまうって寸法。
    楽しようと思って逆に苦労している気がします(~~)
    これなら自宅サーバーの方がまだ安定動作期待できるし・・・等と言っていても仕方ないので、現状の確認をば・・・

    #cat /proc/user_beancounters
    Version: 2.5

    9560357

    uid resource held maxheld barrier limit failcnt
    32996: kmemsize 9762908 28745400 29580328 0
    lockedpages 0 8 256 256 0
    privvmpages 99436 107569 393216 417792 0
    shmpages 467 3023 65536 65536 0
    dummy 0 0 0 0 0
    numproc 65 68 240 240 0
    physpages 54799 54810 0 9223372036854775807 0
    vmguarpages 0 0 131072 131072 0
    oomguarpages 54799 54810 26112 9223372036854775807 0
    numtcpsock 21 31 360 360 0
    numflock 9 15 188 206 0
    numpty 0 0 12 12 0
    numsiginfo 0 10 192 192 0
    tcpsndbuf 235656 277560 1720320 2703360 0
    tcprcvbuf 212992 1727928 1720320 2703360 13
    othersockbuf 80688 278544 1126080 2097152 0
    dgramrcvbuf 0 43760 262144 262144 0
    numothersock 48 60 360 360 0
    dcachesize 651666 713640 3409920 3624960 0
    numfile 1925 2016 9312 9312 0
    dummy 0 0 0 0 0
    dummy 0 0 0 0 0
    dummy 0 0 0 0 0
    numiptent 24 24 256 256 0

    縦軸は確認項目で、横軸は左から現在値-最大値-(何らかの)基準値-境界値-失敗それぞれのリソース値を示しています。
    具体的な使い方としては、サーバーの設定変更や追加などを行う際に、その前後で「user_beancounters」の値を取得して追加した設定の妥当性を検証すると言う感じでしょうか?
    「held」と「limit」を定期的に確認し予防することもできますし、
    「failcnt」が発生した項目について、「maxheld」を確認し、「limit」に収めるためにどの程度設定値を絞るか検討することもあるでしょうか?

    これから設定を開始するなら、問題を未然に回避できる方法として有効です。
    それ以降の調査については、何か動かして調査させるようなことしてたら本末転倒になりそうなので、netstatなどLinuxコマンドで地道に調べるしかなさそうですね。

    ちなみにこれはPostgreSQLサーバーを起動したあとに取得した値です。それ以前では「failcnt」は設定されていなかったので、DBはMySQLだけで我慢しましょう・・・と言ういうことでしょうね。
    もちろん、PostgreSQLを停止したら、それ以上「failcnt」が増えることはありませんでしたが、下には戻りません。
    「failcnt」の初期化には、「サーバーの再起動で対応を行ってください」とのことでした。
    そんなことしてたら、しょっちゅうサーバー再起動を繰り返すことになりそうですが、ま、その辺りは適宜に対応と言うことで・・・。
    ※項目の詳細などは「user_beancounters」で検索すると見つかると思いますのでそちらをご参照ください。

    コメントはまだありません »

    コメントはまだありません。

    この投稿へのコメントの RSS フィード。 TrackBack URI

    コメントする

    *

    Copyright (c) 2007 njcFactory All rights reserved.
    HTML convert time: 0.279 sec
    Images is enhanced with WordPress Lightbox JS by Zeo
    Powered by WordPress.