ネットワークレスポンス測定
事業所の事務担当者から
「アプリケーションを使っていてレスポンスが遅すぎる。何とかならないか?」
とリクエストをもらった。
まぁ、本社はLAN、事業所はWANなので、
本社と比べられたら遅いのは当たり前なのだが。
そうは言っても、ネットワークの再構築以降
この2年程データを採取していないので
レスポンスを測定して まずは数値で判断してみよう。
…ボトルネックを突き止めるにしても、説得力のあるネタが必要だし。。。
前回担当させた部下が辞めてしまい
ドキュメントも残っていないので、
自分で簡単なツール(batファイル)を作ってみた。
ご参考までに、掲載する。
====================
@echo off
:start rem 開始
rem 拠点01・下り
echo 011,本社→拠点01,192.168.mmm.nnn,開始時刻,%time%>>response.log
copy /d /y /z /b "\\192.168.mmm.nnn\alluser\response-test.dat" "c:\response-test.dat"
if not errorlevel 0 echo エラーが発生しました 本社→拠点01 192.168.mmm.nnn>>response.log
echo 011,本社→拠点01,192.168.mmm.nnn,終了時刻,%time%>>response.log
rem 拠点01・上り
echo 012,拠点01→本社,192.168.mmm.nnn,開始時刻,%time%>>response.log
copy /d /y /z /b "c:\response-test.dat" "\\192.168.mmm.nnn\alluser\response-test.dat"
if not errorlevel 0 echo エラーが発生しました 拠点01→本社 192.168.mmm.nnn>>response.log
echo 012,拠点01→本社,192.168.mmm.nnn,終了時刻,%time%>>response.log
(以下、拠点分だけ繰り返し)
:loop rem 1800秒の待ち合わせと、先頭からの繰り返し
ping localhost -n 1800 > nul
goto start
====================
ローカルCドライブ直下の"response-test.dat"というファイルを、
拠点ファイルサーバへコピーした後、
拠点ファイルサーバからローカルへコピーする。
それぞれ前後でタイムスタンプをログファイルに出力するという簡単なものだ。
サンプルでは30分待ち合わせて繰り返すようになっている。
このバッチファイルを起動するPCを、基幹系セグメントと情報系セグメントに配置して、
採取したい曜日・時間帯に起動しておいた。
社内ネットワークは基幹系/情報系と二重化しており、
障害発生時には自動的に切り替わるようにしてアベイラビリティを上げている。
念の為に、tracertコマンドでルートを確認しておく。
全ての拠点において次のような結果となった。
基幹系・上り= 情報系・上り/下りの半分~1/3程度
基幹系・下り= 基幹系・上りの1/3程度
※上り…拠点→本社、下り…本社→拠点
はぁ~
残念ながら、何処かに問題があるかのような結果だ。。。
集計したピボットテーブルと、ログデータをプロバイダーやベンダーに提示して、
調査を依頼する事にした。