2014年4月8日火曜日

エラー発生時のトラブルシューティング

私は業務システムに関わっているため、システムの停止=業務の停止であり
システム停止ともなると、何の仕事もさておいて対応。という事になってきます。

そのような特性上、最短で解決できる手段が大事です。
最短で原因を突き止めるためには、いかに正しく
現象を把握するかにかかってきます。


解決への道標とするためのポイントを纏めておきます。


※ソフトウェア寄りのトラブルシューティングになってしまったので、どこかの機会で
 ハード、インフラ系についてもまとめたいと思います。



ユーザーから細かい情報をできるだけ聞き出す

ユーザーは「エラーが起きました」と伝えてくるだけのことがほとんどです
それだけでは、さすがに現象はわかりません。

第一報を受けた後、できる限り、たくさんの情報を聞き出す必要があります。

・「画面にどのような内容が出ていますか?」
・「どのような事をしましたか?」

 発生元、および発生元が出しているエラーの情報を掴む必要があります。
 OSなのか、アプリケーションなのか、ミドルウェアなのか、
 それを掴まないと進みません。
 状況により、ブルーバックなんてこともあるので、
 その時にはどのような事をしたらどうなったかを聞く必要も出てきます。

エラーコード、メッセージを適切につかむ

ユーザーはさらっと流してしまいそうですが、こちらにとっては
 その情報が命。
 再現しないような現象の場合、解決が不可能にすらなってきます。
 どのソフトがどのエラーを出しているかはそのエラーコード、
 エラーメッセージが示しているのです。

 英語だから、長いから。と言って、中途半端に聞いてもいけません。
 MS製品は0x800******というような魔法のようなエラーコードですが
 それも、無視してはいけません。
 今はネットの時代、検索窓に入れると即答で答えが出てるかもしれないです。
 ※メッセージ内容も然りです。

 大事なのは、手を抜かず、確実に情報を取得すること。
 画面のハードコピーを取ってもらい、メールやFAXで頂くなんてのも有りです。


エラーログを見る

エラーログはあちこちに散らばっています。
 このあたりまで来ると、ユーザーの技術習得度やその時の手順によっては
 「難しいからもう無理」と白旗を上げているかもしれません。が、
 こちらはそうは言えませんので、そこからさらに掘り下げます。

 ・Windowsログ
  ⇒管理ツールから見れます。エラーは「×」が出ているので
   利用者でも見ればわかるかもしれません。
 ・ソフトが出しているログ
  ファイル全走査して、更新日が直近のテキストファイルを片っ端から
  見ていきます。
 ・その他、原因が分かっていれば、そのソフトが出しているログ


エラーの詳細が分かれば、あとはその詳細情報を元に
情報をまとめ上げ、適切な処置へと移します。

自分で解決できない事も、発生元および現象さえ分かっていれば
サポート等へ問合せ、対応頂く事も可能になってきます。

今回は解決へ導く手順の要点のみを纏めましたが、
知っておくだけでも、自分で解決できる幅が大幅に広がります。


0 件のコメント: