タグ: ,

SLAについて思うこと


 今回はKindle本からちょっと離れて、SLA(Service Level Agreement)についての私の思いを書かせて頂きます。

 
 先日まであるユーザー企業のお手伝いをしていたのですが、たまたまその企業だけだったのかもしれませんが、例えば要求水準(目標値)の決め方に疑問を抱きました。  





 SLAとは、皆さんご存じのように、主にIT(情報システム)の運用保守やクラウドサービス等の品質保証レベル(要求水準)や運営ルールについて、ベンダー企業(サービス提供者)とユーザー企業との間で事前に合意しておくものです。
 


 そして、それを実現できなかった場合のペナルティ(多くの場合料金返還)や達成、大いに達成できたときのインセンティブも規定しておく場合もあります。    





 SLAで設定する項目の例としては、稼働率、復旧時間、障害発生から通知を完了するまでの時間、重大障害の一定期間内の発生回数、レスポンスタイム、バッチ処理時間、通信速度、ヘルプデスクの一定時間内の回答率などがあります。    




 さて例えば、稼働率について要求する数値ですが、皆さんはどのように決めているでしょうか。  


 24時間365日運用のITでは許容される停止時間は、稼働率が99.9%ですと月あたり43.2分、99.99%ですと月4.32分、99.999%の場合月0.43分(26秒)になります。  


 24時間365日運用でなければ、運用時間帯を意識する必要があるでしょう。また、日中と夜間での緊急度が異なれば、時間帯に合わせた稼働率を設定すべきでしょう。    



 何が言いたいのかというと、求められる稼働率(要求水準)によって、ベンダー側の管理のあり方や体制(つまり「費用」)が大きく異なって来るということです。  





 システムによっては、24時間3名常駐体制(計9人)を取る必要があるものもあるでしょうし、システム利用ピ−ク時間帯のみ3名貼り付き体制で監視し、非ピーク時間帯は場合によっては1名常駐、あるいは非常駐で障害発生から30分以内に現場に到着すれば良いものもあるかもしれません。    




 皆さんは、例えば要求稼動率が99.99%で、実稼動率が99.98%になってしまったときの、損害額を計算していますか?  



 24時間運用のシステムの場合、その時間差は月に4.32分(260秒)です。4.32分のシステムダウンが数100億円もの損害をもたらすことがあるかもしれませんし、大きな損害は出ないかもしれません。  


 ですから、要求品質レベルを設定するときには、利用時間帯を意識しながら、想定損害額を算出しながら決定しましょう。    


 ペナリティを設定しているSLAの多くは、月額料金の何%かを返還するというような規定が多いのですが、100%返金されても損害をカバーできないケースもありうるでしょう。  



 そうした場合に備えて、SLA内で、損害額の大きさによって損害賠償請求もできるようにしておかなければなりません。    


 そうですSLAで要求水準を規定する場合には、満たされない場合の損害の大きさを推定しながら設定しましょう。    







それでは皆さん、良い年をお迎え下さい!!  












※ (株)プラッサムの「IT契約見直し支援サービス」のご案内はこちらです。