サーバーダウンとは、サーバーの機能が停止することです。サーバーダウンが起きる原因はさまざまで、原因ごとに対処方法が異なります。本記事では、サーバーダウンの主な原因や、対処方法について解説します。
サーバーダウンとは、サーバーの機能が停止した状態を指し、主な原因として3つ挙げられます。サーバーダウンの原因は1つではないため、発生時には早期の原因究明が求められます。
キャンペーン開始やメディア掲載、SNSでの拡散により、短時間にリクエストが急増する状態です。同時接続数がサーバーの限界を超えると、CPU使用率が上限に張り付き、メモリなどのリソースが枯渇します。その結果、処理待ちのデータが滞留し、最終的にシステム全体が応答不能に陥ります。
サーバー本体のディスク故障や電源ユニットの不備といった物理的な損壊です。自社サーバーに限らず、クラウド環境であっても基盤側のホスト障害によってインスタンスが強制停止するリスクは常に付きまといます。
また、データセンター自体の停電やネットワーク機器の不具合も大きな要因となります。
悪意のある第三者が、複数のコンピューターから一斉に大量の通信を送りつけるDDoS攻撃などによって、サーバーの機能を停止させられることがあります。
特定のページへ一秒間に数万回もの接続を繰り返したり、通信経路の帯域を不当なデータで埋め尽くしたりすることで、ユーザーがアクセスできない状態に追い込まれます。これらは通常のアクセス集中と区別がつきにくいため、検知が遅れるほど復旧までの時間が長期化し、被害が拡大します。
サーバーダウンによる損失として考えられるものはさまざまです。ここでは、特に重大な3つの損失について解説します。これらの損失を防ぐためには、トラブル発生時の体制を整えたり、セキュリティ強化をしたりするなどの対策が重要です。
ECサイトなどがダウンしている間、売上は完全にストップしてしまいます。さらに深刻なのは、リスティング広告やSNS広告を出稿している場合、リンク切れのページに対して広告費を支払い続けるというコストの垂れ流しが発生することです。流入したユーザーがエラー画面を見て離脱するため、広告の品質スコアが低下し、復旧後の集客効率が悪化するという負の連鎖も招きます。
現代のユーザーは数秒の読み込み遅延でもストレスを感じ、サイトが落ちていれば即座に競合他社へ流出してしまいます。
また、「注文は通ったのか」「個人情報は安全か」といった不安を抱いたユーザーからの問い合わせが殺到し、CS部門や現場窓口の電話・メール対応がパンクするなど、組織全体が二次被害による混乱に陥ります。
サーバーが再起動してシステムが動き出せば、問題が解決するわけではありません。原因の特定やログの解析、さらには取引先への報告書作成や再発防止策の策定など、後ろ向きな作業に数日間リソースを奪われることになります。本来進めるべき新規開発や企画業務を止めて、こうした事後対応にエンジニアが拘束されることこそが、企業にとって目に見えない最大の損失と言えます。
サーバーダウンが発生したときには、実際にサーバーがダウンしているのか確認しましょう。Webサイトにアクセスできない、フリーズやエラー表示が出る、ファイルが開けないなどの症状や、サーバー電源の状態を確認し、状況に応じて対応を考えます。
サーバーダウンが発生したときの初動対応は、形態別に異なります。自社サーバーの場合は、サーバー担当者へ連絡し、復旧見込み時間を把握したうえで、必要に応じて利用者へ周知する必要があります。
また、レンタルサーバーの場合は、レンタルサーバー会社へ連絡し、復旧対応や復旧予定時間を確認し、状況に応じて利用者対応を行いましょう。いずれにしても、サーバーダウンが発生したときには、速やかな対応が求められます。
サーバーダウンの対処方法は、原因ごとに異なります。
サーバーダウンを未然に防ぐためには対策が重要です。 ここでは5つの対策について紹介します。
メモリ増設や高性能CPUへの変更により、アクセス集中時でも耐えられる性能を確保し、現在の負荷状況や将来的な利用増加を見据えたサイジングを行うことが重要です。
スペック不足はレスポンス低下や障害の原因となるため、定期的にリソース使用状況を可視化し、適切なタイミングで増強を検討しましょう。
ホットスタンバイ/コールドスタンバイを活用するなど、あらかじめ予備環境を用意しておくことで、ハードウェア障害やシステムトラブル発生時も迅速な切り替えが可能です。
業務への影響度に応じて構成を選択し、定期的な切り替えテストを行うことで安定運用につなげられます。
一定以上のアクセスを制限・迂回させ、稼働中サーバーへの過剰負荷を防ぎましょう。ロードバランサーやCDNを活用し、トラフィックを分散させることも有効です。
特定の時間帯やキャンペーン時にアクセスが集中するサービスでは、事前に制御ルールを設けておくことで、サーバーダウンのリスクを低減できます。
定期的なセキュリティ診断や防御対策により、サイバー攻撃によるダウンや情報漏洩を防止しましょう。不正アクセスやDDoS攻撃は、サーバーダウンの大きな要因となります。
ファイアウォールやWAFの導入に加え、脆弱性診断を継続的に実施し、脅威を早期に把握・対処する体制を整えることが重要です。
24時間365日の監視とアラート通知により、障害の早期検知と未然防止を両立できます。CPUやメモリ使用率、ディスク容量などを常時監視することで、異常の兆候の早期把握が可能です。
自社対応が難しい場合は、専門事業者による運用監視サービスを活用することで、人的負担を抑えつつ安定運用を実現できます。
サーバーダウンが起きると、企業にとって大きな損失につながることがあります。ITシステムの監視・保守運用を専門事業者に委託できるMSPサービスを導入することで、サーバーダウンが起きないような監視体制を整え、万が一の際も迅速な対応が可能になります。
当メディアでは、IT運用体制から選べるおすすめのMSPサービスを紹介しています。IT担当者や情シスの方はぜひ参考にしてください。
運用体制から選べるMSPサービスを紹介する当メディア『とまRun365』では、サーバー保守の重要性などの基礎知識を紹介しています。ぜひ、併せてチェックしてください。
※1 金融機関などで求められる、厳格なセキュリティ基準のこと。参照元:TOPPANエッジITソリューション公式HP(https://www.holdings.toppan.com/ja/news/2024/02/newsrelease240220_1.html)
※2 クラウドサービス向けの国際的なセキュリティ認証のこと。参照元:TOPPANエッジITソリューション公式HP(https://www.tsi.toppan.com/service/reason/center/index.html)