災害復旧(DR)


災害復旧(Disaster Recovery, DR)とは(AZ-900対策)

災害復旧(Disaster Recovery, DR)とは、自然災害・大規模障害・事故などによってシステムが停止した場合に、業務を再開させるための仕組みや手順を指します。

目的は明確で、
「データを守り、サービスを可能な限り早く復旧させること」
です。

クラウドでは、地理的に離れた場所にデータを複製できるため、オンプレミスよりも高い DR 体制を簡単に実現できます。


災害復旧(DR)が必要な理由

現代のシステムは次のようなリスクに常にさらされています。

  • 地震・洪水・停電などの自然災害
  • データセンターの事故や火災
  • 大規模ネットワーク障害
  • 人為的ミスによるデータ消失

これらのトラブルが発生すると、事業に深刻な影響を与えるため、DR対応は必ず必要です。


DRで重要な2つの指標(RTO / RPO)

災害復旧の計画において最も重要なのが次の2つの指標です。

● RTO(復旧時間目標:Recovery Time Objective)

「どれくらいの時間で復旧させるか」という目標。

例:

  • 4時間以内にシステムを復旧
  • 即時復旧(ゼロダウンタイム)など

● RPO(復旧ポイント目標:Recovery Point Objective)

「どれくらいのデータ損失を許容するか」という目標。

例:

  • 5分以内
  • 1時間以内
  • 24時間以内

RTO が短いほど、RPO が小さいほど、DRのレベルは高くなります。


災害復旧とバックアップの違い

混同されがちな概念を整理すると以下の通りです。

概念説明
バックアップデータを保管し、消失時に戻す仕組み
災害復旧(DR)システム全体を迅速に復旧させる仕組み

バックアップは DR の一部ですが、DR はもっと広い考え方です。


クラウド(Azure)がDRに強い理由

Azure のようなクラウドには、DRを強力に支援する仕組みが標準で備わっています。

● 複数リージョンへのデータ複製

データを地理的に離れたリージョンに自動コピーできる。

● 冗長化ストレージ

  • LRS(ローカル冗長)
  • ZRS(ゾーン冗長)
  • GRS(地理冗長)
  • GZRS(ゾーン+地理冗長)

必要に応じて耐障害性が選べる。

● サービスのフェールオーバー

別リージョンに自動的に切り替える機能を利用できる。

● バックアップサービスの標準提供

Azure Backup により、VM やデータベースを簡単に復元可能。


DRの考え方を理解しやすい例

  • 関東データセンターが大地震で停止
     → 関西リージョンに切り替えてサービス継続
  • 東京のサーバーが火災で停止
     → 数分以内に大阪側で復旧
  • データ破損が発生
     → 5分前のバックアップに復元して業務再開

これが「DR対応の世界」です。


DRのレベル(一般的な段階)

システムのDR設計には、次のような段階があります。

レベル1:データバックアップのみ

  • 最低限の対策
  • 復旧まで時間がかかる

レベル2:スタンバイ環境を用意

  • 別の場所に予備サーバーを置く
  • 手動で切り替える

レベル3:自動フェールオーバー

  • 常に複製されている環境がある
  • 自動で切替
  • RTO / RPO が非常に短い

Azure ではレベル2~3の実装が容易です。


AZ-900で理解すべきDRのポイント

  • DR=災害時にシステムを復旧させる仕組み
  • バックアップと DR は異なる概念
  • RTO(復旧時間)と RPO(データ損失許容時間)が重要
  • Azure は複数リージョン・冗長ストレージで DR に強い
  • DR は高可用性(HA)と密接に関係する