災害復旧(Disaster Recovery, DR)とは(AZ-900対策)
災害復旧(Disaster Recovery, DR)とは、自然災害・大規模障害・事故などによってシステムが停止した場合に、業務を再開させるための仕組みや手順を指します。
目的は明確で、
「データを守り、サービスを可能な限り早く復旧させること」
です。
クラウドでは、地理的に離れた場所にデータを複製できるため、オンプレミスよりも高い DR 体制を簡単に実現できます。
災害復旧(DR)が必要な理由
現代のシステムは次のようなリスクに常にさらされています。
- 地震・洪水・停電などの自然災害
- データセンターの事故や火災
- 大規模ネットワーク障害
- 人為的ミスによるデータ消失
これらのトラブルが発生すると、事業に深刻な影響を与えるため、DR対応は必ず必要です。
DRで重要な2つの指標(RTO / RPO)
災害復旧の計画において最も重要なのが次の2つの指標です。
● RTO(復旧時間目標:Recovery Time Objective)
「どれくらいの時間で復旧させるか」という目標。
例:
- 4時間以内にシステムを復旧
- 即時復旧(ゼロダウンタイム)など
● RPO(復旧ポイント目標:Recovery Point Objective)
「どれくらいのデータ損失を許容するか」という目標。
例:
- 5分以内
- 1時間以内
- 24時間以内
RTO が短いほど、RPO が小さいほど、DRのレベルは高くなります。
災害復旧とバックアップの違い
混同されがちな概念を整理すると以下の通りです。
| 概念 | 説明 |
|---|---|
| バックアップ | データを保管し、消失時に戻す仕組み |
| 災害復旧(DR) | システム全体を迅速に復旧させる仕組み |
バックアップは DR の一部ですが、DR はもっと広い考え方です。
クラウド(Azure)がDRに強い理由
Azure のようなクラウドには、DRを強力に支援する仕組みが標準で備わっています。
● 複数リージョンへのデータ複製
データを地理的に離れたリージョンに自動コピーできる。
● 冗長化ストレージ
- LRS(ローカル冗長)
- ZRS(ゾーン冗長)
- GRS(地理冗長)
- GZRS(ゾーン+地理冗長)
必要に応じて耐障害性が選べる。
● サービスのフェールオーバー
別リージョンに自動的に切り替える機能を利用できる。
● バックアップサービスの標準提供
Azure Backup により、VM やデータベースを簡単に復元可能。
DRの考え方を理解しやすい例
- 関東データセンターが大地震で停止
→ 関西リージョンに切り替えてサービス継続 - 東京のサーバーが火災で停止
→ 数分以内に大阪側で復旧 - データ破損が発生
→ 5分前のバックアップに復元して業務再開
これが「DR対応の世界」です。
DRのレベル(一般的な段階)
システムのDR設計には、次のような段階があります。
レベル1:データバックアップのみ
- 最低限の対策
- 復旧まで時間がかかる
レベル2:スタンバイ環境を用意
- 別の場所に予備サーバーを置く
- 手動で切り替える
レベル3:自動フェールオーバー
- 常に複製されている環境がある
- 自動で切替
- RTO / RPO が非常に短い
Azure ではレベル2~3の実装が容易です。
AZ-900で理解すべきDRのポイント
- DR=災害時にシステムを復旧させる仕組み
- バックアップと DR は異なる概念
- RTO(復旧時間)と RPO(データ損失許容時間)が重要
- Azure は複数リージョン・冗長ストレージで DR に強い
- DR は高可用性(HA)と密接に関係する