2021年6月11日金曜日

バックアッププロセスとバックアップデータの検証・妥当性確認に投資する理由とは?

この記事では、新しいソフトウェアツールとその目的であるバックアップ検証( Server Backup Software)について説明したいと思います。データの完全消失を経験していない多くの専門家は、デジタルストレージは完璧で、デジタル機器は常に完璧に機能していると思い込んでいますが、現実は大きく異なります。ストレージの密度はますます高まっており、1台のハードディスクにはこれまで以上に多くの情報が入っています。一方で、エラー率は劇的に下がっているわけではないので、デバイスごとの故障の確率は近年、実際に増加しています。さらに、データ損失の他の脅威も一般的になってきました。例えば、ランサムウェアやマルウェア、従業員による破壊行為などはデータ損失の外部原因であり、ビットロットやディスクの欠陥、RAMの欠陥などはデバイス自体に影響を与えます。
また、近年の傾向として、バックアップを高速化するために増分バックアップを行うことがあります。しかし、多くの専門家は、増分バックアップには前のバックアップへの依存性があることを認識していません。何らかの理由でバックアップチェーンのどこかのバックアップが破損した場合、バックアップチェーン全体、または少なくともバックアップチェーンの一部が読めなくなってしまいます。インクリメンタル方式が普及した本当の理由は、ストレージの容量が増えたにもかかわらず、ハードディスクメーカーが同じ技術を使って同じペースでスループット速度を上げることができなかったからです。SSDストレージは、処理能力は格段に優れていますが、残念ながらエラー率が高く、消耗も激しいのです。SSDドライブ内のセルは消耗が激しく、ドライブ本体内のスペアセルと自動的に交換されます。しかし、「もうすぐ故障するセル」の検出プロセスは、通常、セルが実際に読み込まれるまで延期されますが、これはバックアップ・ドライブではあまり起こりません(Backup Hyper-V virtual machine)。

バックアップ検証
上記のツールには、バックアップ完了時に直ちにバックアップファイルを検証するバックアップオプションが用意されています。これらの機能は、Windowsのキャッシングシステムをバイパスして、データファイルが保存されたディスクから実際に読み戻されていることを確認します。上記ツールのユニークな点は、リモートストレージに対しても同様の処理を行うことができることです。データは再度ダウンロードされ、各ファイルが正しく処理されたことを確認します。さらに、このステップを一定のサイズまでのファイルに限定するオプションもあります。

バックアップ検証
上記ツールのユニークなバックアップ検証機能により、ユーザーはファイルが処理された後も検証を行うことができます。次のようなシナリオを考えてみましょう。典型的な中小企業のファイルサーバには、数テラバイトのファイルとフォルダがあり、通常は約1,000万個以上のファイルがあります。通常、これらのファイルのうち時間の経過とともに変更されているのは1%未満で、特に最終編集から1ヶ月ほど経過した後に変更されています。平均して、これらのファイルは一度もアクセスされることなく何年も眠ったままになっている。ビットローテーション、ディスクの欠陥、マルウェア、そして不満を持った従業員による単純な削除やファイルの変更は、数年後にファイルサーバのディスクが完全に故障し、完全なリストアが必要になるまで気づかれないかもしれません。このような大規模なデータセットを効率的に検証するにはどうすればよいのでしょうか。
上記のソフトウェアは、毎日何テラバイトものデータがバックアップされているこの問題に対して、ユニークなソリューションを提供しています。このソフトウェアでは、バックアップサイクルごとにバックアップファイルの一部をランダムに検証する検証機能を使用しています。例えば、ファイルサーバの全バックアップファイルの1%のみを検証するように設定することができます。例えば、ファイルサーバーに100万個のファイルがある場合、1万個のファイルを検証することになります。全バックアップファイルの1%をランダムに検証することで、すべてのファイルを検証するのに平均100サイクルかかることになる。1日に10回バックアップが実行されるとすると、全バックアップセットの検証には10日かかることになる。
小規模なバックアップセットであれば、数時間でバックアップと検証が完了しますが、数百万のフォルダと数十テラバイトのストレージを扱う場合は、ネットワーク接続や機械式ハードドライブのデータスループット速度が制限されているため、バックアップサイクルごとに全セットを検証することはもはや不可能です。妥協案として、このツールの機能は、バックアップサイクルごとにランダムなサブセットを選択することで、バックアップデバイス全体をカバーしています。
バックアップファイルの再読込は、ドライブ上のすべてのセルとセクタを更新するため、非常に重要です。ツールのバックアップ検証ツールを使用することで、データはドライブによって「現実化」されます。つまり、ドライブはセクタを再チェックし、必要に応じて内部修復を行うことを余儀なくされます。修復が不可能になった場合、ドライブはWindowsに信号を送り、ツールは問題を記録し、アラートを送信して問題を知らせます。さらに、ソフトウェアはチェックサムを使用するか、または元のファイルとの1対1の比較を実行して、各バックアップファイルの内容を検証します。したがって、バックアップ検証は重要な「保険」であり、バックアップストレージ内のすべてのファイルが実際に有効であり、読み取り可能であることを繰り返し証明することができます。

0 件のコメント:

コメントを投稿