it-swarm-ja.com

増分バックアップのセットアップでは、定期的な完全バックアップが本当に必要ですか?

私は自分が持っている古いコンピューターを自分自身と他の何人かの人々のリモートバックアップサーバーとして使用するつもりです。私たちはすべて地理的に離れており、rsyncとsshを使用して毎日増分バックアップを実行する予定です。

私の当初のアイデアは、最初の完全バックアップを1つ作成し、それを実行するオーバーヘッドを二度と処理する必要がないことでした。その瞬間から、最後のバックアップ以降に変更されたファイルのみをコピーします。

これは悪いことかもしれないと言われましたが、その理由がわかりません。各スナップショットは、変更されていないファイルと元の変更されたファイルへのハードリンクで構成されているため、新しい完全バックアップと同じになるのではないでしょうか。別の完全バックアップを作成したいのはなぜですか?

編集:

私はもっ​​と良い点を説明すべきだった。 rsyncを使用して増分バックアップを実行することを意味する場合、これは次のことを意味します。

rsync -avh --delete --link-dest=./remote/previous_increment ./local/ ./remote/new_increment

これにより、変更されていないすべてのファイルへのハードリンクが含まれるため、完全で機能するスナップショットが作成されます。完全バックアップと以前のすべての増分バックアップがたまたま削除された場合でも、最後の増分バックアップは一貫しています。ただし、前のファイルのいずれかが破損した場合、最後のファイルも同じiノードを指しているため、破損することは間違いありません。

最後のスナップショットのリンクを切断し、それを別の書き込み保護されたHDにコピーすることによって(たとえば、月に1回)、サーバー側で合成フルバックアップを定期的に実行するとどうなりますか。そうすれば、冗長なフルコピーが作成され、ファイルを再送信するオーバーヘッドを回避できます。

それで問題は解決しますか?それでも完全バックアップを実行する必要がありますか?

2
rgcalsaverini

通常、増分バックアップを行う場合は、実際に変更されたファイルのみを何らかの方法(tarアーカイブなど)で保存しますが、変更されていないファイルは以前のバックアップファイルのみに保存します。この方法では、リカバリのためにすべてのバックアップファイルが必要になり、古いバックアップを削除することはできません。これは実用的ではないため、しばらくしてから新しい完全バックアップを作成する必要があります。

使用しているものはより高度で(rsnapshot?)、常にデータのフルセットを保存しますが、ハードリンクを使用してバックアップ間でデータを共有することにより、オーバーヘッドを最小限に抑えます。このようにして、現在のバックアップを無効にすることなく、古いバックアップを削除できます。したがって、通常の議論は重要ではありません。

編集:

rsnapshotは次のように機能します。

初めてrsyncを使用して完全なコピーを作成するだけです。

その後のバックアップでは、すべてのファイルが前のバックアップへのハードリンクである新しい完全なディレクトリツリーが作成されます。その後、変更されたファイルは、このツリーに対してrsyncを実行することによって置き換えられます。

したがって、各バックアップは完了しますが、古いバックアップとデータを共有します。古いバックアップを削除すると、他のすべてのバックアップとは異なるファイルのみが実際に削除されます。共有ファイルの場合、ハードリンク数のみが1つ減ります。

バックアップのオーバーヘッドは、もちろんスペースも使用する追加のディレクトリツリーです。ただし、残りのバックアップツリーに影響を与えずに古いバックアップツリーを削除して、そのスペースを回復することができます。

あなたのバックアップ戦略の説明は、私にはrsnapshotのように聞こえます。

Edit2:

ビットの腐敗が心配な場合(つまり、既存のバックアップファイルが破損している場合)、rsyncにオプション-cを追加して、ローカルファイルとリモートファイルにMD5チェックサムを作成できます。これにより、すべてのファイルを読み取る必要があるため、ディスクI/Oが大幅に増加します。ただし、すべてのファイルのチェックサムのみを追加で送信する必要があるため、ネットワークトラフィックはわずかに増加します。これにより、新しい完全バックアップの最後の理由が削除されます。

6

増分バックアップ、つまりrsyncの使用は、静的バックアップ、つまりcpの使用よりも複雑なプロセスです。一部の人々は、増分バックアップが破損する可能性が高いと考えています。

  1. 障害はツール自体にある可能性があります。 Windowsのrsyncは不安定であることが知られており、 バックアップからファイルを削除する必要がない場合もあります。

  2. バックアップツールがファイルのバージョン間のバイナリの違いのみを保存する場合、ファイルの中間バージョンが失われると、ファイルの最終バージョンを再構築できなくなる可能性があります。


バックアップソリューションが何であれ、バックアップからデータのコピーを復元することにより、定期的にテストします

1
Li-aung Yip

誤解があったと思います。

ほとんどの場合、完全バックアップ増分バックアップの人々は:
フル:すべてのデータをバックアップします。
増分:変更のみをバックアップします。

バックアップを復元する必要がある場合は、完全バックアップから開始し、次にall増分バックアップを実行します。それには多くの時間がかかる可能性があります。これが、多くの企業が週末に完全バックアップを実行し、平日に部分バックアップを実行する理由の1つです。最大5つのパーシャルが管理可能です。

現在、rsyncは通常部分的なバックアップを作成しません。変更のみをネット経由で送信しますが、最終結果はすべてのデータの完全なコピーになります。したがって、パーシャルだけを使用しないという最もよく使われる理由は当てはまりません。


少なくとも2つのバックアップを作成することをお勧めします。 1つの既知の良いものと作業コピー。これら2つを交互に使用するか、年次バックアップを作成してテストし、読み取り専用に設定して、来年まで他のバックアップを使用します。その後、繰り返します。

1
Hennes