あきろぐ

いろいろめもするよ

Veeam9.5でバックアップ時にパケロスが生じている話2

VeeamでVMのバックアップを実施すると通信断が発生している件の続き。

akng-engineer.hatenablog.com

VMのバックアップの同時実行数を数個単位で行うと特に問題は発生していないが、2桁のVM数になると、パケロスが生じ同時実行数が増えるほど通信断の時間が長くなっていくことが明らかになった。

今回、10、15、20VMに分けて検証をしたので、その結果についてまとめてみる。

環境

  • ESXi6.0 (サーバ:36CPU, メモリ512GB, サイズ446GB) 
  • VCSA6.0
  • Veeam backup & replication 9.5
  • VMバージョン:11
  • ゲストOS:Windows server 2012R2

VMスペック

  • CPU:2
  • メモリ:4GB
  • ハードディスク:50GB

 

結果

フルバックアップの場合

 

Ping

同時実行数

範囲

平均値

中央値

10

-

-

-

15

0-19

12

12

20

4-28

12

11

 平均値と中央値を見ると15VMと20VMでは大差ないが、Ping断の数で見ると15VMより20VMのほうがPing断が発生する頻度が高くなった。

 

差分バックアップの場合

 

Ping

同時実行数

範囲

平均値

中央値

10

-

-

-

15

8-25

13

12

20

13-50

25

22

 差分バックアップだと15VMと20VMではPing断が発生する頻度に明らかな違いが表れた。平均値・中央値で見ても15VMの約2倍のパケロスが生じていた。

また、フルバックアップと差分バックアップで比較してみても、同時実行数が同じでも差分バックアップのほうがPing断が発生する数が多かった。差分バックあっぷはより負荷が高いのではないかと考えられた。

差分バックアップの負荷が高い理由

差分バックアップストレージをより効率的に利用するためには最適な方法であるが、ストレージI/Oの負荷が増分バックアップと比較して約3倍高い負荷がかかるため、Ping断が多く発生していると考えられる。差分バックアップは、過去に取得したフルバックアップファイルに対してデータをマージさせる工程があり、その際に高負荷になっているのではないかと推測している。

チーム内ではファイルストレージを使用しているため通信断が起こりやすいのではないかと考えているが、まだ確信を得てはいないので引き続き検証が必要である。。。