2016年12月31日土曜日

Intel SSD 750の耐久テスト(その2)

このエントリーをはてなブックマークに追加
ftp.jaist.ac.jpでは、Intel SSD 750 1.2TBをZFSのL2ARCとして使用しています。前回に今年のクリスマスに寿命が尽きると予想しましたが、さいわいなことに外れました。以下に、書き込み量とPercentage Usedの推移をプロットしたものを示します。
今日の時点で、書き込んだ量は849TBでPercentage Usedは88%です。夏を境に書き込み量が減ったため、寿命の減り方が遅くなりました。この調子ですと寿命が尽きるのは3月半ば、1年持ちそうですね。

書き込み量が減ったのは、sourceforge.netのトラフィックが減ったからです。7月の第一週は6.7TB/日あったのが、9月の第一週には3.2TB/日と半分以下になりました。台湾のミラーが復活して、アクセスが分散されるようになったからだと思います。

L2ARCは、ARCからこぼれそうになったデータをSSDに書き込む仕掛けになっています。いろんなファイルにアクセスのあるsourceforge.netの流量が減ると、キャッシュからデータがこぼれにくくなり、書き込み量が減ることになります。


2016年7月31日日曜日

Intel SSD 750の耐久テスト

このエントリーをはてなブックマークに追加
ftp.jaist.ac.jpでは、Intel SSD 750 1.2TBをZFSのL2ARCとして使用しています。このSSDの寿命が今日で残り半分になりました。NVMeのSSDの寿命は、SMARTのPercentage Usedという項目でわかります。この値が今日50%に達しました。
このグラフは書き込み量とPercentage Usedの推移をプロットしたものです。今日までにSSDに書き込んだ量は509.6TBです。Intel SSD 750で保障されている総書き込み量は127TBですが、ずっと多く書けています。

書き込み量とPercentage Usedは比例しているので、Percentage Usedが100%に達するまでには1PB以上書けそうです。実際には100%を超えても書けるはずなので、運用に支障をきたさない範囲で利用を続けるつもりです。

SMARTの記録を取り始めたのが3月9日で、その日にPercentage Usedが1%になりました。Percentage Usedは運用日数に対してほぼ線形に増加しているので、今年のクリスマスには100%に到達します。運用を開始したのは3月3日でしたので、10か月ともたないことになります。

一日の書き込み量は3.4TBと、SSDの容量の3倍近くを書きこんでいます。こういう使い方をする場合は、コンシューマー向けの製品を使うべきではありません。それを承知の上で、ftp.jaist.ac.jpでは耐久テストを兼ねて使っているわけですが。

[2016-08-02] 書き込み量とPercentage Usedの推移を示すグラフを追加しました。

2016年3月5日土曜日

キャッシュのヒット率を改善しました

このエントリーをはてなブックマークに追加
サーバーを交換して以来、キャッシュのヒット率が低くストレージの負荷が高くなっていましたが、メモリを192GBから256GBに増量したことと、L2ARCをチューニングしたことにより、キャッシュのヒット率が上がりストレージの負荷を大幅に減らすことができました。

2016年2月27日土曜日

新しいストレージ構成について

このエントリーをはてなブックマークに追加
前回述べたように性能には苦しめられたものの、ストレージをiSCSIのボリュームに一度移行したおかげで、HDDのストレージを再構築できました。今回は、24スロットのSASエンクロージャーの2TBのHDDを4TBに交換して、11本構成のRAID-Z2が2組とスペア2本だったのを、6本構成のRAID-Z2を4組にしました。容量は36TBから64TBに増えました。

2016年2月25日木曜日

ようやくサーバーを交換したのですが

このエントリーをはてなブックマークに追加
前述したように、故障したHDDを抱えて性能が低下したストレージとSun Fire T2000の組み合わせを、iSCSIのストレージを接続した別のサーバーに切り替える作業を1月26日に行いました。サーバーのハードウェアは以前紹介したものです。OSは、性能とZFSの安定運用の観点からSolaris 11のx86版を選択しました。

これでftp.jaist.ac.jpの性能が改善するかと思いきや、iSCSIのストレージの性能が低くかったため逆に悪化してしまいました。ストレージの性能が低かったのは、諸般の事情でiSCSIのボリュームを束ねてRAID-Z2を組んでいたからです。RAID-Zはレイテンシの一番大きなデバイスに足を引っ張られるので、レイテンシのばらつきの大きい仮想化ストレージで組んではいけません。負荷テストをして大丈夫だったからとのことなのですが…

2016年2月22日月曜日

今年のftp.jaist.ac.jpは調子が悪いです

このエントリーをはてなブックマークに追加
今年に入ってからftp.jaist.ac.jpがすごく遅かったり、落ちていたりすることが増えています。その原因はストレージのトラブルや設計ミスですが、もうすぐ収束する予定です。

最初のトラブルは1月5日に置きました。2組のRAID-Z2のうち一方で3本のHDDが故障して、ストレージが使えなくなったのです。もともと故障したHDDが複数あったのを、ストレージの負荷が高すぎてresilverが終わらないので、あえて放置してありました。ところが、この日にHDDが1本見えなくなりとどめを刺されました。