Seagate Mozaic 4+(HAMR)44TB HDD発表:インフラ設計の実務インパクトと落とし穴

eyecatch AI関連

「バックアップ用のRAID、全然リビルド終わらないんだけど…」
こんな経験、インフラ寄りのエンジニアなら一度はあると思います。
しかも最近は「1ノードあたりの容量をもっと増やせ」と言われる一方で、「電力は抑えて」「ラックはもう増やせない」と来る。正直、詰み将棋みたいな条件です。

結論(忙しい方向け)

  • 44TBの量産は、容量の増加以上に『フォールトドメイン設計/リビルド戦略』の前提を変えます(RAID6一本足は危険域)。
  • TB/ラック・TB/Wは改善しやすい一方、障害時の爆発半径が増えるため、EC/分散ストレージ前提の運用設計が重要です。
  • 初物リスク(HAMRの長期故障モード)と高容量帯のベンダー偏りは、調達・SLAの観点で要注意です。

想定読者: SRE/インフラ/ストレージ設計担当(オンプレ・クラウド運用)

そんな中で出てきたのが、Seagateの Mozaic 4+ / 44TB HAMR HDD
ただの「ちょっと大きいHDD」ではなく、ここから先10年のストレージ設計を変えかねない技術です。


一言でいうと「HDD界の64bit移行」

一言でいうと「HDD界の64bit移行」

このMozaic 4+、一言で説明すると:

「HDD界の64bit移行」みたいなものです。

32bit CPUがメモリ空間の限界にぶつかって、64bitに移行したあの感じにすごく近いです。

  • これまでのPMR(垂直磁気記録)は、だいたい限界まで来ていた
  • そこで、記録方式そのものをHAMR(熱アシスト磁気記録)に刷新
  • メディア、ヘッド、コントローラ、ファームまでひっくるめて「Mozaic 4+」という新しいプラットフォームとして量産開始
  • 初手で 44TB/台、しかも 50TB → 60TB → 100TB までロードマップが引かれている

表向きは「世界最大容量の44TB HDD」ですが、本質は
「今後のHDDは、このHAMRスタックで伸ばしていきます」という世代交代宣言です。


なぜそんなに大事か:競合と比較すると見えてくるもの

Seagate vs Western Digital / Toshiba:容量天井の差がハッキリしてきた

ざっくり整理すると:

  • Seagate Mozaic 4+
  • 記録方式:HAMR
  • 面記録密度:3Tb/in²クラス
  • 容量:44TB(今世代)、50TB+が近い将来
  • ロードマップ:2033年に100TB超を公言
  • Western Digital / Toshiba
  • 記録方式:ePMR / MAMR + ヘリウム、必要に応じてSMR
  • 面記録密度:1.3〜1.5Tb/in²前後
  • 容量:PMR系でせいぜい26〜32TBクラス
  • より上はSMR頼みで、扱いが一気に難しくなる

ぶっちゃけ、「素の3.5インチHDDで40TB台」 にガチで乗ってきたのは現時点でSeagateだけです。
PMRやMAMRをひたすらチューニングして延命する路線と、「記録方式ごと変えて新しい伸びしろを取る」路線の差が、ようやくはっきり数字として見え始めました。

この差は、単に「1台あたりのTB数がすごいです」で終わらないです。
クラウドや大規模ストレージの現場にとっては、設計パラメータそのものが変わるレベルの話です。

HDD vs SSD:コールド〜ウォーム層では、またHDDに票が入る流れ

よくある期待として、

「そのうち全部SSDになるでしょ?」

がありますが、今回のMozaic 4+を見ると、正直その未来はまた少し遠のいたな、という印象です。

  • 44TBクラスのHDDが量産・一般提供される
  • $/TB は当然HDDが圧倒的に安い
  • クラウドストレージの 87% はまだHDD(Seagate談)
  • しかも 1EB構成で従来30TB HDD比 約47%効率向上(必要台数、電力、設置面積のトータル)

AIだの生成系ワークロードだのと言っても、
「学習するGPUの横に積むデータの山」は、相変わらずHDDが支える現実はそう簡単には変わりません。

“ホットデータはNVMe、ウォーム〜コールドはHAMR HDD” という棲み分けが、
むしろ強化される方向に振れたな、というのが個人的な見立てです。


インフラ屋視点でのインパクト:得られるものと、増える責務

関連(インフラ文脈)データセンター拡張とAI基盤GPU投資とデータ/電力の制約


インフラ屋視点でのインパクト:得られるものと、増える責務

EB構成で「1万台削れる」のは数字以上にデカい

Seagateの試算がわかりやすいです:

  • 従来の30TB HDDで 1EB 構成
  • 必要台数:33,330台
  • 設置面積:約30㎡
  • 消費電力量:約2.6GWh
  • 44TB Mozaic 4+で 1EB 構成
  • 必要台数:22,700台
  • 設置面積:約20㎡
  • 消費電力量:約1.8GWh

単に「台数が3割減りました」ではなく、

  • ラック数が減る → 施設面積・配線・ラックコストが減る
  • 電力と冷却コストが減る
  • 容量あたりの運用負荷(ハード交換、RMA、設置作業)も減る

正直、DC運用側から見ると「これはかなり魅力的」です。
ラックも電源も無限ではないので、TB/ラック と TB/W で伸びてくれるのは本当にありがたい


ただ、懸念点もあります:44TB時代の「現実的な落とし穴」

ここからが、インフラ担当として「うーん」と唸るポイントです。

44TBのRebuild時間は、もはや笑えないレベル

44TBのHDDが飛んだとき、フルスキャン・フルリビルドにかかる時間を想像してみてください。

  • たとえば、実効 250MB/s で読み切ったとしても、
    44TB ≒ 44,000GB ≒ 44,000,000MB / 250MB/s ≒ 176,000秒 ≒ 約49時間
  • 実際には
  • 他のI/Oも混ざる
  • RAID / erasure coding のオーバーヘッド
  • 読み取りエラー対応 なども乗る
  • 実務上は 平気で数日スケール のリビルド・修復時間になりえます

正直、「RAID6 + 8本構成に44TBを突っ込む」みたいな設計は、
もはややってはいけない設計に近づいていると感じます。

今後は:

  • オブジェクトストレージ+イレイジャーコーディング
  • デクラスター型RAID
  • 小さめのフォールトドメイン(シャーシ単位・ラック単位での分散)

といった、「前提として大容量ディスクのリビルドは遅くて当たり前」という設計に振っていかないと、
容量は増えたのに、実効的な可用性は下がるという本末転倒になりかねません。

ノード1台あたりの「爆発半径」が大きくなる

1台44TB、1ノードあたり12〜24本積むような構成になると、
1ノード死んだときの喪失容量は、軽く数百TB〜1PBクラスになります。

これは、

  • バックアップのRPO/RTO
  • レプリケーションの設計(何重・どのリージョン間で)
  • フォールトドメインの切り方(ラック単位/ゾーン単位)

を、もう一段シビアに考えないといけない、という話です。

ぶっちゃけ、「とりあえずRAIDで守って、週1フルバックアップ取ってます」という運用は、
40TB級ディスクの世界ではかなり危険な香りがします。

熱と電力:TB/Wは良くても、ラック単位で見ると簡単ではない

Seagateの数字を見る限り、TBあたりの電力効率は良くなっています
ただし現場で効いてくるのは、「1ラックに何台突っ込むか」「1ラックあたりの総消費電力」です。

  • HAMRは
  • ヘッドにレーザーとNFT(Near-field Transducer)を積む
  • その制御ロジックも必要
  • ローカルにメディアを加熱する
  • その結果:
  • 1台あたりの消費電力は、従来PMRよりやや増える可能性が高い
  • でもTBあたりで見れば効率アップ、という世界観になりがち

問題は、DC側の電力上限・冷却能力です。
「せっかくTB/台が増えたから、ラックパンパンまで詰め込もう」とやった瞬間に、

  • ラックあたりの消費電力上限
  • 冷却能力(温度マージン)

に引っかかる、ということも十分ありえます。

ですので、Mozaic 4+は「省エネで優しいHDD」ではなく、
“大容量を省エネ寄りに詰め込める道具。ただし詰め込み方はちゃんと考えろ” くらいの解釈がちょうど良いと思っています。

HAMRの成熟度と「初物リスク」

HAMR自体、Seagateは長年フィールドテストしてきていますが、
大規模量産として本気展開するのは今回が事実上のスタートラインです。

懸念としては:

  • レーザーやNFTの劣化モードが、長期的にどこまで見えているか
  • 局所加熱を繰り返すメディアの寿命曲線が、PMRとどう違うか
  • 温度変化の激しい環境や、想定外なワークロードでの振る舞い

など、「論文・社内テストではわかっているけれど、クラウド事業者が何百万台ぶん叩いたデータ」とはまた別物です。

正直、最初の世代はハイパースケーラーが肩代わりしてくれると思っていて、
普通のエンタープライズやオンプレ勢は、そのフィードバックが一巡してから本格採用、という流れになりそうだなと見ています。

高容量帯が「事実上Seagate一択」になるリスク

もう一つ、地味に効いてくるのがベンダーロックイン寄りの懸念です。

  • 40TB台〜50TB台の「最高容量ゾーン」
  • 少なくとも近い将来は、Seagate以外に実質的な選択肢がない可能性が高い
  • マルチベンダー構成にしたい企業にとっては
  • 容量を優先するか
  • ベンダー分散を優先するか
  • というトレードオフが濃くなる

「最高容量はSeagate、他社は30TB前後まで」みたいな住み分けになると、
価格交渉や調達戦略がちょっと窮屈になるのは、正直なところ懸念があります。


デベロッパ / SRE 視点:アプリは何も変わらない、でも設計の前提は変わる

デベロッパ / SRE 視点:アプリは何も変わらない、でも設計の前提は変わる

良いニュースとしては、

  • OSから見ればただのブロックデバイス
  • ext4 / XFS / NTFS / ZFS など、普通にマウントして使える
  • アプリ側で「HAMR対応」みたいなことを意識する必要は、ほぼない

です。

一方で、ストレージ設計とSREの仕事は地味に変わります。

  • ディスク1本の破壊力がデカすぎる
  • → フォールトドメインの切り方を見直す
  • リビルド時間がとにかく長い
  • → RAID5/6頼みから脱却し、オブジェクト+ECや分散FSを前提に
  • スクラブや整合性チェックも重くなる
  • → バックグラウンドジョブの設計とSLOをちゃんと定義する必要あり

つまり、

「アプリコードは変えなくていいけれど、ストレージ周りの前提条件を書き換える必要がある

というタイプの変化です。


プロダクションで使うか?正直、まだ「賢い様子見」が現実的

では、今この44TB HAMRを、どれくらい本気で採用するか。

自分がインフラ責任者だったら、正直こうします:

  1. 最初は限定用途でパイロット運用
  2. オブジェクトストレージのコールド〜ウォーム層
  3. バックアップ / アーカイブクラスタ
  4. いきなりDBのプライマリやメインのファイルサーバには使わない
  5. erasure coding 前提で設計
  6. RAID5/6は使わず、Ceph / MinIO / proprietary な分散ストレージなどでEC運用
  7. フォールトドメイン(ラック/シャーシ単位)をちゃんと分ける
  8. 1〜2年分くらいのフィールドデータを見てから、メインストレージを議論
  9. 故障パターン(初期故障、レーザー関連の変なモードがないか)
  10. 温度と故障率の相関(旧世代より敏感ではないか)
  11. ファームウェアの成熟度と、ベンダーのサポートレスポンス

つまり、

「これをガン無視するのはもったいないが、全面移行はまだ早い」

というポジションです。


FAQ

Q. HAMR(熱アシスト磁気記録)は、何がそんなに違う?

A. 記録密度の伸びしろを、PMR系の“延命”ではなく記録方式の刷新で取りに行く点です。ロードマップ(50TB/60TB/100TB級)の実現可能性が上がります。

Q. 44TB時代にRAID5/6が危険と言われる理由は?

A. ディスク1本あたりの容量が大きすぎて、再構築(rebuild)時間が数日スケールになりやすく、その間に追加障害が起きる確率が上がるためです。フォールトドメイン縮小やEC/分散FSを前提に考えるのが現実的です。

Q. まずどこで試すのが現実的?

A. いきなりDB/プライマリ用途ではなく、バックアップ/アーカイブ/オブジェクトストレージのコールド〜ウォーム層でのパイロットが安全です。

Q. 調達・運用で一番の注意点は?

A. 初物(HAMRスタック)の長期データ不足と、高容量帯が特定ベンダーに寄ることによる調達リスクです。SLAと代替プラン(容量帯の分散)をセットで。

まとめ:これは「HDDの終わり」ではなく「HDDの第二幕」の始まり

まとめ:これは「HDDの終わり」ではなく「HDDの第二幕」の始まり

AIだ、GPUだ、NVMeだ、とどうしても華やかなコンピュート側に目が行きがちですが、
現実に価値を生んでいるのは「どれだけ安く・安全に・長くデータを溜め込めるか」です。

Seagate Mozaic 4+ の44TB HAMRは、

  • HDDはまだ終わっていないどころか、ここから10年分の伸びしろを手に入れた
  • コールド〜ウォームデータのストレージ設計を、もう一段 “密度寄り” に振れる
  • その代わり、耐障害設計とリビルド戦略をサボると痛い目を見る

というメッセージだと受け取りました。

正直、技術的なワクワク感はかなりあります。
一方で、「これを何も考えずに既存のRAIDボックスに突っ込めばOK」とは全く思っていません。

  • ちゃんとした分散ストレージやオブジェクト基盤を持っている組織
  • 早めにパイロットして、次の世代の設計に組み込む価値あり
  • まだ“RAID箱+ファイルサーバ”がメインの組織
  • 導入より先に、ストレージアーキテクチャの見直しが必要

そんな立ち位置の技術だと感じています。
「とりあえず様子見」ではなく、「本番フル採用は様子見しつつ、検証はすぐ始める」くらいが、エンジニアとして一番健全かなと思います。

コメント

タイトルとURLをコピーしました