ECCメモリの歪な市場はインテルのせい

  • 投稿日:
  • by

Linusの、Linusによる、Linusのための動画です。

Linus was right. - ECC Memory Explained

動画からフォーラムをたどります。

https://linustechtips.com/topic/1302804-linus-was-right/

すると、Linus Torvalds御大の書き込みのリンクが出てきます。最初のリンクはミスリーディングですね。

Ryzen 9 5000 series processor

冒頭部分がもっとも言いたいことのようです。

> So yeah, I do very much agree AMD has superior offering. ECC doesn't really matter here though.

ECC absolutely matters.

「ECCはマジどうでもいいけど」という部分にかみついて、「ECCは絶対に重要」と書いています。

末尾にかけてインテルへの恨み節が続きます。

But I blame Intel, because they were the big fish in the pond, and they were the ones that caused the ECC market to basically implode over a couple of decades.

(DeepL訳)しかし、私はインテルを非難します。彼らは池の中の大きな魚であり、ECC市場を数十年にわたって基本的に崩壊させた張本人だったからです。

ECC DRAM (or just parity) used to be standard and easily accessible back when. ECC and parity isn't a new thing. It was literally killed by bad Intel policies.

(DeepL訳+超訳)ECC DRAM(または単なるパリティ)は、かつては標準的で簡単に入手できました。ECCとパリティは何も新しいものではありません。文字通り、インテルの悪しきポリシーによって消滅してしまったのです。

And don't let people tell you that DRAM got so reliable that it wasn't needed. That was never ever really true. See above.

(DeepL訳+超訳)また、「DRAMは信頼性が高くなったから必要ない」と言われても困ります。それは決して本当のことではありません。以上、ご参考までに。

私が激しく同意するのはこの最後の1行です。

PCを自分で組み立てる層でも、

DDRメモリはトランザクションで処理するからECCなんかいらないんだよ。寝言?

と真顔で言う人がいて困惑することがあります。

リッチな組み込み系で仕事をしていた人ならご存じでしょうが、GBオーダーのRAMを搭載する装置ではECCがデフォルトです。たとえば複合機は昔からECCメモリ搭載です。

車載エンタテイメント系などでも各社メモリのビット化け(ソフトエラー)で大騒ぎしたことがあったかと思います。

SRAM(フリップフロップ)よりもDRAMの方が、より低電圧駆動の回路の方がビット化けは発生しやすくなります。

確率論なので、MBオーダーでは全く問題なかった(例:10万台の市場で1年に1回とか)のが、GBオーダーになれば10万台で1年に1000回となって問題になります。

で、Linus Torvalds御大はあまり触れていませんが、ECCメモリ自体が不当に高く売られている状況もあるような気がします。

サーバー用メモリ(ECC)は高価、なぜなら信頼性が高いから

というには、価格差がありすぎました。生産数が少ないから高いということなのでしょうが、はたしてほんとうにそれだけが理由でしょうか?

ビット化けはRAMに限らず、あらゆるデバイスが影響を受けます。

大きいメモリを積んでいると"当たりを引く"確率が上がるので対策が必要ということです。

GPUではNVIDIAがとっくにECC対応している一方、AMDのGDDR5では未対応との解説が例えば以下にありました。

GPUのエラー発生頻度はどの程度のものであるか?

NVIDIAのFermi以降の科学技術計算用のGPUは、デバイスメモリだけでなく、L2キャッシュ、L1キャッシュ、Shared Memory、Read Only Data Cache、さらにレジスタファイルにもECCを付けているので、データ化けは大きく減らす事ができると思われる。

というわけで、RAMを16GBも32GBも積んでいるのにECC対応でないRAM/マザーを使っているとしたら、妙な挙動に悩まされるだろうということです。

宇宙線を避けるために、マザーボードを縦置きにする、というのは倍率を少し変化させるだけで、同じことです。地面(地球)からも放射線は飛んできます。

1か月に1回が2か月に1回に減る程度のことで。それが3日に1回なら、対策したことになりませんよね。