- 北の空からみなみへ -
exblog staff

<< 対極という対比 ふり・つもり(夢想狂騒詩) >>
寿命とMTBF
2009年 02月 18日
パーツ寿命という言葉と、平均故障間隔(MTBF)という言葉は同義語であるが、かなりニュアンスが異なる。

あえて同義語と書いたのは、信頼性を示す式と、崩壊してゆく放射能残存数を示す次の両式がそっくりだから。

c0062295_040999.gif
c0062295_0541420.gif

左式は[pdf] MTBF (平均 故障間隔)の 解説と規準の式1であり、右式は代表的な無記憶系(要素間が独立している)放射能の減衰を示す式である。


ところが、このMTBFの数字が140万時間(ざっと160年)とかであったとしたら、そのようなパーツ(例えばHDD)はざっと160年間壊れない(寿命が160年)といえるだろうか?

 例題 > 平均故障間隔100万時間のHDDは「114年故障しない」?:ITpro


このような用語は誤解を招きやすい。
言葉を換えて、この用語を説明すると次のような説明になる。

パーツでなく、人間の寿命で考察してみよう。

今、15歳の人間が病死に至る確率が、0.05%とする。
つまり、1万人の15歳の人間のうち、1年間に5人が病死する。
この15歳の人間集団の平均病死間隔は、一万人×1年間÷5人 = 2000年となる。
(この式は、MTBFの算出方法に準じている)

さて、この15歳の人間集団の平均寿命を2000年と表現したら、その表現は正しのだろうか?
(当然答えはNOだ。 どんなに優秀な遺伝子と医療技術であっても100年生きる人は増やせるが、2000年生きる人は増やせない)


この説明の矛盾は、15歳の健康な集団が一年間に病死する可能性が非常に低い ── パーツであるなら故障確率が低い ── であろうとも、いい加減使ったらがたがたと壊れだすということだ。
(RAIDを組んだ複数のHDDで一台壊れたら、ホットスワップかけている最中に別のHDDまで壊れたという話は、悪魔のような不幸な偶然ではなくいわば必然なのだ)


と、いう話を、以前追記させてもらった平均寿命の記事に組み入れたいのだが、どうもまだまとまりが悪い。。。 < 力量不足の知識不足
なので備忘録にめもっておこう。
記憶(歴史)のある系とは、一定期間が経過すると(時間の経過がその身に刻まれていると)残存寿命が変化するようなものに該当する。 ここではお隣の寿命と相関関係が存在することになる。
それに対して記憶のない系とは、放射性同位元素の壊変現象のように確率が一定であるという共通項だけで、お隣の核との相関関係もない独立事象であり、それまでの経過時間蓄積とも無関係な場合である。

この両者は形式的には同一でありながら、内容は異なるものだと思う。

個人的には、HDDの故障を心配する(寿命を考える)ってのは、異音がしはじめた頃だと思っているのだが。。。
(過去に、クラッシュ寸前=ぎぃぎぃ喚いてエラー続出 てなったHDDが、バックアップ作業をして、そのまま連続回転させ続けたら静音化して復活した経験もあったりするが・・・普通はクラッシュして昇天状態に至ってジ・エンドだ)



post at 2009.02/18
last edit at 2009.02/20

決定論的な限界が自明な、有限な寿命。 そして、確率論でしか論じられない、(非常に低い確率であるが少数は)無限に続く寿命。 このふたつをひとつに論じるには、完全な積分を得て比較するしかない。

HDDであれば、多数の実際に壊れるまで長時間運転し続けて算出するのが無理なので、膨大な要素を計算で算出した数字が「MTBF=140万時間」である。 乱暴に言えば、140万台のHDDを動かし続け、1時間に1台ずつ壊れたなら、そのHDDの信頼性は140万時間であると称していられるのだ。

いわばこれは、(限定された時間で変化を調べた)微分的な観察により算出されたものだ。
 ※ いうまでもないが、実際の表示スペックなんてパーツ公称値の掛け合わせにすぎない。
  (だから、パーツ点数が減少すると、飛躍的に信頼性の数値は向上する)

これを完全な積分的な観察により算出するとどうなるだろうか。
 140万台のHDDを一斉に延々と動かし続けたとすると・・・最初のうちこそ1時間に1台の故障だが、やがてどんどん壊れてゆくのは自明である。 (ちなみに計算式通りに壊れる確率が一定なら、母数が減少すると壊れる台数はどんどん疎らになってゆくはずだ。 現実と計算はこのように乖離する)
 回転軸の磨耗、液体ベアリングの劣化、宇宙線による磁性体のエラー、構造体に存在する放射線同位体の壊変による微少欠陥、落雷や電力線の事故やはたまた核戦争による施設破壊など、「実際に起きるかもしれないこと」は単純計算以上の多様性があるのだ。
 そうしてこのような壊れ方を、片対数グラフに生き延びたHDD数としてプロットすると、見えてくるのが純粋な確率論的減少(直線成分)と、決定論的な急激な減少成分(奈落に落ちるような成分)とであろう。

 ※ 片対数グラフでは、ねずみ算式(複利)の増加も、放射生同位元素の崩壊も、どちらも直線。


ある/ない(壊れる/壊れない)という決定論は2つの状態しかない。
一方、ありそう/なさそう(壊れかかり/大丈夫そう)という加減は確率論の領域だ。
140万台中の一台が壊れる確率と、140万台全てが壊れるのに必要な総運転時間とは、直線的な外挿(単純な延長として考えること)ではつながらない。

シグモイドな曲線は、片対数的な多数の直線の重ね合わせで表すことができるし、正規分布曲線を積分したものはシグモイド曲線とごく近似できるほどに似ている。 < ちょっと危険な類推か ^^;


壊れそうで壊れなかったり、壊れそうもないのに突然に壊れたり、現実の世界では表面上そのように見えていることでも、内部の確率分布は一定のクロックをカウントしながら少しずつ着々と壊れていっているというのが実際のところだろう。


そして、それが実感と離れたように思えるならば、ずれてしまっている実感のほうを現実に合わせて変更してゆくのが、本来の保守精神であって革新の気概なのだと思うのだ。

 現実を追認して、法則を修正したり、法律を改正すること。 と、法則や憲法に対する現実のブレを制御し規律を持たせること。 とは、相反することではなく相補的なことであり、表裏一体のもの。


私の決まり文句(ばくの一つ覚え)風にまとめると、そういうことなのであった。
[PR]
by bucmacoto | 2009-02-18 01:25 | quote/data
<< 対極という対比 ふり・つもり(夢想狂騒詩) >>
<< 対極という対比 ふり・つもり(夢想狂騒詩) >>