三菱UFJニコスは、2017年末に発生したシステム障害の原因や影響範囲などについて発表した。

同社のクレジットカード「NICOSカード」の基幹システムで、ハードディスク(HDD)が3個故障したのが原因だ。2018年1月末時点で一部の会員に対する請求が遅れているなど、事態を収束しきれていない。

マスターデータから中間加工ファイルを作成するバッチ処理のシステムでHDDが故障し、障害が発生した。三菱UFJニコスによれば、HDD15個で一連の機能を果たしており、そのうち3個が同時に故障した。「2個までの同時障害は自動復旧可能な仕組みを設けていたが、3個の故障は想定外だった」(広報)。同社はシステムやHDDの開発企業を明らかにしていないものの、「発生確率は極めて低いとの報告を受けている」という。

故障したHDDは、障害が発生した2017年12月26日中に交換したが、利用会員の売上データ処理などに遅れが発生した。一部の利用会員に2重請求が発生したほか、請求が遅れるなどの事態につながった。同社はシステム機器の監視体制を強化するなどして対策を講じるという。


http://itpro.nikkeibp.co.jp/atcl/news/17/020803126/



2:名刺は切らしておりまして 2018/02/09(金) 00:04:02.26 ID:MuvQ5bpV.net

んなわけあるカー位

3:名刺は切らしておりまして 2018/02/09(金) 00:08:30.64 ID:YRy8EdRe.net

はいはい、想定外想定外

5:名刺は切らしておりまして 2018/02/09(金) 00:11:06.70 ID:89JTlr1N.net

3個壊れた事が原因じゃなくて、3個同時に壊した何か外的要因を見付けないと再発するんじゃ…

6:名刺は切らしておりまして 2018/02/09(金) 00:13:16.40 ID:MuvQ5bpV.net

どうせ二個まで大丈夫だから放置してたんだろ

7:名刺は切らしておりまして 2018/02/09(金) 00:15:32.33 ID:PO0Yufgv.net

HDDが3個同時に  ね。
電源だろ。

8:名刺は切らしておりまして 2018/02/09(金) 00:16:33.84 ID:IXeb3oF/.net

ガチで壊れることもあるとか想像できんのかここの馬鹿は

23:名刺は切らしておりまして 2018/02/09(金) 00:46:32.24 ID:eAXN28r5.net

何処製だよww

24:名刺は切らしておりまして 2018/02/09(金) 00:50:09.46 ID:ZWtBa8P8.net

どうせバラ○ーダやろw

114:名刺は切らしておりまして 2018/02/09(金) 11:08:49.14 ID:dMuSUXZt.net

同じラインで製造されたものはだいたい同じ時期に逝くんだよね。
まぁSamsungかseagateだわな。

21:名刺は切らしておりまして 2018/02/09(金) 00:38:44.67 ID:RmQKJzpz.net

RAID組んでたHDDが2台同時に逝った事はあったわ。
HDDに、データ転送量が一定量に達すると使用不能になる致命的なバグがあった。

Seagateめ…

4:名刺は切らしておりまして 2018/02/09(金) 00:10:18.24 ID:bCihkpO0.net

糞寒い時期なのに珍しいな

15:名刺は切らしておりまして 2018/02/09(金) 00:25:16.00 ID:LJNXpp/8.net

「同時に」ってのがどのくらいかだよなあ
例えば1週間かけて壊れたなら、監視体制が完全に悪い
本当に1秒の狂いもなく同時に壊れたなら、外的要因だからそれを解決しないといかん

偶然では済まされない話

19:名刺は切らしておりまして 2018/02/09(金) 00:28:39.07 ID:YCtvFpAO.net

ハード的には15HDDで2台故障を許容というのは、
まあNICOS程度の重要性ならいいかなって思うけど、

>一部の利用会員に2重請求が発生したほか、

これはダメっしょ。


ジャーナルとかシステムの欠陥臭い。

それから3台壊れたのも特定の原因が無いか調べた方がいいね。


本当に偶発かどうか。
HDDに負担の大きい周波数の振動が伝わってないかとかだけど。

28:名刺は切らしておりまして 2018/02/09(金) 00:54:38.87 ID:c43aajtC.net

3個でシステム障害ってRAID6か何かかしら
SOHOとか小規模オフィスレベルの冗長性だのう

9:名刺は切らしておりまして 2018/02/09(金) 00:17:01.41 ID:D6pSMtRT.net

ミラーとかいろいろな障害対応機器にしてないのか?
故障率減らす対策

29:名刺は切らしておりまして 2018/02/09(金) 00:58:05.28 ID:Dk9PEcFI.net

>>1
なか~ま
俺もバックアップ含めて3つの同時に飛んだ
物理的にぶっ壊れてだからしょうがないけどね

でも企業がこれはだらしないね

57:名刺は切らしておりまして 2018/02/09(金) 03:23:05.06 ID:vO6jAkdx.net

ユーチューバーと大差ないストレージ環境でカード会社を運営してるのだろうか?

59:名刺は切らしておりまして 2018/02/09(金) 04:15:16.50 ID:Zneo5ew7.net

個人でもHDD15台って運用している奴いそうなのに、何だろな

22:名刺は切らしておりまして 2018/02/09(金) 00:45:07.50 ID:VB+2KkqN.net

15個くらいSSDに替えろや

47:名刺は切らしておりまして 2018/02/09(金) 01:55:42.25 ID:d5tEVVuW.net

ここ、予算カツカツだったからなぁ

32:名刺は切らしておりまして 2018/02/09(金) 01:12:30.62 ID:cdTJEH2l.net

昔似たようなことを経験したなぁ。
実際には HDD は故障していないにもかかわらず RAID カードが故障と
みなしてちょいちょい HDD が故障が頻発、データロストしてくれましたよ。
たまたま別サーバ増設時に再発して、新規サーバの RAID カードに
交換してみたら直って原因が発覚したが。

37:名刺は切らしておりまして 2018/02/09(金) 01:23:53.43 ID:EuIVe8xz.net

同じロットのHDDは同じタイミングで壊れる。何台並列にしていても無意味

33:名刺は切らしておりまして 2018/02/09(金) 01:16:40.15 ID:YCtvFpAO.net

新品で導入すると、

HDDで最初の1台が故障すると、短期間のうちの次々と故障することがよくある。


まあ当たり前なんだけどね。

最初の1台故障でHDD全台入替でもいい気がする。

38:名刺は切らしておりまして 2018/02/09(金) 01:24:51.98 ID:OsyEZxqj.net

これがリスク分散の現実

42:名刺は切らしておりまして 2018/02/09(金) 01:43:19.27 ID:WmwrP9Ne.net

だから同一メーカーの同時期導入は辞めろと

66:名刺は切らしておりまして 2018/02/09(金) 04:43:30.08 ID:pEDaao/A.net

RAID6か
2台壊れてリビルド中になんてことも割とある
同じモデルや近いロット使うから時期はかぶりやすいよな

68:名刺は切らしておりまして 2018/02/09(金) 04:46:51.27 ID:e+e2LsnU.net

RAID6だね。こんな良く壊れるものを使ったら事故って当然だろう
RAIDは5とか6とかは設計に欠陥があるから使ったらダメって誰も指摘しなかったんだろうかねー

RAIDで使っていいのは、0+1だけだよ


ホットスタンバイとかバッテリバックアップのRAIDとか全てにおいてRAIDは使わない方がいい
常に3台に同じものを格納しておくのが今の普通のやり方

75:名刺は切らしておりまして 2018/02/09(金) 07:50:50.27 ID:0rtnAglA.net

三個同時・・・
三菱・・・

134:名刺は切らしておりまして 2018/02/09(金) 12:18:07.28 ID:Vg2luB4D.net

>>75
ニクいねw

64:名刺は切らしておりまして 2018/02/09(金) 04:37:10.24 ID:Zqh//k6c.net

流石クレカ業界のみずほと言うべきか

93:名刺は切らしておりまして 2018/02/09(金) 09:09:41.99 ID:GozRh4PW.net

「故障は2個までOK、3個だめ」ニコス

48:名刺は切らしておりまして 2018/02/09(金) 01:58:04.16 ID:Pn2t714y.net

これはしょうがない気もするんだが、続報ほしい

79:名刺は切らしておりまして 2018/02/09(金) 07:57:30.02 ID:qTUjRNi0.net

意外とショボいハード構成なんだな

78:名刺は切らしておりまして 2018/02/09(金) 07:56:21.11 ID:P8wsW8vw.net

どうせ海門だろうw

81:名刺は切らしておりまして 2018/02/09(金) 08:17:05.03 ID:mIK2jUK5.net

もともと2台壊れていて、修理する前に3台目が逝ったんだろう?
保守がしょぼい部署はだいたいこれ。

82:名刺は切らしておりまして 2018/02/09(金) 08:33:45.22 ID:Dcz3C0qs.net

>>81
うがった見方をすれば、メーカーを明かさないのはその辺が理由かな。

でも3発同時故障が無いとも限らないし、原因解析・解明結果で役に立つ情報は公開してほしい。

129:名刺は切らしておりまして 2018/02/09(金) 12:09:33.15 ID:XQfqspgl.net

>>81
保守がショボい場合どこの保守に責任があるかって話もあるからなあ
・保守監視設計が悪い→担当したベンダが悪い
・保守運用が無視してた→担当した会社(発注元のシステム部門or保守担当ベンダ)が悪い
・検出後の対応を怠った→担当した会社(発注元のシステム部門or保守担当ベンダ)が悪い

104:名刺は切らしておりまして 2018/02/09(金) 10:16:09.05 ID:mDFy6xz7.net

RAID0だったら笑うがさすがにそれはないな

105:名刺は切らしておりまして 2018/02/09(金) 10:30:33.72 ID:PhEkoBQz.net

三基同時トラブルってどういう天文学的数字だよ
負荷が半端なかったのかな
実はリビルト失敗だったりして

112:名刺は切らしておりまして 2018/02/09(金) 11:07:08.11 ID:VPL9J3is.n