三菱UFJニコスは、2017年末に発生したシステム障害の原因や影響範囲などについて発表した。
同社のクレジットカード「NICOSカード」の基幹システムで、ハードディスク(HDD)が3個故障したのが原因だ。2018年1月末時点で一部の会員に対する請求が遅れているなど、事態を収束しきれていない。
マスターデータから中間加工ファイルを作成するバッチ処理のシステムでHDDが故障し、障害が発生した。三菱UFJニコスによれば、HDD15個で一連の機能を果たしており、そのうち3個が同時に故障した。「2個までの同時障害は自動復旧可能な仕組みを設けていたが、3個の故障は想定外だった」(広報)。同社はシステムやHDDの開発企業を明らかにしていないものの、「発生確率は極めて低いとの報告を受けている」という。
故障したHDDは、障害が発生した2017年12月26日中に交換したが、利用会員の売上データ処理などに遅れが発生した。一部の利用会員に2重請求が発生したほか、請求が遅れるなどの事態につながった。同社はシステム機器の監視体制を強化するなどして対策を講じるという。
http://itpro.nikkeibp.co.jp/atcl/news/17/020803126/
2:名刺は切らしておりまして 2018/02/09(金) 00:04:02.26 ID:MuvQ5bpV.net
んなわけあるカー位
3:名刺は切らしておりまして 2018/02/09(金) 00:08:30.64 ID:YRy8EdRe.net
はいはい、想定外想定外
5:名刺は切らしておりまして 2018/02/09(金) 00:11:06.70 ID:89JTlr1N.net
3個壊れた事が原因じゃなくて、3個同時に壊した何か外的要因を見付けないと再発するんじゃ…
6:名刺は切らしておりまして 2018/02/09(金) 00:13:16.40 ID:MuvQ5bpV.net
どうせ二個まで大丈夫だから放置してたんだろ
7:名刺は切らしておりまして 2018/02/09(金) 00:15:32.33 ID:PO0Yufgv.net
HDDが3個同時に ね。
電源だろ。
8:名刺は切らしておりまして 2018/02/09(金) 00:16:33.84 ID:IXeb3oF/.net
ガチで壊れることもあるとか想像できんのかここの馬鹿は
23:名刺は切らしておりまして 2018/02/09(金) 00:46:32.24 ID:eAXN28r5.net
何処製だよww
24:名刺は切らしておりまして 2018/02/09(金) 00:50:09.46 ID:ZWtBa8P8.net
どうせバラ○ーダやろw
114:名刺は切らしておりまして 2018/02/09(金) 11:08:49.14 ID:dMuSUXZt.net
同じラインで製造されたものはだいたい同じ時期に逝くんだよね。
まぁSamsungかseagateだわな。
21:名刺は切らしておりまして 2018/02/09(金) 00:38:44.67 ID:RmQKJzpz.net
RAID組んでたHDDが2台同時に逝った事はあったわ。
HDDに、データ転送量が一定量に達すると使用不能になる致命的なバグがあった。
Seagateめ…
4:名刺は切らしておりまして 2018/02/09(金) 00:10:18.24 ID:bCihkpO0.net
糞寒い時期なのに珍しいな
15:名刺は切らしておりまして 2018/02/09(金) 00:25:16.00 ID:LJNXpp/8.net
「同時に」ってのがどのくらいかだよなあ
例えば1週間かけて壊れたなら、監視体制が完全に悪い
本当に1秒の狂いもなく同時に壊れたなら、外的要因だからそれを解決しないといかん
偶然では済まされない話
19:名刺は切らしておりまして 2018/02/09(金) 00:28:39.07 ID:YCtvFpAO.net
ハード的には15HDDで2台故障を許容というのは、
まあNICOS程度の重要性ならいいかなって思うけど、
>一部の利用会員に2重請求が発生したほか、
これはダメっしょ。
ジャーナルとかシステムの欠陥臭い。
それから3台壊れたのも特定の原因が無いか調べた方がいいね。
本当に偶発かどうか。
HDDに負担の大きい周波数の振動が伝わってないかとかだけど。
28:名刺は切らしておりまして 2018/02/09(金) 00:54:38.87 ID:c43aajtC.net
3個でシステム障害ってRAID6か何かかしら
SOHOとか小規模オフィスレベルの冗長性だのう
9:名刺は切らしておりまして 2018/02/09(金) 00:17:01.41 ID:D6pSMtRT.net
ミラーとかいろいろな障害対応機器にしてないのか?
故障率減らす対策
29:名刺は切らしておりまして 2018/02/09(金) 00:58:05.28 ID:Dk9PEcFI.net
>>1
なか~ま
俺もバックアップ含めて3つの同時に飛んだ
物理的にぶっ壊れてだからしょうがないけどね
でも企業がこれはだらしないね
57:名刺は切らしておりまして 2018/02/09(金) 03:23:05.06 ID:vO6jAkdx.net
ユーチューバーと大差ないストレージ環境でカード会社を運営してるのだろうか?
59:名刺は切らしておりまして 2018/02/09(金) 04:15:16.50 ID:Zneo5ew7.net
個人でもHDD15台って運用している奴いそうなのに、何だろな
22:名刺は切らしておりまして 2018/02/09(金) 00:45:07.50 ID:VB+2KkqN.net
15個くらいSSDに替えろや
47:名刺は切らしておりまして 2018/02/09(金) 01:55:42.25 ID:d5tEVVuW.net
ここ、予算カツカツだったからなぁ
32:名刺は切らしておりまして 2018/02/09(金) 01:12:30.62 ID:cdTJEH2l.net
昔似たようなことを経験したなぁ。
実際には HDD は故障していないにもかかわらず RAID カードが故障と
みなしてちょいちょい HDD が故障が頻発、データロストしてくれましたよ。
たまたま別サーバ増設時に再発して、新規サーバの RAID カードに
交換してみたら直って原因が発覚したが。
37:名刺は切らしておりまして 2018/02/09(金) 01:23:53.43 ID:EuIVe8xz.net
同じロットのHDDは同じタイミングで壊れる。何台並列にしていても無意味
33:名刺は切らしておりまして 2018/02/09(金) 01:16:40.15 ID:YCtvFpAO.net
新品で導入すると、
HDDで最初の1台が故障すると、短期間のうちの次々と故障することがよくある。
まあ当たり前なんだけどね。
最初の1台故障でHDD全台入替でもいい気がする。
38:名刺は切らしておりまして 2018/02/09(金) 01:24:51.98 ID:OsyEZxqj.net
これがリスク分散の現実
42:名刺は切らしておりまして 2018/02/09(金) 01:43:19.27 ID:WmwrP9Ne.net
だから同一メーカーの同時期導入は辞めろと
66:名刺は切らしておりまして 2018/02/09(金) 04:43:30.08 ID:pEDaao/A.net
RAID6か
2台壊れてリビルド中になんてことも割とある
同じモデルや近いロット使うから時期はかぶりやすいよな
68:名刺は切らしておりまして 2018/02/09(金) 04:46:51.27 ID:e+e2LsnU.net
RAID6だね。こんな良く壊れるものを使ったら事故って当然だろう
RAIDは5とか6とかは設計に欠陥があるから使ったらダメって誰も指摘しなかったんだろうかねー
RAIDで使っていいのは、0+1だけだよ
ホットスタンバイとかバッテリバックアップのRAIDとか全てにおいてRAIDは使わない方がいい
常に3台に同じものを格納しておくのが今の普通のやり方
75:名刺は切らしておりまして 2018/02/09(金) 07:50:50.27 ID:0rtnAglA.net
三個同時・・・
三菱・・・
134:名刺は切らしておりまして 2018/02/09(金) 12:18:07.28 ID:Vg2luB4D.net
>>75
ニクいねw
64:名刺は切らしておりまして 2018/02/09(金) 04:37:10.24 ID:Zqh//k6c.net
流石クレカ業界のみずほと言うべきか
93:名刺は切らしておりまして 2018/02/09(金) 09:09:41.99 ID:GozRh4PW.net
「故障は2個までOK、3個だめ」ニコス
48:名刺は切らしておりまして 2018/02/09(金) 01:58:04.16 ID:Pn2t714y.net
これはしょうがない気もするんだが、続報ほしい
79:名刺は切らしておりまして 2018/02/09(金) 07:57:30.02 ID:qTUjRNi0.net
意外とショボいハード構成なんだな
78:名刺は切らしておりまして 2018/02/09(金) 07:56:21.11 ID:P8wsW8vw.net
どうせ海門だろうw
81:名刺は切らしておりまして 2018/02/09(金) 08:17:05.03 ID:mIK2jUK5.net
もともと2台壊れていて、修理する前に3台目が逝ったんだろう?
保守がしょぼい部署はだいたいこれ。
82:名刺は切らしておりまして 2018/02/09(金) 08:33:45.22 ID:Dcz3C0qs.net
>>81
うがった見方をすれば、メーカーを明かさないのはその辺が理由かな。
でも3発同時故障が無いとも限らないし、原因解析・解明結果で役に立つ情報は公開してほしい。
129:名刺は切らしておりまして 2018/02/09(金) 12:09:33.15 ID:XQfqspgl.net
>>81
保守がショボい場合どこの保守に責任があるかって話もあるからなあ
・保守監視設計が悪い→担当したベンダが悪い
・保守運用が無視してた→担当した会社(発注元のシステム部門or保守担当ベンダ)が悪い
・検出後の対応を怠った→担当した会社(発注元のシステム部門or保守担当ベンダ)が悪い
104:名刺は切らしておりまして 2018/02/09(金) 10:16:09.05 ID:mDFy6xz7.net
RAID0だったら笑うがさすがにそれはないな
105:名刺は切らしておりまして 2018/02/09(金) 10:30:33.72 ID:PhEkoBQz.net
三基同時トラブルってどういう天文学的数字だよ
負荷が半端なかったのかな
実はリビルト失敗だったりして
112:名刺は切らしておりまして 2018/02/09(金) 11:07:08.11 ID:VPL9J3is.n